基于深度學(xué)習(xí)的空中紅外目標(biāo)檢測方法研究
發(fā)布時間:2021-01-10 19:24
近年來,隨著多種多樣、功能豐富的飛行器不斷涌現(xiàn),由其帶來的安全和隱私方面的隱患也越來越得到重視。因此,開發(fā)針對空中目標(biāo)的重點區(qū)域防護(hù)系統(tǒng)十分必要,而目標(biāo)檢測是該系統(tǒng)的重要組成部分。目標(biāo)檢測技術(shù)是計算機(jī)視覺領(lǐng)域的基礎(chǔ)課題之一,同時也是一個熱點,具有非常廣闊的應(yīng)用市場。如今,由于在圖像分類研究領(lǐng)域廣泛應(yīng)用深度學(xué)習(xí)方法,促使目標(biāo)檢測技術(shù)取得了顯著發(fā)展。但是,目前大多數(shù)基于深度學(xué)習(xí)的目標(biāo)檢測技術(shù)是針對可見光成像技術(shù)的,而針對紅外成像技術(shù)的研究卻很少。本研究希望通過應(yīng)用深度學(xué)習(xí)技術(shù)為空中紅外目標(biāo)檢測識別提供高效可行的解決思路與方案。相比其他目標(biāo),空中紅外目標(biāo)所處的空域背景較為簡單平緩,而且目標(biāo)成像較小,圖像對比性較差、邊緣模糊。準(zhǔn)確、快速、可靠地檢測到,并提取出空中紅外目標(biāo),為后續(xù)處理贏得時間,是當(dāng)前迫切需要解決的問題。本研究以空中目標(biāo)的紅外圖像、高程-輻射強(qiáng)度信息等為數(shù)據(jù)源,提出了一種新型的基于深度學(xué)習(xí)的空中紅外目標(biāo)檢測方法,提高了檢測速度和精度,更好地滿足了檢測任務(wù)的需求。本文的主要研究內(nèi)容歸納如下:(1)介紹了卷積神經(jīng)網(wǎng)絡(luò)的數(shù)學(xué)原理及當(dāng)前主要的目標(biāo)檢測方法;對比地學(xué)習(xí)了眾多經(jīng)典的深度學(xué)習(xí)目...
【文章來源】:中國科學(xué)院大學(xué)(中國科學(xué)院長春光學(xué)精密機(jī)械與物理研究所)吉林省
【文章頁數(shù)】:69 頁
【學(xué)位級別】:碩士
【部分圖文】:
RCNN的計算流程
基于深度學(xué)習(xí)的空中紅外目標(biāo)檢測方法研究4針對R-CNN模型運(yùn)行速度慢和必須輸入固定尺度圖像等問題,He等人提出了空間金字塔池化(Spatialpyramidpooling,SPP)模型SPP-Net[16]。隨后Girshick等人[12]對R-CNN和SPP-net兩種模型進(jìn)行了總結(jié)并改進(jìn),取其精華去其糟粕,提出了FastR-CNN模型。FastR-CNN模型是一種既應(yīng)用了區(qū)域建議又能夠邊框回歸的聯(lián)合訓(xùn)練模型。近年來,Redmon等人[17]另辟蹊徑從無區(qū)域建議方式著手,提出了一種新型的目標(biāo)檢測方法,稱之為YOLO(Youonlylookonce)。YOLO模型不再使用選擇搜索算法尋找候選區(qū)域,而是采用了空間限制的方式,這一改動大大減少了對同一目標(biāo)的重復(fù)檢測,使得模型檢測效率顯著提高,能夠?qū)崿F(xiàn)動態(tài)目標(biāo)實時檢測。但是,同基于候選區(qū)域的模型相比,YOLO模型的定位準(zhǔn)確率低,并且召回率不高。針對第一代YOLO模型檢測精度較低的問題,Liu等人[18]提出了既擁有較高的平均檢測精度,又兼顧實時性的SSD模型。與第一代YOLO模型相比,SSD模型對于小尺寸圖像和小目標(biāo)的檢測,效果比較好,輸入VOC2007測試,圖像平均檢測精度能夠達(dá)到75.1%以上。另一方面,Redmon等人[19]在第一代YOLO模型的基礎(chǔ)上,構(gòu)建了YOLOv2,該模型在保持分類準(zhǔn)確率的同時,提高了召回率和定位準(zhǔn)確度。2017年,YOLO家族的第三代模型YOLOv3問世。YOLOv3模型使用Darknet-53提取圖像特征,再使用YOLO層進(jìn)行多尺度預(yù)測,是YOLO系列集大成者。圖1-2SSD網(wǎng)絡(luò)結(jié)構(gòu)圖Figure1-2SSDnetworkstructure1.2.2紅外目標(biāo)檢測的發(fā)展現(xiàn)狀一切溫度在絕對零度以上的物體都會向外界輻射紅外線,紅外線譜段介于微波和可見光之間,它的波長為1mm到760nm,人們無法用肉眼觀測到紅外線。
基于深度學(xué)習(xí)的空中紅外目標(biāo)檢測方法研究8領(lǐng)域和計算機(jī)視覺應(yīng)用中的研究熱點,并已成功地應(yīng)用于自然語言處理分析及圖像的檢測與識別等方面。神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)如下圖所示(圖2.1):圖2-1神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖Figure2-1Neuralnetworkstructure深度卷積神經(jīng)網(wǎng)絡(luò)(ConvolutionalNeuralNetwork,CNN)是當(dāng)今深度學(xué)習(xí)研究的主流方向。該網(wǎng)絡(luò)結(jié)構(gòu)具有多個網(wǎng)絡(luò)層,其中先前幾個網(wǎng)絡(luò)層是由卷積層(convolutionlayer)和池化層(poolinglayer)交替組成的,而網(wǎng)絡(luò)結(jié)構(gòu)的后端全部設(shè)置為全連接層。這種多層結(jié)構(gòu)的設(shè)置能夠發(fā)現(xiàn)數(shù)據(jù)間的深層聯(lián)系,便于提取到事物深層的特征信息,從而使得模型對事物的描述更加準(zhǔn)確,表征能力遠(yuǎn)超傳統(tǒng)機(jī)器學(xué)習(xí)方法。CNN模型的工作原理為:首先輸入數(shù)據(jù)經(jīng)過卷積層進(jìn)行卷積運(yùn)算,得到不同特征信息,然后進(jìn)入池化層進(jìn)行下采樣操作,壓縮特征信息,降低計算復(fù)雜度。多次重復(fù)進(jìn)行卷積、池化操作,CNN模型就能夠自動學(xué)習(xí)出目標(biāo)層次化的特征信息。最后,在網(wǎng)絡(luò)模型后端的全連接層中應(yīng)用以前提取的特征信息,實現(xiàn)有用信息的整合、分類,最終將局部特性信息組裝成完整信息。
本文編號:2969273
【文章來源】:中國科學(xué)院大學(xué)(中國科學(xué)院長春光學(xué)精密機(jī)械與物理研究所)吉林省
【文章頁數(shù)】:69 頁
【學(xué)位級別】:碩士
【部分圖文】:
RCNN的計算流程
基于深度學(xué)習(xí)的空中紅外目標(biāo)檢測方法研究4針對R-CNN模型運(yùn)行速度慢和必須輸入固定尺度圖像等問題,He等人提出了空間金字塔池化(Spatialpyramidpooling,SPP)模型SPP-Net[16]。隨后Girshick等人[12]對R-CNN和SPP-net兩種模型進(jìn)行了總結(jié)并改進(jìn),取其精華去其糟粕,提出了FastR-CNN模型。FastR-CNN模型是一種既應(yīng)用了區(qū)域建議又能夠邊框回歸的聯(lián)合訓(xùn)練模型。近年來,Redmon等人[17]另辟蹊徑從無區(qū)域建議方式著手,提出了一種新型的目標(biāo)檢測方法,稱之為YOLO(Youonlylookonce)。YOLO模型不再使用選擇搜索算法尋找候選區(qū)域,而是采用了空間限制的方式,這一改動大大減少了對同一目標(biāo)的重復(fù)檢測,使得模型檢測效率顯著提高,能夠?qū)崿F(xiàn)動態(tài)目標(biāo)實時檢測。但是,同基于候選區(qū)域的模型相比,YOLO模型的定位準(zhǔn)確率低,并且召回率不高。針對第一代YOLO模型檢測精度較低的問題,Liu等人[18]提出了既擁有較高的平均檢測精度,又兼顧實時性的SSD模型。與第一代YOLO模型相比,SSD模型對于小尺寸圖像和小目標(biāo)的檢測,效果比較好,輸入VOC2007測試,圖像平均檢測精度能夠達(dá)到75.1%以上。另一方面,Redmon等人[19]在第一代YOLO模型的基礎(chǔ)上,構(gòu)建了YOLOv2,該模型在保持分類準(zhǔn)確率的同時,提高了召回率和定位準(zhǔn)確度。2017年,YOLO家族的第三代模型YOLOv3問世。YOLOv3模型使用Darknet-53提取圖像特征,再使用YOLO層進(jìn)行多尺度預(yù)測,是YOLO系列集大成者。圖1-2SSD網(wǎng)絡(luò)結(jié)構(gòu)圖Figure1-2SSDnetworkstructure1.2.2紅外目標(biāo)檢測的發(fā)展現(xiàn)狀一切溫度在絕對零度以上的物體都會向外界輻射紅外線,紅外線譜段介于微波和可見光之間,它的波長為1mm到760nm,人們無法用肉眼觀測到紅外線。
基于深度學(xué)習(xí)的空中紅外目標(biāo)檢測方法研究8領(lǐng)域和計算機(jī)視覺應(yīng)用中的研究熱點,并已成功地應(yīng)用于自然語言處理分析及圖像的檢測與識別等方面。神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)如下圖所示(圖2.1):圖2-1神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖Figure2-1Neuralnetworkstructure深度卷積神經(jīng)網(wǎng)絡(luò)(ConvolutionalNeuralNetwork,CNN)是當(dāng)今深度學(xué)習(xí)研究的主流方向。該網(wǎng)絡(luò)結(jié)構(gòu)具有多個網(wǎng)絡(luò)層,其中先前幾個網(wǎng)絡(luò)層是由卷積層(convolutionlayer)和池化層(poolinglayer)交替組成的,而網(wǎng)絡(luò)結(jié)構(gòu)的后端全部設(shè)置為全連接層。這種多層結(jié)構(gòu)的設(shè)置能夠發(fā)現(xiàn)數(shù)據(jù)間的深層聯(lián)系,便于提取到事物深層的特征信息,從而使得模型對事物的描述更加準(zhǔn)確,表征能力遠(yuǎn)超傳統(tǒng)機(jī)器學(xué)習(xí)方法。CNN模型的工作原理為:首先輸入數(shù)據(jù)經(jīng)過卷積層進(jìn)行卷積運(yùn)算,得到不同特征信息,然后進(jìn)入池化層進(jìn)行下采樣操作,壓縮特征信息,降低計算復(fù)雜度。多次重復(fù)進(jìn)行卷積、池化操作,CNN模型就能夠自動學(xué)習(xí)出目標(biāo)層次化的特征信息。最后,在網(wǎng)絡(luò)模型后端的全連接層中應(yīng)用以前提取的特征信息,實現(xiàn)有用信息的整合、分類,最終將局部特性信息組裝成完整信息。
本文編號:2969273
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/2969273.html
最近更新
教材專著