基于改進(jìn)卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測(cè)研究
發(fā)布時(shí)間:2021-01-24 04:57
目標(biāo)檢測(cè)是很多計(jì)算機(jī)視覺(jué)任務(wù)的基礎(chǔ),關(guān)于它的研究對(duì)智能交通、智能監(jiān)控、軍事制導(dǎo)以及醫(yī)學(xué)手術(shù)等領(lǐng)域的發(fā)展有著極其重要的作用。早期的目標(biāo)檢測(cè)算法大多都是基于手工設(shè)計(jì)的特征基礎(chǔ)之上的,無(wú)法有效的表示圖像特征。近年來(lái),由于卷積神經(jīng)網(wǎng)絡(luò)(Convolution Neural Network,CNN)的提出,有效地克服了傳統(tǒng)圖像目標(biāo)檢測(cè)方法的局限性,已經(jīng)成為目標(biāo)檢測(cè)研究領(lǐng)域的熱點(diǎn)。該文基于對(duì)目標(biāo)檢測(cè)技術(shù)的國(guó)內(nèi)外研究現(xiàn)狀及現(xiàn)有算法的認(rèn)真分析,結(jié)合CNN相關(guān)的研究理論,在經(jīng)典目標(biāo)檢測(cè)框架基礎(chǔ)上,提出了一些改進(jìn)策略,論文主要工作包括:(1)針對(duì)經(jīng)典CNN中卷積單元幾何建模能力較差、ReLU(Rectified Linear Unit)激活函數(shù)容易導(dǎo)致神經(jīng)元死亡的問(wèn)題,提出了一種基于自適應(yīng)感受野的DP-SSD(Deformable Parametric Single Shot Multibox Detector)目標(biāo)檢測(cè)方法。該方法在經(jīng)典SSD框架的每一個(gè)池化層后面增加一個(gè)可變形卷積(Deformable Convolution,DC)結(jié)構(gòu),同時(shí)引入?yún)?shù)化線性修正單元PReLU(Parametric Re...
【文章來(lái)源】:長(zhǎng)沙理工大學(xué)湖南省
【文章頁(yè)數(shù)】:65 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2.2積分圖示意圖??
信度。除此之??夕卜,每個(gè)格子還要預(yù)測(cè)一個(gè)條件概率值C,即在該格子存在物體時(shí),該物體屬于某一??類別的概率。YOLO模型的訓(xùn)練分成預(yù)訓(xùn)練和測(cè)試模型訓(xùn)練。預(yù)訓(xùn)練階段使用ImageNet??1000-class數(shù)據(jù)集_進(jìn)行,主要訓(xùn)練前20個(gè)卷積層、1個(gè)均值池化層以及1個(gè)全連接??層;測(cè)試模型訓(xùn)練時(shí),向預(yù)訓(xùn)練模型中加入了4個(gè)卷積層和兩層全連接層,在預(yù)訓(xùn)練??中獲得的前20個(gè)卷積層網(wǎng)絡(luò)參數(shù)用于初始化YOLO模型的前20個(gè)卷積層的網(wǎng)絡(luò)參??數(shù),然后使用PASCAL?VOC數(shù)據(jù)集[53進(jìn)行訓(xùn)練。圖2.5為YOLO模型檢測(cè)實(shí)例圖。??bounding?boxs,??圖2.5?YOLO模型檢測(cè)實(shí)例圖??如圖2.5所示,YOLO模型在檢測(cè)時(shí)首先把輸入圖像分為了?7x7的網(wǎng)格,每一個(gè)??14??
上的兩個(gè)邊界框的重疊度,取兩者重疊度最大的邊界框?yàn)槟繕?biāo)的位置??框。YOLO模型簡(jiǎn)化了目標(biāo)檢測(cè)流程,使得檢測(cè)速度大幅度提升且可以利用全局信息??進(jìn)行預(yù)測(cè),降低了背景誤檢率,但是也存在一些不足。例如,若有兩個(gè)目標(biāo)的中心同??時(shí)落入到一個(gè)網(wǎng)格中,由于YOLO中的每一個(gè)網(wǎng)格只負(fù)責(zé)預(yù)測(cè)一種目標(biāo),則模型只能??檢測(cè)出其中一種物體,所以該方法在檢測(cè)較小尺寸的目標(biāo)時(shí)檢測(cè)的效果并不太理想。??針對(duì)第一版YOLO模型存在的問(wèn)題,研究者們積極探索,后面又陸續(xù)推出了?Y〇L0v2、??Y0L0v3等版本。圖2.6為部分目標(biāo)檢測(cè)算法發(fā)展歷程圖,其中,橫坐標(biāo)表示算法提??出年份,縱坐標(biāo)為算法的平均檢測(cè)精度(mAP)?[5化數(shù)據(jù)均是基于PASCAL?VOC數(shù)??據(jù)集。??mAPJ?YOLOv2??Faster?R-CNN?pp^?mAP:?78?6??FPS:?7?mAP:?74.3??mAP:?73.2??Fast?R-CNN??FPs:?0.5??mAP:?70??匪??"^:634???1?1?1?1?)??2008?2015?2016?2017?Year??圖2.6目標(biāo)檢測(cè)算法發(fā)展歷程圖??2.3卷積神經(jīng)網(wǎng)絡(luò)??2.3.1經(jīng)典卷積神經(jīng)網(wǎng)絡(luò)??卷積神經(jīng)網(wǎng)絡(luò)(Convolution?Neural?Network,CNN)是深度學(xué)習(xí)中使用最廣泛的框??架之一,由于其對(duì)圖像數(shù)據(jù)擁有獨(dú)特的處理優(yōu)勢(shì),所以在圖形圖像分類、檢測(cè)等方面??表現(xiàn)非常優(yōu)異。隨著神經(jīng)網(wǎng)絡(luò)快速的發(fā)展,產(chǎn)生了很多經(jīng)典的卷積神經(jīng)網(wǎng)絡(luò),如??ZFNet。担担荩郑牵牵危澹簦欤担丁,GoogleNet以及ResNet等。這些卷積神經(jīng)網(wǎng)絡(luò)在口標(biāo)的檢測(cè)與??
【參考文獻(xiàn)】:
期刊論文
[1]兩層級(jí)聯(lián)卷積神經(jīng)網(wǎng)絡(luò)的人臉檢測(cè)[J]. 張海濤,李美霖,董帥含. 中國(guó)圖象圖形學(xué)報(bào). 2019(02)
[2]Near Infrared Star Centroid Detection by Area Analysis of Multi-Scale Super Pixel Saliency Fusion Map[J]. Xiaohu Yuan,Shaojun Guo,Chunwen Li,Bin Lu,Shuli Lou. Tsinghua Science and Technology. 2019(03)
[3]基于改進(jìn)候選區(qū)域網(wǎng)絡(luò)的紅外飛機(jī)檢測(cè)[J]. 姜曉偉,王春平,付強(qiáng). 激光與紅外. 2019(01)
[4]基于可變形卷積神經(jīng)網(wǎng)絡(luò)的遙感影像密集區(qū)域車輛檢測(cè)方法[J]. 高鑫,李慧,張義,閆夢(mèng)龍,張宗朔,孫顯,孫皓,于泓峰. 電子與信息學(xué)報(bào). 2018(12)
[5]改進(jìn)Softmax分類器的深度卷積神經(jīng)網(wǎng)絡(luò)及其在人臉識(shí)別中的應(yīng)用[J]. 冉鵬,王靈,李昕,劉鵬偉. 上海大學(xué)學(xué)報(bào)(自然科學(xué)版). 2018(03)
[6]改進(jìn)區(qū)域卷積神經(jīng)網(wǎng)絡(luò)的機(jī)場(chǎng)檢測(cè)方法[J]. 朱明明,許悅雷,馬時(shí)平,唐紅,辛鵬,馬紅強(qiáng). 光學(xué)學(xué)報(bào). 2018(07)
[7]應(yīng)用卷積神經(jīng)網(wǎng)絡(luò)與RPN的交通標(biāo)志識(shí)別[J]. 譚臺(tái)哲,盧劍彪,溫捷文,李楚宏,凌偉林. 計(jì)算機(jī)工程與應(yīng)用. 2018(21)
[8]基于深度殘差網(wǎng)絡(luò)的高光譜遙感數(shù)據(jù)霾監(jiān)測(cè)[J]. 陸永帥,李元祥,劉波,劉輝,崔林麗. 光學(xué)學(xué)報(bào). 2017(11)
[9]卷積神經(jīng)網(wǎng)絡(luò)在腦脊液圖像分類上的應(yīng)用[J]. 龔震霆,陳光喜,曹建收. 計(jì)算機(jī)工程與設(shè)計(jì). 2017(04)
[10]深度卷積神經(jīng)網(wǎng)絡(luò)在計(jì)算機(jī)視覺(jué)中的應(yīng)用研究綜述[J]. 盧宏濤,張秦川. 數(shù)據(jù)采集與處理. 2016(01)
本文編號(hào):2996618
【文章來(lái)源】:長(zhǎng)沙理工大學(xué)湖南省
【文章頁(yè)數(shù)】:65 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2.2積分圖示意圖??
信度。除此之??夕卜,每個(gè)格子還要預(yù)測(cè)一個(gè)條件概率值C,即在該格子存在物體時(shí),該物體屬于某一??類別的概率。YOLO模型的訓(xùn)練分成預(yù)訓(xùn)練和測(cè)試模型訓(xùn)練。預(yù)訓(xùn)練階段使用ImageNet??1000-class數(shù)據(jù)集_進(jìn)行,主要訓(xùn)練前20個(gè)卷積層、1個(gè)均值池化層以及1個(gè)全連接??層;測(cè)試模型訓(xùn)練時(shí),向預(yù)訓(xùn)練模型中加入了4個(gè)卷積層和兩層全連接層,在預(yù)訓(xùn)練??中獲得的前20個(gè)卷積層網(wǎng)絡(luò)參數(shù)用于初始化YOLO模型的前20個(gè)卷積層的網(wǎng)絡(luò)參??數(shù),然后使用PASCAL?VOC數(shù)據(jù)集[53進(jìn)行訓(xùn)練。圖2.5為YOLO模型檢測(cè)實(shí)例圖。??bounding?boxs,??圖2.5?YOLO模型檢測(cè)實(shí)例圖??如圖2.5所示,YOLO模型在檢測(cè)時(shí)首先把輸入圖像分為了?7x7的網(wǎng)格,每一個(gè)??14??
上的兩個(gè)邊界框的重疊度,取兩者重疊度最大的邊界框?yàn)槟繕?biāo)的位置??框。YOLO模型簡(jiǎn)化了目標(biāo)檢測(cè)流程,使得檢測(cè)速度大幅度提升且可以利用全局信息??進(jìn)行預(yù)測(cè),降低了背景誤檢率,但是也存在一些不足。例如,若有兩個(gè)目標(biāo)的中心同??時(shí)落入到一個(gè)網(wǎng)格中,由于YOLO中的每一個(gè)網(wǎng)格只負(fù)責(zé)預(yù)測(cè)一種目標(biāo),則模型只能??檢測(cè)出其中一種物體,所以該方法在檢測(cè)較小尺寸的目標(biāo)時(shí)檢測(cè)的效果并不太理想。??針對(duì)第一版YOLO模型存在的問(wèn)題,研究者們積極探索,后面又陸續(xù)推出了?Y〇L0v2、??Y0L0v3等版本。圖2.6為部分目標(biāo)檢測(cè)算法發(fā)展歷程圖,其中,橫坐標(biāo)表示算法提??出年份,縱坐標(biāo)為算法的平均檢測(cè)精度(mAP)?[5化數(shù)據(jù)均是基于PASCAL?VOC數(shù)??據(jù)集。??mAPJ?YOLOv2??Faster?R-CNN?pp^?mAP:?78?6??FPS:?7?mAP:?74.3??mAP:?73.2??Fast?R-CNN??FPs:?0.5??mAP:?70??匪??"^:634???1?1?1?1?)??2008?2015?2016?2017?Year??圖2.6目標(biāo)檢測(cè)算法發(fā)展歷程圖??2.3卷積神經(jīng)網(wǎng)絡(luò)??2.3.1經(jīng)典卷積神經(jīng)網(wǎng)絡(luò)??卷積神經(jīng)網(wǎng)絡(luò)(Convolution?Neural?Network,CNN)是深度學(xué)習(xí)中使用最廣泛的框??架之一,由于其對(duì)圖像數(shù)據(jù)擁有獨(dú)特的處理優(yōu)勢(shì),所以在圖形圖像分類、檢測(cè)等方面??表現(xiàn)非常優(yōu)異。隨著神經(jīng)網(wǎng)絡(luò)快速的發(fā)展,產(chǎn)生了很多經(jīng)典的卷積神經(jīng)網(wǎng)絡(luò),如??ZFNet。担担荩郑牵牵危澹簦欤担丁,GoogleNet以及ResNet等。這些卷積神經(jīng)網(wǎng)絡(luò)在口標(biāo)的檢測(cè)與??
【參考文獻(xiàn)】:
期刊論文
[1]兩層級(jí)聯(lián)卷積神經(jīng)網(wǎng)絡(luò)的人臉檢測(cè)[J]. 張海濤,李美霖,董帥含. 中國(guó)圖象圖形學(xué)報(bào). 2019(02)
[2]Near Infrared Star Centroid Detection by Area Analysis of Multi-Scale Super Pixel Saliency Fusion Map[J]. Xiaohu Yuan,Shaojun Guo,Chunwen Li,Bin Lu,Shuli Lou. Tsinghua Science and Technology. 2019(03)
[3]基于改進(jìn)候選區(qū)域網(wǎng)絡(luò)的紅外飛機(jī)檢測(cè)[J]. 姜曉偉,王春平,付強(qiáng). 激光與紅外. 2019(01)
[4]基于可變形卷積神經(jīng)網(wǎng)絡(luò)的遙感影像密集區(qū)域車輛檢測(cè)方法[J]. 高鑫,李慧,張義,閆夢(mèng)龍,張宗朔,孫顯,孫皓,于泓峰. 電子與信息學(xué)報(bào). 2018(12)
[5]改進(jìn)Softmax分類器的深度卷積神經(jīng)網(wǎng)絡(luò)及其在人臉識(shí)別中的應(yīng)用[J]. 冉鵬,王靈,李昕,劉鵬偉. 上海大學(xué)學(xué)報(bào)(自然科學(xué)版). 2018(03)
[6]改進(jìn)區(qū)域卷積神經(jīng)網(wǎng)絡(luò)的機(jī)場(chǎng)檢測(cè)方法[J]. 朱明明,許悅雷,馬時(shí)平,唐紅,辛鵬,馬紅強(qiáng). 光學(xué)學(xué)報(bào). 2018(07)
[7]應(yīng)用卷積神經(jīng)網(wǎng)絡(luò)與RPN的交通標(biāo)志識(shí)別[J]. 譚臺(tái)哲,盧劍彪,溫捷文,李楚宏,凌偉林. 計(jì)算機(jī)工程與應(yīng)用. 2018(21)
[8]基于深度殘差網(wǎng)絡(luò)的高光譜遙感數(shù)據(jù)霾監(jiān)測(cè)[J]. 陸永帥,李元祥,劉波,劉輝,崔林麗. 光學(xué)學(xué)報(bào). 2017(11)
[9]卷積神經(jīng)網(wǎng)絡(luò)在腦脊液圖像分類上的應(yīng)用[J]. 龔震霆,陳光喜,曹建收. 計(jì)算機(jī)工程與設(shè)計(jì). 2017(04)
[10]深度卷積神經(jīng)網(wǎng)絡(luò)在計(jì)算機(jī)視覺(jué)中的應(yīng)用研究綜述[J]. 盧宏濤,張秦川. 數(shù)據(jù)采集與處理. 2016(01)
本文編號(hào):2996618
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/2996618.html
最近更新
教材專著