基于CNN的可變焦場景視頻行人檢測算法研究與實現(xiàn)
發(fā)布時間:2020-12-22 21:13
行人檢測是人工智能領(lǐng)域的技術(shù)基石,應(yīng)用前景廣闊。隨著深度學(xué)習(xí)的崛起,行人檢測技術(shù)領(lǐng)域出現(xiàn)了基于卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)的檢測算法。目前行人檢測算法仍無法同時實現(xiàn)高性能和實時性的行人檢測,行人尺寸多樣及背景復(fù)雜多變等諸多限制因素亟待解決?勺兘箞鼍耙曨l下基于CNN的行人檢測算法研究與實現(xiàn)對于行人檢測技術(shù)的進一步完善有一定的參考價值。鑒于此背景,本論文研究可變焦場景視頻下基于CNN的行人檢測算法及其實現(xiàn)問題,主要完成的工作及創(chuàng)新點有:(1)針對行人背景復(fù)雜多變及現(xiàn)有數(shù)據(jù)庫不能完全契合論文的行人檢測要求等問題,設(shè)計選用星光網(wǎng)絡(luò)攝像頭完成可變焦視頻采集平臺搭建和多場景下行人視頻采集工作,利用Matlab設(shè)計并實現(xiàn)的標注軟件進行行人樣本標注,在現(xiàn)有行人檢測數(shù)據(jù)庫的基礎(chǔ)上,進行本地數(shù)據(jù)庫構(gòu)建。實驗結(jié)果表明,聯(lián)合數(shù)據(jù)庫在一定程度上解決了行人背景復(fù)雜多變的問題,而且更有利于行人檢測算法的實現(xiàn)。(2)論文設(shè)計完成基于 CNN 的 SSD(Single Shot MultiBox Detector,SSD)行人檢測算法,并針對相應(yīng)問題進行了網(wǎng)絡(luò)改進。...
【文章來源】:北京交通大學(xué)北京市 211工程院校 教育部直屬院校
【文章頁數(shù)】:78 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖1-1行人分類、定位及檢測的關(guān)系??Figure?1-1?Relationship?between?pedestrian?classification,?location?and?detection??
具有一個隱層的多層感知機,或者是具有一個隱層于人類準則的統(tǒng)計學(xué)習(xí)方式來完成較繁雜的訓(xùn)練,預(yù)測。淺層模型最根本任務(wù)是目標分類。常見的淺(Support?Vector?Machines,?SVM)?[45]、提升算法[46]和列舉模型的隱層個數(shù)為一層或者零層,其在提出后學(xué)習(xí)相比需要很少的訓(xùn)練技巧,所以被迅速地應(yīng)用層學(xué)習(xí)對于需要多個隱層來解決的檢測問題,如果邊緣特征層進行目標檢測時,需要反復(fù)地人工修改解決問題,需要多次訓(xùn)練,才能完成目標檢測。上不夠,因此需要深度學(xué)習(xí)來解決深度不夠問題。??經(jīng)網(wǎng)絡(luò)的興起,深度學(xué)習(xí)概念被提出。深度學(xué)習(xí)屬度學(xué)習(xí)是神經(jīng)網(wǎng)絡(luò)中最重要的部分,它的基本構(gòu)成習(xí)包含人工神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)。機器學(xué)習(xí)、神經(jīng)2_1中所示。從圖2-1中可以清晰地看到幾種方法在
一層提取到的特征用于下一層提取特征時的輸入;第三步全部訓(xùn)練完成后,從最??高層開始改變學(xué)習(xí)方式,采用監(jiān)督學(xué)習(xí)方式從高到低進行參數(shù)微調(diào)來生成模型。??深度學(xué)習(xí)訓(xùn)練流程如下圖2-2所示:??<?自高到低監(jiān)督學(xué)習(xí)微調(diào)?_??高非監(jiān)督學(xué)??圖2-2深度學(xué)習(xí)訓(xùn)練流程??Figure?2-2?Process?of?deep?learning?training??深度學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu)和傳統(tǒng)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)存在很多相同點和不同點,通過下圖??2-3深度學(xué)習(xí)模型和傳統(tǒng)神經(jīng)網(wǎng)絡(luò)模型圖進行對比分析。??_??a)神經(jīng)網(wǎng)絡(luò)?b)含多個隱層的深度學(xué)習(xí)網(wǎng)絡(luò)??a)?Neural?network?b)?Deep?learning?network?with?multiple?hidden?layers??圖2-3神經(jīng)網(wǎng)絡(luò)模型和深度學(xué)習(xí)模型??Figure?2-3?Neural?network?model?and?deep?learning?model??由上圖2-3可以看出,深度學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu)和傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)相同點是:兩??者都是具有輸入層、隱層和輸出層多層網(wǎng)絡(luò)的分層結(jié)構(gòu),權(quán)重連接只在相鄰層的??層與層之間,同一層或者跨層之間不存在權(quán)重連接。深度學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu)和傳統(tǒng)神??經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)不同點是:傳統(tǒng)神經(jīng)網(wǎng)絡(luò)層數(shù)一般為兩層或者三層。受層數(shù)少的限制
【參考文獻】:
碩士論文
[1]基于SSD的行人檢測與跟蹤方法研究[D]. 李海翔.中國科學(xué)技術(shù)大學(xué) 2018
[2]深度學(xué)習(xí)在行人檢測中的研究與應(yīng)用[D]. 李蹊.北京郵電大學(xué) 2017
本文編號:2932446
【文章來源】:北京交通大學(xué)北京市 211工程院校 教育部直屬院校
【文章頁數(shù)】:78 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖1-1行人分類、定位及檢測的關(guān)系??Figure?1-1?Relationship?between?pedestrian?classification,?location?and?detection??
具有一個隱層的多層感知機,或者是具有一個隱層于人類準則的統(tǒng)計學(xué)習(xí)方式來完成較繁雜的訓(xùn)練,預(yù)測。淺層模型最根本任務(wù)是目標分類。常見的淺(Support?Vector?Machines,?SVM)?[45]、提升算法[46]和列舉模型的隱層個數(shù)為一層或者零層,其在提出后學(xué)習(xí)相比需要很少的訓(xùn)練技巧,所以被迅速地應(yīng)用層學(xué)習(xí)對于需要多個隱層來解決的檢測問題,如果邊緣特征層進行目標檢測時,需要反復(fù)地人工修改解決問題,需要多次訓(xùn)練,才能完成目標檢測。上不夠,因此需要深度學(xué)習(xí)來解決深度不夠問題。??經(jīng)網(wǎng)絡(luò)的興起,深度學(xué)習(xí)概念被提出。深度學(xué)習(xí)屬度學(xué)習(xí)是神經(jīng)網(wǎng)絡(luò)中最重要的部分,它的基本構(gòu)成習(xí)包含人工神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)。機器學(xué)習(xí)、神經(jīng)2_1中所示。從圖2-1中可以清晰地看到幾種方法在
一層提取到的特征用于下一層提取特征時的輸入;第三步全部訓(xùn)練完成后,從最??高層開始改變學(xué)習(xí)方式,采用監(jiān)督學(xué)習(xí)方式從高到低進行參數(shù)微調(diào)來生成模型。??深度學(xué)習(xí)訓(xùn)練流程如下圖2-2所示:??<?自高到低監(jiān)督學(xué)習(xí)微調(diào)?_??高非監(jiān)督學(xué)??圖2-2深度學(xué)習(xí)訓(xùn)練流程??Figure?2-2?Process?of?deep?learning?training??深度學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu)和傳統(tǒng)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)存在很多相同點和不同點,通過下圖??2-3深度學(xué)習(xí)模型和傳統(tǒng)神經(jīng)網(wǎng)絡(luò)模型圖進行對比分析。??_??a)神經(jīng)網(wǎng)絡(luò)?b)含多個隱層的深度學(xué)習(xí)網(wǎng)絡(luò)??a)?Neural?network?b)?Deep?learning?network?with?multiple?hidden?layers??圖2-3神經(jīng)網(wǎng)絡(luò)模型和深度學(xué)習(xí)模型??Figure?2-3?Neural?network?model?and?deep?learning?model??由上圖2-3可以看出,深度學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu)和傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)相同點是:兩??者都是具有輸入層、隱層和輸出層多層網(wǎng)絡(luò)的分層結(jié)構(gòu),權(quán)重連接只在相鄰層的??層與層之間,同一層或者跨層之間不存在權(quán)重連接。深度學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu)和傳統(tǒng)神??經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)不同點是:傳統(tǒng)神經(jīng)網(wǎng)絡(luò)層數(shù)一般為兩層或者三層。受層數(shù)少的限制
【參考文獻】:
碩士論文
[1]基于SSD的行人檢測與跟蹤方法研究[D]. 李海翔.中國科學(xué)技術(shù)大學(xué) 2018
[2]深度學(xué)習(xí)在行人檢測中的研究與應(yīng)用[D]. 李蹊.北京郵電大學(xué) 2017
本文編號:2932446
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/2932446.html
最近更新
教材專著