基于深度學習的復雜場景下人頭檢測研究及實現(xiàn)
發(fā)布時間:2021-07-04 06:16
人體檢測廣泛應用于安防領域,具備很大的市場價值。但是安防場景常常比較復雜,人群的密集性和場景本身的復雜性導致人體目標很可能被遮擋,所以選擇了人頭這一遮擋可能性相對較小的人體特征作為檢測目標。針對在目標密集、遮擋情況下檢測性能下降的問題,設計了一種結合卷積神經(jīng)網(wǎng)絡和特定循環(huán)神經(jīng)網(wǎng)絡的人頭檢測算法YOLO-OFLSTM。人頭檢測算法YOLO-OFLSTM基于YOLO系列算法核心思想進行改進,首先利用Darknet19、MobileNet等卷積神經(jīng)網(wǎng)絡提取高層語義特征;然后利用一種只有遺忘門的變體長短期記憶單元OFLSTM來進行特征解碼,以回歸得到預測邊界框信息;最后采用一種改進的非極大值抑制算法Union-NMS來去除冗余邊界框,獲得最終的人頭檢測結果。針對人頭這一單一檢測類別,Union-NMS算法同時考慮邊界框置信度以及這些邊界框之間的交疊率,這一改進有效提高了檢測的準確性。針對YOLO-OFLSTM檢測模型對于小尺度目標漏檢率高的情況,設計出了特征提取骨干網(wǎng)絡Darknet-PPM,該網(wǎng)絡基于YOLO-v2的特征提取網(wǎng)絡Darknet19,通過結合使用金字塔池化模塊引入了多尺度特征,...
【文章來源】:華中科技大學湖北省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:70 頁
【學位級別】:碩士
【部分圖文】:
YOLO-v1網(wǎng)絡模型
圖 2.2 邊框回歸示例法的突出優(yōu)點就是檢測速度快,能夠實全圖信息,所以能有效減少背景誤檢。但于每個網(wǎng)格單元只檢測一個目標。所以,漏檢較多。RNN 的 YOLO-OFLSTM 算法設計思想是目標密集、遮擋情況下的人頭檢測,而為固定區(qū)域大小的一個個網(wǎng)格單元,在每一個網(wǎng)格單元中出現(xiàn)多個較為密集的目標目標的。所以我們參照 ReInspect 方法中入一種特定 RNN 網(wǎng)絡,使其能夠在一個夠記住先前生成的預測,從而避免對同
圖 2.3 YOLO-OFLSTM 模型架構我們構建的 YOLO-OFLSTM 模型架構如圖 2.3 所示,首先利用 Darknet19 等 CNN網(wǎng)絡模型將 640x480 的圖像編碼成 1024 維 20x15 的高層語義特征,高層語義特征圖上的每個單元具有大小為 32x32 的感受野,即每個單元對應原始圖像上 32x32 區(qū)域大小的網(wǎng)格單元,這樣網(wǎng)絡被訓練以產(chǎn)生其中心與32x32的網(wǎng)格單元相交的所有邊界框的集合,32x32 的區(qū)域大小足夠捕獲局部遮擋情況,同時 32x32 的區(qū)域中不會包含太多目標而導致不同網(wǎng)格單元上的目標分布太過失衡;然后使用特定 RNN 網(wǎng)絡模型解碼 CNN 網(wǎng)絡模型提取到的特征回歸得到預測框。模型中引入 RNN 是希望利用其對時間序列信息的記憶功能來檢測出一個網(wǎng)格單元中的多個有遮擋的目標,本文使用的 RNN 是一種特定的只有遺忘門的 LSTM 變體結構[30],我們稱之為 OFLSTM,它沒有偏置項和非線性輸出。在每一步,我們將 Darknet19 輸出的(1,1024,15,20)維度的高層語義特性與前一步OFLSTM 單元的輸出連接,并將其輸入到下一步 OFLSTM 單元進行計算。這樣每一步
【參考文獻】:
期刊論文
[1]基于RPN與B- CNN的細粒度圖像分類算法研究[J]. 趙浩如,張永,劉國柱. 計算機應用與軟件. 2019(03)
[2]基于卷積神經(jīng)網(wǎng)絡的目標檢測研究綜述[J]. 李旭冬,葉茂,李濤. 計算機應用研究. 2017(10)
[3]基于深度信息的室內(nèi)人數(shù)統(tǒng)計研究[J]. 何夢瑩,方向忠,李偉,盧盼峰. 信息技術. 2016(10)
[4]基于深度卷積神經(jīng)網(wǎng)絡的行人檢測[J]. 芮挺,費建超,周遊,方虎生,朱經(jīng)緯. 計算機工程與應用. 2016(13)
[5]基于雙目立體視覺的快速人頭檢測方法[J]. 顧騁,錢惟賢,陳錢,顧國華,任建樂. 中國激光. 2014(01)
[6]用二分圖實現(xiàn)復雜參數(shù)類型匹配[J]. 王義錦,趙耀. 軟件. 2012(11)
碩士論文
[1]基于深度學習的細胞譜系預測[D]. 王志丹.北京交通大學 2018
[2]基于機器視覺的紐扣缺陷檢測算法研究[D]. 李帥.西安工程大學 2018
[3]基于位置的移動社交網(wǎng)絡中興趣點推薦算法的研究[D]. 王曉蕊.中國礦業(yè)大學 2018
[4]基于循環(huán)神經(jīng)網(wǎng)絡的推薦算法研究[D]. 李光.哈爾濱工程大學 2017
[5]基于卷積神經(jīng)網(wǎng)絡的人臉表情和性別識別[D]. 產(chǎn)文濤.安徽大學 2016
本文編號:3264210
【文章來源】:華中科技大學湖北省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:70 頁
【學位級別】:碩士
【部分圖文】:
YOLO-v1網(wǎng)絡模型
圖 2.2 邊框回歸示例法的突出優(yōu)點就是檢測速度快,能夠實全圖信息,所以能有效減少背景誤檢。但于每個網(wǎng)格單元只檢測一個目標。所以,漏檢較多。RNN 的 YOLO-OFLSTM 算法設計思想是目標密集、遮擋情況下的人頭檢測,而為固定區(qū)域大小的一個個網(wǎng)格單元,在每一個網(wǎng)格單元中出現(xiàn)多個較為密集的目標目標的。所以我們參照 ReInspect 方法中入一種特定 RNN 網(wǎng)絡,使其能夠在一個夠記住先前生成的預測,從而避免對同
圖 2.3 YOLO-OFLSTM 模型架構我們構建的 YOLO-OFLSTM 模型架構如圖 2.3 所示,首先利用 Darknet19 等 CNN網(wǎng)絡模型將 640x480 的圖像編碼成 1024 維 20x15 的高層語義特征,高層語義特征圖上的每個單元具有大小為 32x32 的感受野,即每個單元對應原始圖像上 32x32 區(qū)域大小的網(wǎng)格單元,這樣網(wǎng)絡被訓練以產(chǎn)生其中心與32x32的網(wǎng)格單元相交的所有邊界框的集合,32x32 的區(qū)域大小足夠捕獲局部遮擋情況,同時 32x32 的區(qū)域中不會包含太多目標而導致不同網(wǎng)格單元上的目標分布太過失衡;然后使用特定 RNN 網(wǎng)絡模型解碼 CNN 網(wǎng)絡模型提取到的特征回歸得到預測框。模型中引入 RNN 是希望利用其對時間序列信息的記憶功能來檢測出一個網(wǎng)格單元中的多個有遮擋的目標,本文使用的 RNN 是一種特定的只有遺忘門的 LSTM 變體結構[30],我們稱之為 OFLSTM,它沒有偏置項和非線性輸出。在每一步,我們將 Darknet19 輸出的(1,1024,15,20)維度的高層語義特性與前一步OFLSTM 單元的輸出連接,并將其輸入到下一步 OFLSTM 單元進行計算。這樣每一步
【參考文獻】:
期刊論文
[1]基于RPN與B- CNN的細粒度圖像分類算法研究[J]. 趙浩如,張永,劉國柱. 計算機應用與軟件. 2019(03)
[2]基于卷積神經(jīng)網(wǎng)絡的目標檢測研究綜述[J]. 李旭冬,葉茂,李濤. 計算機應用研究. 2017(10)
[3]基于深度信息的室內(nèi)人數(shù)統(tǒng)計研究[J]. 何夢瑩,方向忠,李偉,盧盼峰. 信息技術. 2016(10)
[4]基于深度卷積神經(jīng)網(wǎng)絡的行人檢測[J]. 芮挺,費建超,周遊,方虎生,朱經(jīng)緯. 計算機工程與應用. 2016(13)
[5]基于雙目立體視覺的快速人頭檢測方法[J]. 顧騁,錢惟賢,陳錢,顧國華,任建樂. 中國激光. 2014(01)
[6]用二分圖實現(xiàn)復雜參數(shù)類型匹配[J]. 王義錦,趙耀. 軟件. 2012(11)
碩士論文
[1]基于深度學習的細胞譜系預測[D]. 王志丹.北京交通大學 2018
[2]基于機器視覺的紐扣缺陷檢測算法研究[D]. 李帥.西安工程大學 2018
[3]基于位置的移動社交網(wǎng)絡中興趣點推薦算法的研究[D]. 王曉蕊.中國礦業(yè)大學 2018
[4]基于循環(huán)神經(jīng)網(wǎng)絡的推薦算法研究[D]. 李光.哈爾濱工程大學 2017
[5]基于卷積神經(jīng)網(wǎng)絡的人臉表情和性別識別[D]. 產(chǎn)文濤.安徽大學 2016
本文編號:3264210
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/3264210.html
最近更新
教材專著