基于深度學習的復雜場景下人頭檢測研究及實現(xiàn)

發(fā)布時間：2021-07-04 06:16

　　人體檢測廣泛應用于安防領域,具備很大的市場價值。但是安防場景常常比較復雜,人群的密集性和場景本身的復雜性導致人體目標很可能被遮擋,所以選擇了人頭這一遮擋可能性相對較小的人體特征作為檢測目標。針對在目標密集、遮擋情況下檢測性能下降的問題,設計了一種結合卷積神經(jīng)網(wǎng)絡和特定循環(huán)神經(jīng)網(wǎng)絡的人頭檢測算法YOLO-OFLSTM。人頭檢測算法YOLO-OFLSTM基于YOLO系列算法核心思想進行改進,首先利用Darknet19、MobileNet等卷積神經(jīng)網(wǎng)絡提取高層語義特征;然后利用一種只有遺忘門的變體長短期記憶單元OFLSTM來進行特征解碼,以回歸得到預測邊界框信息;最后采用一種改進的非極大值抑制算法Union-NMS來去除冗余邊界框,獲得最終的人頭檢測結果。針對人頭這一單一檢測類別,Union-NMS算法同時考慮邊界框置信度以及這些邊界框之間的交疊率,這一改進有效提高了檢測的準確性。針對YOLO-OFLSTM檢測模型對于小尺度目標漏檢率高的情況,設計出了特征提取骨干網(wǎng)絡Darknet-PPM,該網(wǎng)絡基于YOLO-v2的特征提取網(wǎng)絡Darknet19,通過結合使用金字塔池化模塊引入了多尺度特征,...

【文章來源】：華中科技大學湖北省 211工程院校 985工程院校教育部直屬院校

【文章頁數(shù)】：70 頁

【學位級別】：碩士

【部分圖文】：

YOLO-v1網(wǎng)絡模型

邊框,示例,網(wǎng)格單元

圖 2.2 邊框回歸示例法的突出優(yōu)點就是檢測速度快，能夠實全圖信息，所以能有效減少背景誤檢。但于每個網(wǎng)格單元只檢測一個目標。所以，漏檢較多。RNN 的 YOLO-OFLSTM 算法設計思想是目標密集、遮擋情況下的人頭檢測，而為固定區(qū)域大小的一個個網(wǎng)格單元，在每一個網(wǎng)格單元中出現(xiàn)多個較為密集的目標目標的。所以我們參照 ReInspect 方法中入一種特定 RNN 網(wǎng)絡，使其能夠在一個夠記住先前生成的預測，從而避免對同

網(wǎng)格單元,網(wǎng)絡模型,語義特征,高層

圖 2.3 YOLO-OFLSTM 模型架構我們構建的 YOLO-OFLSTM 模型架構如圖 2.3 所示，首先利用 Darknet19 等 CNN網(wǎng)絡模型將 640x480 的圖像編碼成 1024 維 20x15 的高層語義特征，高層語義特征圖上的每個單元具有大小為 32x32 的感受野，即每個單元對應原始圖像上 32x32 區(qū)域大小的網(wǎng)格單元，這樣網(wǎng)絡被訓練以產(chǎn)生其中心與32x32的網(wǎng)格單元相交的所有邊界框的集合，32x32 的區(qū)域大小足夠捕獲局部遮擋情況，同時 32x32 的區(qū)域中不會包含太多目標而導致不同網(wǎng)格單元上的目標分布太過失衡；然后使用特定 RNN 網(wǎng)絡模型解碼 CNN 網(wǎng)絡模型提取到的特征回歸得到預測框。模型中引入 RNN 是希望利用其對時間序列信息的記憶功能來檢測出一個網(wǎng)格單元中的多個有遮擋的目標，本文使用的 RNN 是一種特定的只有遺忘門的 LSTM 變體結構[30]，我們稱之為 OFLSTM，它沒有偏置項和非線性輸出。在每一步，我們將 Darknet19 輸出的（1,1024,15,20）維度的高層語義特性與前一步OFLSTM 單元的輸出連接，并將其輸入到下一步 OFLSTM 單元進行計算。這樣每一步

【參考文獻】：
期刊論文
[1]基于RPN與B- CNN的細粒度圖像分類算法研究[J]. 趙浩如,張永,劉國柱.  計算機應用與軟件. 2019(03)
[2]基于卷積神經(jīng)網(wǎng)絡的目標檢測研究綜述[J]. 李旭冬,葉茂,李濤.  計算機應用研究. 2017(10)
[3]基于深度信息的室內(nèi)人數(shù)統(tǒng)計研究[J]. 何夢瑩,方向忠,李偉,盧盼峰.  信息技術. 2016(10)
[4]基于深度卷積神經(jīng)網(wǎng)絡的行人檢測[J]. 芮挺,費建超,周遊,方虎生,朱經(jīng)緯.  計算機工程與應用. 2016(13)
[5]基于雙目立體視覺的快速人頭檢測方法[J]. 顧騁,錢惟賢,陳錢,顧國華,任建樂.  中國激光. 2014(01)
[6]用二分圖實現(xiàn)復雜參數(shù)類型匹配[J]. 王義錦,趙耀.  軟件. 2012(11)

碩士論文
[1]基于深度學習的細胞譜系預測[D]. 王志丹.北京交通大學 2018
[2]基于機器視覺的紐扣缺陷檢測算法研究[D]. 李帥.西安工程大學 2018
[3]基于位置的移動社交網(wǎng)絡中興趣點推薦算法的研究[D]. 王曉蕊.中國礦業(yè)大學 2018
[4]基于循環(huán)神經(jīng)網(wǎng)絡的推薦算法研究[D]. 李光.哈爾濱工程大學 2017
[5]基于卷積神經(jīng)網(wǎng)絡的人臉表情和性別識別[D]. 產(chǎn)文濤.安徽大學 2016

本文編號：3264210

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/3264210.html

上一篇：基于深度相機數(shù)據(jù)驅動的人形機器人運動及算法研究
下一篇：漢語閱讀理解詞義判斷題解答研究

論文發(fā)表

·知網(wǎng)|萬方|維普|龍源|省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于深度學習的復雜場景下人頭檢測研究及實現(xiàn)