基于Stacked Hourglass網(wǎng)絡(luò)的二維人體骨骼關(guān)鍵點(diǎn)檢測(cè)
發(fā)布時(shí)間:2021-08-27 04:38
駕駛員注意力不集中是導(dǎo)致交通事故發(fā)生的主要原因之一,基于計(jì)算機(jī)視覺的分心駕駛識(shí)別技術(shù)具有非侵入、成本低等優(yōu)勢(shì),是目前相關(guān)研究的熱點(diǎn)和趨勢(shì)。本文利用基于計(jì)算機(jī)視覺的人體骨骼關(guān)鍵點(diǎn)檢測(cè)技術(shù)獲取駕駛員上半身的姿態(tài),通過學(xué)習(xí)姿態(tài)信息幫助網(wǎng)絡(luò)識(shí)別駕駛員行為,F(xiàn)有人體骨骼關(guān)鍵點(diǎn)檢測(cè)算法對(duì)背景復(fù)雜、遮擋嚴(yán)重、像素過小等目標(biāo)的檢測(cè)效果差,本文通過對(duì)現(xiàn)有算法的改進(jìn)來(lái)解決上述問題,從而提高算法的精度和魯棒性,達(dá)到檢測(cè)駕駛員骨骼關(guān)鍵點(diǎn)的要求。本文主要研究?jī)?nèi)容如下:(1)改進(jìn)了Faster R-CNN人物目標(biāo)檢測(cè)算法,首先針對(duì)現(xiàn)有行人檢測(cè)數(shù)據(jù)集在拍攝場(chǎng)景、樣本密度、遮擋場(chǎng)景等方面缺陷,制作了WiderPerson數(shù)據(jù)集;其次在Faster R-CNN的基礎(chǔ)上改進(jìn)Anchors尺寸和特征圖尺寸,增強(qiáng)RoI池化特征,設(shè)置忽略采樣區(qū)域,使用動(dòng)態(tài)采用策略,從而提高了其在人物目標(biāo)檢測(cè)上的精度。(2)提出了一種改進(jìn)的人體骨骼關(guān)鍵點(diǎn)檢測(cè)算法,該算法在Stacked Hourglass網(wǎng)絡(luò)的基礎(chǔ)上添加空間變換網(wǎng)絡(luò)模塊,解決Stacked Hourglass網(wǎng)絡(luò)對(duì)人物目標(biāo)檢測(cè)位置敏感問題,同時(shí)使用難樣本挖掘均方差損失函數(shù),提高...
【文章來(lái)源】:南京航空航天大學(xué)江蘇省 211工程院校
【文章頁(yè)數(shù)】:76 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
人體骨骼關(guān)鍵點(diǎn)示意圖
南京航空航天大學(xué)碩士學(xué)位論文建立、部位搜索空間的減小以及推理算法的優(yōu)化等四個(gè)方面。兩種方法對(duì)早期的人體骨骼關(guān)鍵點(diǎn)檢測(cè)技術(shù)的發(fā)展起了重大推進(jìn)作用,但是、魯棒性不足等缺陷,一度導(dǎo)致人體骨骼關(guān)鍵點(diǎn)檢測(cè)技術(shù)的發(fā)展陷入瓶頸之習(xí)的發(fā)展,人體骨骼關(guān)鍵點(diǎn)檢測(cè)技術(shù)也迎來(lái)了新的春天。由于深度學(xué)習(xí)表現(xiàn)對(duì)人體骨骼關(guān)鍵點(diǎn)檢測(cè)算法的研究進(jìn)一步深入,研究?jī)?nèi)容主要分為二維人體和三維人體骨骼關(guān)鍵點(diǎn)檢測(cè)[15]。維人體骨骼關(guān)鍵點(diǎn)檢測(cè)技術(shù)在研究方向上分為兩大類:骨骼關(guān)鍵點(diǎn)檢測(cè)算法點(diǎn)檢測(cè)框架研究,如圖 1.2 所示。其中,對(duì)骨骼關(guān)鍵點(diǎn)檢測(cè)框架的研究上,和由底而上兩種[16]。
網(wǎng)絡(luò)最后會(huì)連接一層或多層全連接層,通過全連接層將特征映射利用損失函數(shù)計(jì)算損失。在有些任務(wù)(例如語(yǔ)義分割、人體骨骼關(guān)鍵點(diǎn)檢中使用上采樣層,主要原因是這些任務(wù)不但需要高階的特征,同時(shí)還需要到高階特征和低階特征的尺度不同,在進(jìn)行高、低特征融合時(shí),需要將小采樣。卷積神經(jīng)網(wǎng)絡(luò)在訓(xùn)練時(shí),首先要對(duì)網(wǎng)絡(luò)的學(xué)習(xí)參數(shù)(如權(quán)重、偏置然后訓(xùn)練樣本通過網(wǎng)絡(luò)進(jìn)行前向傳播,層層計(jì)算后由損失函數(shù)得到損失值反向傳播的方式對(duì)學(xué)習(xí)參數(shù)進(jìn)行更新。重復(fù)迭代,當(dāng)損失函數(shù)計(jì)算的誤差完成訓(xùn)練。積與池化層是卷積神經(jīng)網(wǎng)絡(luò)中最基本的組成部分。卷積層的計(jì)算示例如圖 2.1 所示的特征圖;灰色部分填入的值都是零,稱為補(bǔ)零操作,目的是調(diào)整輸出的核的大小是3 3,可以看作是一個(gè)滑動(dòng)窗口,滑動(dòng)步長(zhǎng)是 2,從左到右、;瑒(dòng)過程中,將窗口內(nèi)的特征圖中的值和卷積核對(duì)應(yīng)的值相乘,然后求作為輸出特征圖對(duì)應(yīng)位置的值。
【參考文獻(xiàn)】:
期刊論文
[1]基于反向雙目識(shí)別的駕駛員分心檢測(cè)[J]. 王冠,李振龍. 科學(xué)技術(shù)與工程. 2018(17)
[2]駕駛?cè)朔中臓顟B(tài)判別支持向量機(jī)模型優(yōu)化算法[J]. 張輝,錢大琳,邵春福,錢振偉,菅美英. 交通運(yùn)輸系統(tǒng)工程與信息. 2018(01)
[3]二維人體姿態(tài)估計(jì)研究進(jìn)展[J]. 韓貴金,沈建冬. 西安郵電大學(xué)學(xué)報(bào). 2017(04)
[4]基于面部行為分析的駕駛員疲勞檢測(cè)方法[J]. 耿磊,袁菲,肖志濤,張芳,吳駿,李月龍. 計(jì)算機(jī)工程. 2018(01)
[5]基于腦電分析的連續(xù)駕駛疲勞高發(fā)時(shí)間判斷[J]. 李君羨,潘曉東. 交通科學(xué)與工程. 2012(04)
[6]Hough算法在圖像處理中的應(yīng)用[J]. 鐘彩,文密. 信息通信. 2012(06)
[7]遺傳算法研究進(jìn)展[J]. 馬永杰,云文霞. 計(jì)算機(jī)應(yīng)用研究. 2012(04)
[8]疲勞駕駛的腦電特性探索[J]. 彭軍強(qiáng),吳平東,殷罡. 北京理工大學(xué)學(xué)報(bào). 2007(07)
[9]前饋神經(jīng)網(wǎng)絡(luò)中的反向傳播算法及其改進(jìn):進(jìn)展與展望[J]. 劉曙光,鄭崇勛,劉明遠(yuǎn). 計(jì)算機(jī)科學(xué). 1996(01)
碩士論文
[1]基于機(jī)器視覺的自動(dòng)驗(yàn)布系統(tǒng)研究與開發(fā)[D]. 張美杰.廣東工業(yè)大學(xué) 2018
[2]基于改進(jìn)TextBoxes的自然場(chǎng)景文本檢測(cè)算法[D]. 余崢.華東師范大學(xué) 2018
[3]基于神經(jīng)網(wǎng)絡(luò)的多源數(shù)據(jù)攻擊檢測(cè)研究與應(yīng)用[D]. 李志鵬.電子科技大學(xué) 2018
[4]基于人臉識(shí)別駕駛員疲勞檢測(cè)系統(tǒng)設(shè)計(jì)與開發(fā)[D]. 才博.大連理工大學(xué) 2016
[5]考慮駕駛員生物電信號(hào)的疲勞駕駛檢測(cè)方法研究[D]. 薛雷.吉林大學(xué) 2015
[6]針對(duì)靜態(tài)圖像的人體姿態(tài)估計(jì)[D]. 丁肖.遼寧大學(xué) 2015
本文編號(hào):3365663
【文章來(lái)源】:南京航空航天大學(xué)江蘇省 211工程院校
【文章頁(yè)數(shù)】:76 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
人體骨骼關(guān)鍵點(diǎn)示意圖
南京航空航天大學(xué)碩士學(xué)位論文建立、部位搜索空間的減小以及推理算法的優(yōu)化等四個(gè)方面。兩種方法對(duì)早期的人體骨骼關(guān)鍵點(diǎn)檢測(cè)技術(shù)的發(fā)展起了重大推進(jìn)作用,但是、魯棒性不足等缺陷,一度導(dǎo)致人體骨骼關(guān)鍵點(diǎn)檢測(cè)技術(shù)的發(fā)展陷入瓶頸之習(xí)的發(fā)展,人體骨骼關(guān)鍵點(diǎn)檢測(cè)技術(shù)也迎來(lái)了新的春天。由于深度學(xué)習(xí)表現(xiàn)對(duì)人體骨骼關(guān)鍵點(diǎn)檢測(cè)算法的研究進(jìn)一步深入,研究?jī)?nèi)容主要分為二維人體和三維人體骨骼關(guān)鍵點(diǎn)檢測(cè)[15]。維人體骨骼關(guān)鍵點(diǎn)檢測(cè)技術(shù)在研究方向上分為兩大類:骨骼關(guān)鍵點(diǎn)檢測(cè)算法點(diǎn)檢測(cè)框架研究,如圖 1.2 所示。其中,對(duì)骨骼關(guān)鍵點(diǎn)檢測(cè)框架的研究上,和由底而上兩種[16]。
網(wǎng)絡(luò)最后會(huì)連接一層或多層全連接層,通過全連接層將特征映射利用損失函數(shù)計(jì)算損失。在有些任務(wù)(例如語(yǔ)義分割、人體骨骼關(guān)鍵點(diǎn)檢中使用上采樣層,主要原因是這些任務(wù)不但需要高階的特征,同時(shí)還需要到高階特征和低階特征的尺度不同,在進(jìn)行高、低特征融合時(shí),需要將小采樣。卷積神經(jīng)網(wǎng)絡(luò)在訓(xùn)練時(shí),首先要對(duì)網(wǎng)絡(luò)的學(xué)習(xí)參數(shù)(如權(quán)重、偏置然后訓(xùn)練樣本通過網(wǎng)絡(luò)進(jìn)行前向傳播,層層計(jì)算后由損失函數(shù)得到損失值反向傳播的方式對(duì)學(xué)習(xí)參數(shù)進(jìn)行更新。重復(fù)迭代,當(dāng)損失函數(shù)計(jì)算的誤差完成訓(xùn)練。積與池化層是卷積神經(jīng)網(wǎng)絡(luò)中最基本的組成部分。卷積層的計(jì)算示例如圖 2.1 所示的特征圖;灰色部分填入的值都是零,稱為補(bǔ)零操作,目的是調(diào)整輸出的核的大小是3 3,可以看作是一個(gè)滑動(dòng)窗口,滑動(dòng)步長(zhǎng)是 2,從左到右、;瑒(dòng)過程中,將窗口內(nèi)的特征圖中的值和卷積核對(duì)應(yīng)的值相乘,然后求作為輸出特征圖對(duì)應(yīng)位置的值。
【參考文獻(xiàn)】:
期刊論文
[1]基于反向雙目識(shí)別的駕駛員分心檢測(cè)[J]. 王冠,李振龍. 科學(xué)技術(shù)與工程. 2018(17)
[2]駕駛?cè)朔中臓顟B(tài)判別支持向量機(jī)模型優(yōu)化算法[J]. 張輝,錢大琳,邵春福,錢振偉,菅美英. 交通運(yùn)輸系統(tǒng)工程與信息. 2018(01)
[3]二維人體姿態(tài)估計(jì)研究進(jìn)展[J]. 韓貴金,沈建冬. 西安郵電大學(xué)學(xué)報(bào). 2017(04)
[4]基于面部行為分析的駕駛員疲勞檢測(cè)方法[J]. 耿磊,袁菲,肖志濤,張芳,吳駿,李月龍. 計(jì)算機(jī)工程. 2018(01)
[5]基于腦電分析的連續(xù)駕駛疲勞高發(fā)時(shí)間判斷[J]. 李君羨,潘曉東. 交通科學(xué)與工程. 2012(04)
[6]Hough算法在圖像處理中的應(yīng)用[J]. 鐘彩,文密. 信息通信. 2012(06)
[7]遺傳算法研究進(jìn)展[J]. 馬永杰,云文霞. 計(jì)算機(jī)應(yīng)用研究. 2012(04)
[8]疲勞駕駛的腦電特性探索[J]. 彭軍強(qiáng),吳平東,殷罡. 北京理工大學(xué)學(xué)報(bào). 2007(07)
[9]前饋神經(jīng)網(wǎng)絡(luò)中的反向傳播算法及其改進(jìn):進(jìn)展與展望[J]. 劉曙光,鄭崇勛,劉明遠(yuǎn). 計(jì)算機(jī)科學(xué). 1996(01)
碩士論文
[1]基于機(jī)器視覺的自動(dòng)驗(yàn)布系統(tǒng)研究與開發(fā)[D]. 張美杰.廣東工業(yè)大學(xué) 2018
[2]基于改進(jìn)TextBoxes的自然場(chǎng)景文本檢測(cè)算法[D]. 余崢.華東師范大學(xué) 2018
[3]基于神經(jīng)網(wǎng)絡(luò)的多源數(shù)據(jù)攻擊檢測(cè)研究與應(yīng)用[D]. 李志鵬.電子科技大學(xué) 2018
[4]基于人臉識(shí)別駕駛員疲勞檢測(cè)系統(tǒng)設(shè)計(jì)與開發(fā)[D]. 才博.大連理工大學(xué) 2016
[5]考慮駕駛員生物電信號(hào)的疲勞駕駛檢測(cè)方法研究[D]. 薛雷.吉林大學(xué) 2015
[6]針對(duì)靜態(tài)圖像的人體姿態(tài)估計(jì)[D]. 丁肖.遼寧大學(xué) 2015
本文編號(hào):3365663
本文鏈接:http://www.sikaile.net/kejilunwen/daoluqiaoliang/3365663.html
最近更新
教材專著