基于深度學(xué)習(xí)的斑馬線行人檢測(cè)與行為分析算法研究
發(fā)布時(shí)間:2021-03-18 21:14
在城市混合交通中,由于城市機(jī)動(dòng)化水平的快速發(fā)展,汽車占據(jù)了其中的主要地位,而行人在其中的弱勢(shì)地位日益加重。由于行人穿越道路一般在斑馬線區(qū)域進(jìn)行,斑馬線區(qū)域常常成為人與車輛交互最頻繁的區(qū)域。而人在斑馬線區(qū)域的位置、通行方式成為對(duì)區(qū)域交通安全判斷的關(guān)鍵因素。因此,本文從基于視頻監(jiān)控的斑馬線行人檢測(cè)與行為分析兩方面入手,對(duì)相應(yīng)的基于深度學(xué)習(xí)的智能算法展開(kāi)研究。論文主要工作包括:(1)提出一種專門用于目標(biāo)檢測(cè)網(wǎng)絡(luò)的骨干網(wǎng)絡(luò),將其應(yīng)用在一階段目標(biāo)檢測(cè)網(wǎng)絡(luò)SSD上用于解決斑馬線行人檢測(cè)問(wèn)題。首先,對(duì)基于深度學(xué)習(xí)的一階段目標(biāo)檢測(cè)算法SSD進(jìn)行了深入分析。然后,對(duì)檢測(cè)網(wǎng)絡(luò)所使用的骨干網(wǎng)絡(luò)進(jìn)行了探討,對(duì)現(xiàn)有骨干網(wǎng)絡(luò)DarkNet-53進(jìn)行初步改進(jìn),獲得初步改進(jìn)網(wǎng)絡(luò)DarkNet-60。接著,提出了一種用于增強(qiáng)網(wǎng)絡(luò)感受野的網(wǎng)絡(luò)結(jié)構(gòu)Dense RFB(receptive field block),并將該結(jié)構(gòu)加入初步改進(jìn)的骨干網(wǎng)絡(luò)獲得檢測(cè)專用骨干網(wǎng)絡(luò)DRFNet(dense receptive field network),最后,將骨干網(wǎng)絡(luò)DRFNet用于SSD,提升了SSD對(duì)斑馬線行人的檢測(cè)性能。(2)提出...
【文章來(lái)源】:浙江工業(yè)大學(xué)浙江省
【文章頁(yè)數(shù)】:78 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
網(wǎng)絡(luò)感受野示意圖
基于深度學(xué)習(xí)的斑馬線行人檢測(cè)與行為分析算法研究29目標(biāo)的檢測(cè)效果優(yōu)于YOLOv3(608×608)(18.7%vs18.3%,+0.4%APs),并且在速度上仍然能保持實(shí)時(shí)性。2.3.3斑馬線行人檢測(cè)數(shù)據(jù)集實(shí)驗(yàn)結(jié)果與分析圖2-11多種斑馬線監(jiān)控場(chǎng)景Figure2-11Thevariouscrosswalksurveillancescenarios本文構(gòu)建了斑馬線行人檢測(cè)數(shù)據(jù)集,圖片總數(shù)為7200,通過(guò)對(duì)多個(gè)場(chǎng)景(如所圖2-11所示)不同時(shí)段的斑馬線監(jiān)控視頻(分辨率1920×1080,25Hz)進(jìn)行稀疏采樣得到。對(duì)于每一張圖片,采用人工標(biāo)注的方式添加標(biāo)簽。通過(guò)3:1的比例進(jìn)行數(shù)據(jù)集劃分,其中訓(xùn)練集包含5400張圖片,標(biāo)注框數(shù)量為14787個(gè),測(cè)試集包含1800張圖片,標(biāo)注框數(shù)量為4635個(gè)。表2-10展示了數(shù)據(jù)集直觀的統(tǒng)計(jì)數(shù)據(jù)。表2-10斑馬線行人檢測(cè)數(shù)據(jù)集概況Table2-10Thestatisticsofcrosswalkpedestriandetectiondataset訓(xùn)練集測(cè)試集總數(shù)圖片數(shù)量540018007200標(biāo)注框數(shù)量14687463519322分辨率--1920×1080使用基于VGG-16的SSD以及基于DRFNet的SSD在訓(xùn)練集上進(jìn)行訓(xùn)練,輸入圖像分辨率設(shè)置為512×512,batchsize設(shè)置為32,訓(xùn)練epoch設(shè)置為150,初始學(xué)習(xí)率為0.004,同樣采用“warmup”學(xué)習(xí)率初始化策略,并使用余弦學(xué)習(xí)速率退火算法。實(shí)驗(yàn)結(jié)果如表2-11所示,通過(guò)DRFNet的使用有效地提升了SSD在斑馬線行
縵攣侍猓海?)由于算法采用了多尺度檢測(cè)方法,其與先驗(yàn)方法結(jié)合起來(lái)后,使得網(wǎng)絡(luò)的超參數(shù)大大增加,影響了算法在不同場(chǎng)景下的魯棒性。盡管可以通過(guò)手工調(diào)整先驗(yàn)框的超參數(shù),但是獲得其中的最優(yōu)解或次優(yōu)解需要大量的實(shí)驗(yàn)。(2)算法需要將先驗(yàn)框的值與網(wǎng)絡(luò)輸出結(jié)果結(jié)合起來(lái)進(jìn)行解碼,而大量的錨框的解碼過(guò)程對(duì)算法檢測(cè)速度的影響不可忽視。因此,為了避免以上的問(wèn)題,本章節(jié)采用了無(wú)錨框的目標(biāo)檢測(cè)算法CenterNet[78],并對(duì)其進(jìn)行改進(jìn),使得在保證檢測(cè)速度的情況下,獲取更好的檢測(cè)精度。3.2無(wú)錨框檢測(cè)算法CenterNet圖3-1CenterNet算法示意圖(ObjectsasPoints)Figure3-1TheschematicdiagramofCenterNet(ObjectsasPoints)如圖3-1所示,CenterNet目標(biāo)檢測(cè)算法不再將目標(biāo)的邊框獲取作為一個(gè)整體問(wèn)題,而是將其轉(zhuǎn)換成對(duì)目標(biāo)中心點(diǎn)的預(yù)測(cè)分類問(wèn)題,以及基于各個(gè)目標(biāo)的中心點(diǎn)對(duì)應(yīng)的邊框回歸問(wèn)題。這樣的思路使得該算法不使用先驗(yàn)框,而是直接基于網(wǎng)絡(luò)特征圖進(jìn)行檢測(cè)結(jié)果的預(yù)測(cè),從而避免了檢測(cè)結(jié)果解碼過(guò)程中帶來(lái)的速度損失以及繁瑣的先驗(yàn)框超參數(shù)設(shè)置。下面將對(duì)CenterNet算法進(jìn)行介紹。3.2.1網(wǎng)絡(luò)結(jié)構(gòu)CenterNet包括網(wǎng)絡(luò)包括三個(gè)部分,分別為編碼網(wǎng)絡(luò)(encodernetwork),解碼網(wǎng)絡(luò)(decodernetwork)以及檢測(cè)子網(wǎng)絡(luò)(detectionsub-networks),如圖3-2所示:
【參考文獻(xiàn)】:
期刊論文
[1]面向智能監(jiān)控的行為識(shí)別[J]. 馬鈺錫,譚勵(lì),董旭,于重重. 中國(guó)圖象圖形學(xué)報(bào). 2019(02)
[2]基于深度學(xué)習(xí)的人體行為識(shí)別算法綜述[J]. 朱煜,趙江坤,王逸寧,鄭兵兵. 自動(dòng)化學(xué)報(bào). 2016(06)
本文編號(hào):3088941
【文章來(lái)源】:浙江工業(yè)大學(xué)浙江省
【文章頁(yè)數(shù)】:78 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
網(wǎng)絡(luò)感受野示意圖
基于深度學(xué)習(xí)的斑馬線行人檢測(cè)與行為分析算法研究29目標(biāo)的檢測(cè)效果優(yōu)于YOLOv3(608×608)(18.7%vs18.3%,+0.4%APs),并且在速度上仍然能保持實(shí)時(shí)性。2.3.3斑馬線行人檢測(cè)數(shù)據(jù)集實(shí)驗(yàn)結(jié)果與分析圖2-11多種斑馬線監(jiān)控場(chǎng)景Figure2-11Thevariouscrosswalksurveillancescenarios本文構(gòu)建了斑馬線行人檢測(cè)數(shù)據(jù)集,圖片總數(shù)為7200,通過(guò)對(duì)多個(gè)場(chǎng)景(如所圖2-11所示)不同時(shí)段的斑馬線監(jiān)控視頻(分辨率1920×1080,25Hz)進(jìn)行稀疏采樣得到。對(duì)于每一張圖片,采用人工標(biāo)注的方式添加標(biāo)簽。通過(guò)3:1的比例進(jìn)行數(shù)據(jù)集劃分,其中訓(xùn)練集包含5400張圖片,標(biāo)注框數(shù)量為14787個(gè),測(cè)試集包含1800張圖片,標(biāo)注框數(shù)量為4635個(gè)。表2-10展示了數(shù)據(jù)集直觀的統(tǒng)計(jì)數(shù)據(jù)。表2-10斑馬線行人檢測(cè)數(shù)據(jù)集概況Table2-10Thestatisticsofcrosswalkpedestriandetectiondataset訓(xùn)練集測(cè)試集總數(shù)圖片數(shù)量540018007200標(biāo)注框數(shù)量14687463519322分辨率--1920×1080使用基于VGG-16的SSD以及基于DRFNet的SSD在訓(xùn)練集上進(jìn)行訓(xùn)練,輸入圖像分辨率設(shè)置為512×512,batchsize設(shè)置為32,訓(xùn)練epoch設(shè)置為150,初始學(xué)習(xí)率為0.004,同樣采用“warmup”學(xué)習(xí)率初始化策略,并使用余弦學(xué)習(xí)速率退火算法。實(shí)驗(yàn)結(jié)果如表2-11所示,通過(guò)DRFNet的使用有效地提升了SSD在斑馬線行
縵攣侍猓海?)由于算法采用了多尺度檢測(cè)方法,其與先驗(yàn)方法結(jié)合起來(lái)后,使得網(wǎng)絡(luò)的超參數(shù)大大增加,影響了算法在不同場(chǎng)景下的魯棒性。盡管可以通過(guò)手工調(diào)整先驗(yàn)框的超參數(shù),但是獲得其中的最優(yōu)解或次優(yōu)解需要大量的實(shí)驗(yàn)。(2)算法需要將先驗(yàn)框的值與網(wǎng)絡(luò)輸出結(jié)果結(jié)合起來(lái)進(jìn)行解碼,而大量的錨框的解碼過(guò)程對(duì)算法檢測(cè)速度的影響不可忽視。因此,為了避免以上的問(wèn)題,本章節(jié)采用了無(wú)錨框的目標(biāo)檢測(cè)算法CenterNet[78],并對(duì)其進(jìn)行改進(jìn),使得在保證檢測(cè)速度的情況下,獲取更好的檢測(cè)精度。3.2無(wú)錨框檢測(cè)算法CenterNet圖3-1CenterNet算法示意圖(ObjectsasPoints)Figure3-1TheschematicdiagramofCenterNet(ObjectsasPoints)如圖3-1所示,CenterNet目標(biāo)檢測(cè)算法不再將目標(biāo)的邊框獲取作為一個(gè)整體問(wèn)題,而是將其轉(zhuǎn)換成對(duì)目標(biāo)中心點(diǎn)的預(yù)測(cè)分類問(wèn)題,以及基于各個(gè)目標(biāo)的中心點(diǎn)對(duì)應(yīng)的邊框回歸問(wèn)題。這樣的思路使得該算法不使用先驗(yàn)框,而是直接基于網(wǎng)絡(luò)特征圖進(jìn)行檢測(cè)結(jié)果的預(yù)測(cè),從而避免了檢測(cè)結(jié)果解碼過(guò)程中帶來(lái)的速度損失以及繁瑣的先驗(yàn)框超參數(shù)設(shè)置。下面將對(duì)CenterNet算法進(jìn)行介紹。3.2.1網(wǎng)絡(luò)結(jié)構(gòu)CenterNet包括網(wǎng)絡(luò)包括三個(gè)部分,分別為編碼網(wǎng)絡(luò)(encodernetwork),解碼網(wǎng)絡(luò)(decodernetwork)以及檢測(cè)子網(wǎng)絡(luò)(detectionsub-networks),如圖3-2所示:
【參考文獻(xiàn)】:
期刊論文
[1]面向智能監(jiān)控的行為識(shí)別[J]. 馬鈺錫,譚勵(lì),董旭,于重重. 中國(guó)圖象圖形學(xué)報(bào). 2019(02)
[2]基于深度學(xué)習(xí)的人體行為識(shí)別算法綜述[J]. 朱煜,趙江坤,王逸寧,鄭兵兵. 自動(dòng)化學(xué)報(bào). 2016(06)
本文編號(hào):3088941
本文鏈接:http://www.sikaile.net/kejilunwen/daoluqiaoliang/3088941.html
最近更新
教材專著