基于卷積神經(jīng)網(wǎng)絡(luò)的車輛行人檢測(cè)模型的研究
發(fā)布時(shí)間:2021-02-04 14:08
交通場(chǎng)景的目標(biāo)檢測(cè)在智能交通、輔助駕駛、自動(dòng)駕駛等領(lǐng)域有著非常廣泛的應(yīng)用。其中,在輔助駕駛和自動(dòng)駕駛的領(lǐng)域,對(duì)目標(biāo)檢測(cè)模型的精度以及實(shí)時(shí)性都有著相當(dāng)高的要求。另外,不同于智能交通場(chǎng)景中的位置高、視野廣的攝像頭,輔助駕駛和自動(dòng)駕駛所用的車載攝像頭一般位置相對(duì)較低,視野相對(duì)較窄,因此拍攝到的畫面中會(huì)出現(xiàn)更多的部分被遮擋的目標(biāo),更難檢測(cè)。并且遠(yuǎn)近尺度變化、不同的光照條件也給檢測(cè)系統(tǒng)的穩(wěn)定性帶來了挑戰(zhàn)。隨著深度學(xué)習(xí)硬件算力的逐年提高,模型的實(shí)時(shí)性的要求會(huì)越來越容易被滿足。只要能達(dá)到更高的目標(biāo)檢測(cè)精度,更深的卷積神經(jīng)網(wǎng)絡(luò)模型就一定會(huì)逐漸被用于新型的智能駕駛汽車上。而對(duì)于智能交通這樣不那么依賴目標(biāo)檢測(cè)實(shí)時(shí)性的場(chǎng)景,對(duì)模型檢測(cè)精度的提高就更為富有意義。本文使用了基于YOLOv3的全卷積神經(jīng)網(wǎng)絡(luò)模型,使用了多尺度融合特征在多個(gè)尺度的特征圖上進(jìn)行了目標(biāo)檢測(cè)。訓(xùn)練出的車輛、行人檢測(cè)模型在KITTI數(shù)據(jù)集上取得了較高的檢測(cè)精度并具有相當(dāng)不錯(cuò)的實(shí)時(shí)性。另外,針對(duì)數(shù)據(jù)集中的樣本不平衡問題,本文提出了類從屬的k-means聚類算法。算法在聚類生成先驗(yàn)候選框時(shí),利用邊界框?qū)挾、高度和類別三個(gè)維度的信息,消除了樣本不...
【文章來源】:重慶郵電大學(xué)重慶市
【文章頁(yè)數(shù)】:84 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
GoogleWaymoOne自動(dòng)駕駛叫車服務(wù)
內(nèi)外研究現(xiàn)狀統(tǒng)的目標(biāo)檢測(cè)算法一般需要先使用滑動(dòng)窗口的方法(如 selective search[9ness[10])進(jìn)行候選框的篩選,再使用特征提取模型提取出預(yù)先設(shè)計(jì)好的特SIFT[11]、HOG[12]),最后再將提取到的特征放進(jìn)分類器進(jìn)行分類。這樣的多缺陷,首先多級(jí)串聯(lián)的傳統(tǒng)方法的精度受到區(qū)域建議方法、特征提取類模型各自精度的制約。舉個(gè)例子,如果使用的區(qū)域建議方法不夠好,一步,就會(huì)漏檢測(cè)或者給出不準(zhǔn)確的區(qū)域候選框,那么無(wú)論特征提取模模型有多好,都無(wú)法取得較好的結(jié)果。對(duì)于這樣的方法,其最終結(jié)果往一環(huán)決定,而且每個(gè)環(huán)節(jié)之間相互影響,有時(shí)候三個(gè)精度較高的方法組最后的結(jié)果卻不如預(yù)期。并且特征提取模型提取的特征都是預(yù)先設(shè)計(jì)好難以想到新的特征時(shí),就會(huì)用多種特征進(jìn)行組合,此時(shí)整個(gè)模型的計(jì)算倍的增加,而效果的提升往往微乎其微。
圖 1.3 感興趣區(qū)域池化層示例傳統(tǒng)的池化層根據(jù)預(yù)先設(shè)定的尺寸和步長(zhǎng),對(duì)尺寸各異的輸入進(jìn)行池化,獲得尺寸各異的輸出。而感興趣區(qū)域池化層則是對(duì)尺寸各異的特征圖使用不同的參數(shù),以獲得相同尺寸的輸出。如圖 1.3 所示,如果設(shè)定感興趣區(qū)域池化層的輸出尺寸為2 2,那么對(duì)一個(gè)尺寸為 4 4的輸入,感興趣區(qū)域池化層則會(huì)自動(dòng)使用寬度、高度尺寸均為 2,橫向縱向步長(zhǎng)均為 2 的參數(shù),以獲得2 2的輸出。而對(duì)于一個(gè)尺寸為6 4的輸入,感興趣區(qū)域池化層則會(huì)采取寬度尺寸、橫向步長(zhǎng)為 3,高度尺寸、縱向步長(zhǎng)為 2 的參數(shù),以保證輸出的尺寸為2 2。Fast RCNN 共享了大量的前向計(jì)算,但其區(qū)域候選框還是來自于選擇性搜索算法,網(wǎng)絡(luò)整體運(yùn)行速度因此受到了限制,并且檢測(cè)精度也難以繼續(xù)提高。不同于仍舊采用選擇性搜索獲得區(qū)域候選框的 Fast RCNN,改進(jìn)的 FasterRCNN模型使用了區(qū)域建議網(wǎng)絡(luò)(Region Proposal Network, RPN)進(jìn)行了區(qū)域候選框
本文編號(hào):3018437
【文章來源】:重慶郵電大學(xué)重慶市
【文章頁(yè)數(shù)】:84 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
GoogleWaymoOne自動(dòng)駕駛叫車服務(wù)
內(nèi)外研究現(xiàn)狀統(tǒng)的目標(biāo)檢測(cè)算法一般需要先使用滑動(dòng)窗口的方法(如 selective search[9ness[10])進(jìn)行候選框的篩選,再使用特征提取模型提取出預(yù)先設(shè)計(jì)好的特SIFT[11]、HOG[12]),最后再將提取到的特征放進(jìn)分類器進(jìn)行分類。這樣的多缺陷,首先多級(jí)串聯(lián)的傳統(tǒng)方法的精度受到區(qū)域建議方法、特征提取類模型各自精度的制約。舉個(gè)例子,如果使用的區(qū)域建議方法不夠好,一步,就會(huì)漏檢測(cè)或者給出不準(zhǔn)確的區(qū)域候選框,那么無(wú)論特征提取模模型有多好,都無(wú)法取得較好的結(jié)果。對(duì)于這樣的方法,其最終結(jié)果往一環(huán)決定,而且每個(gè)環(huán)節(jié)之間相互影響,有時(shí)候三個(gè)精度較高的方法組最后的結(jié)果卻不如預(yù)期。并且特征提取模型提取的特征都是預(yù)先設(shè)計(jì)好難以想到新的特征時(shí),就會(huì)用多種特征進(jìn)行組合,此時(shí)整個(gè)模型的計(jì)算倍的增加,而效果的提升往往微乎其微。
圖 1.3 感興趣區(qū)域池化層示例傳統(tǒng)的池化層根據(jù)預(yù)先設(shè)定的尺寸和步長(zhǎng),對(duì)尺寸各異的輸入進(jìn)行池化,獲得尺寸各異的輸出。而感興趣區(qū)域池化層則是對(duì)尺寸各異的特征圖使用不同的參數(shù),以獲得相同尺寸的輸出。如圖 1.3 所示,如果設(shè)定感興趣區(qū)域池化層的輸出尺寸為2 2,那么對(duì)一個(gè)尺寸為 4 4的輸入,感興趣區(qū)域池化層則會(huì)自動(dòng)使用寬度、高度尺寸均為 2,橫向縱向步長(zhǎng)均為 2 的參數(shù),以獲得2 2的輸出。而對(duì)于一個(gè)尺寸為6 4的輸入,感興趣區(qū)域池化層則會(huì)采取寬度尺寸、橫向步長(zhǎng)為 3,高度尺寸、縱向步長(zhǎng)為 2 的參數(shù),以保證輸出的尺寸為2 2。Fast RCNN 共享了大量的前向計(jì)算,但其區(qū)域候選框還是來自于選擇性搜索算法,網(wǎng)絡(luò)整體運(yùn)行速度因此受到了限制,并且檢測(cè)精度也難以繼續(xù)提高。不同于仍舊采用選擇性搜索獲得區(qū)域候選框的 Fast RCNN,改進(jìn)的 FasterRCNN模型使用了區(qū)域建議網(wǎng)絡(luò)(Region Proposal Network, RPN)進(jìn)行了區(qū)域候選框
本文編號(hào):3018437
本文鏈接:http://www.sikaile.net/kejilunwen/daoluqiaoliang/3018437.html
最近更新
教材專著