基于卷積神經(jīng)網(wǎng)絡的實時行人檢測
發(fā)布時間:2021-12-02 02:30
隨著計算科學和硬件設備的不斷發(fā)展,計算機視覺也取得了飛躍式的發(fā)展。從最初的需要消耗很多時間精力人工設定規(guī)則提取特征的傳統(tǒng)圖像處理方法到現(xiàn)在利用深度學習自動學習有用特征的方法,計算機視覺可謂是向前跨了一大步,就單在目標檢測這一項任務來看,檢測一張圖片中的目標所需要的時間從幾百毫秒減少到十幾毫秒,同時檢測精度也從百分之二十幾增加到百分之七八十。也正是因為計算機硬件的高速發(fā)展,計算機視覺可以廣泛的應用在現(xiàn)實項目中,比如人臉驗證、自動駕駛、智能視頻監(jiān)控等領(lǐng)域。在實際檢測場景中,行人檢測具有背景信息復雜,目標小等特點,導致檢測難度相對一般的目標檢測來說更加困難。因此,在實際場景應用中難以在保證時間效率的前提下提高檢測的準確率。為解決上述問題,本文提出了一些基于卷積神經(jīng)網(wǎng)絡的改進方法。本文提出了基于并行多種感受野特征提取的網(wǎng)絡用于實時行人檢測。首先,由于實際場景圖片中大多數(shù)為小目標,所以本文在特征提取的時候進行了一些改進,利用多個不同大小的感受野代替單一感受野的方法,使得網(wǎng)絡在特征提取的時候不是使用單一感受野,而是并行的使用多個不同感受野的卷積核提取行人目標更加豐富的多層次特征,有利于提高行人檢測...
【文章來源】:哈爾濱工業(yè)大學黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:58 頁
【學位級別】:碩士
【部分圖文】:
R-CNN的網(wǎng)絡結(jié)構(gòu)
3 Fast R-CNN軟研究院的 Ross B.Girshick 在 2015 年提出的 Fast R-CNN[38]在 SPP-N上進一步提升速度和準確率,其網(wǎng)絡結(jié)構(gòu)如圖 2-2 所示,設計了一種 R結(jié)構(gòu)來代替 SPP-Net 中的空間金字塔池化結(jié)構(gòu),ROI 池化層把候選框定大小的特征層,然后輸入到之后的全連接層中得到特征向量。
圖 2-3 RPN 網(wǎng)絡結(jié)構(gòu)黑色虛線方框為滑動框,在最后一個卷積層上滑動特征,在每個滑動窗口的位置生成 k 個 anchor(錨果不是很好,所以后面會接分類層和位置回歸層,出錨點框里有沒有目標,位置回歸中有 4k 個輸出,
本文編號:3527546
【文章來源】:哈爾濱工業(yè)大學黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:58 頁
【學位級別】:碩士
【部分圖文】:
R-CNN的網(wǎng)絡結(jié)構(gòu)
3 Fast R-CNN軟研究院的 Ross B.Girshick 在 2015 年提出的 Fast R-CNN[38]在 SPP-N上進一步提升速度和準確率,其網(wǎng)絡結(jié)構(gòu)如圖 2-2 所示,設計了一種 R結(jié)構(gòu)來代替 SPP-Net 中的空間金字塔池化結(jié)構(gòu),ROI 池化層把候選框定大小的特征層,然后輸入到之后的全連接層中得到特征向量。
圖 2-3 RPN 網(wǎng)絡結(jié)構(gòu)黑色虛線方框為滑動框,在最后一個卷積層上滑動特征,在每個滑動窗口的位置生成 k 個 anchor(錨果不是很好,所以后面會接分類層和位置回歸層,出錨點框里有沒有目標,位置回歸中有 4k 個輸出,
本文編號:3527546
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/3527546.html
最近更新
教材專著