基于Faster R-CNN的目標(biāo)檢測(cè)模型研究與實(shí)現(xiàn)
發(fā)布時(shí)間:2021-09-25 08:02
目標(biāo)檢測(cè)是計(jì)算機(jī)視覺領(lǐng)域的一個(gè)基本任務(wù),已經(jīng)應(yīng)用于諸多現(xiàn)實(shí)應(yīng)用之中,如人臉識(shí)別、自動(dòng)駕駛、監(jiān)控安防等領(lǐng)域。目標(biāo)檢測(cè)通俗來說就是找到圖片中感興趣的區(qū)域,這些區(qū)域有不同的大小、不同的類別、不同的形狀,具有復(fù)雜性和多樣性,這無疑給目標(biāo)檢測(cè)帶來巨大的困難。隨著深度學(xué)習(xí)的崛起,目標(biāo)檢測(cè)有了新的方向。時(shí)至今日,深度學(xué)習(xí)時(shí)代的目標(biāo)檢測(cè)算法雖已全面超越傳統(tǒng)算法,但仍然有很多問題沒有解決。本文梳理了深度學(xué)習(xí)時(shí)代目標(biāo)檢測(cè)技術(shù)的演變和發(fā)展,深度剖析了Faster R-CNN、R-FCN、FPN等具有代表性的目標(biāo)檢測(cè)模型的優(yōu)缺點(diǎn),主要在兩個(gè)問題上做了重點(diǎn)研究,小目標(biāo)檢測(cè)和如何獲取圖像的上下文關(guān)系以指導(dǎo)檢測(cè)。小目標(biāo)檢測(cè)一直是目標(biāo)檢測(cè)的難點(diǎn),具有特征少、數(shù)量多的特點(diǎn)。通常解決小目標(biāo)需要多尺度目標(biāo)檢測(cè)技術(shù),但現(xiàn)有框架在使用多尺度檢測(cè)技術(shù)上往往犧牲了圖像的高級(jí)語義,而圖像的高級(jí)語義對(duì)目標(biāo)檢測(cè)來說是及其重要的。本文在不犧牲圖像語義的基礎(chǔ)上于Faster R-CNN框架上構(gòu)建了一套多尺度檢測(cè)方案,以不同規(guī)模的卷積處理不同規(guī)模的候選提案,并在梯度下降時(shí)加以篩選。實(shí)驗(yàn)證明本文所述多尺度檢測(cè)方案可以顯著提升目標(biāo)檢測(cè)準(zhǔn)確率,在c...
【文章來源】:天津工業(yè)大學(xué)天津市
【文章頁數(shù)】:62 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
FasterR-CNN結(jié)構(gòu)圖
第二章目標(biāo)檢測(cè)算法分析9圖送給RPN網(wǎng)絡(luò),自此進(jìn)入RPN階段,特征圖也可以看做特征向量。隨后特征圖經(jīng)過一個(gè)3*3的卷積,得到一個(gè)13*13*256的特征圖,然后經(jīng)過兩次1*1的卷積,分別得到13*13*(2*9)、13*13*(4*9)的特征圖,前者用來表示候選框背景和前景的得分,后者主要用來邊框回歸,至此再結(jié)合之前預(yù)定義的錨點(diǎn)(Anchors),經(jīng)過非極大值抑制(NMS)方法得到候選框[44]。RPN執(zhí)行粗略的分類操作和邊框回歸操作,將初期篩選的結(jié)果送給RoiPooling層,然后由RoiPooling層執(zhí)行更精確的分類操作和邊框回歸操作,圖2-2就是RPN工作的示意圖。圖2-2RPN工作示意圖圖2-3RPN計(jì)算方法具體將圖片經(jīng)過卷積神經(jīng)網(wǎng)絡(luò)得到高級(jí)抽象表示的特征圖后,經(jīng)過圖上的滑
第二章目標(biāo)檢測(cè)算法分析9圖送給RPN網(wǎng)絡(luò),自此進(jìn)入RPN階段,特征圖也可以看做特征向量。隨后特征圖經(jīng)過一個(gè)3*3的卷積,得到一個(gè)13*13*256的特征圖,然后經(jīng)過兩次1*1的卷積,分別得到13*13*(2*9)、13*13*(4*9)的特征圖,前者用來表示候選框背景和前景的得分,后者主要用來邊框回歸,至此再結(jié)合之前預(yù)定義的錨點(diǎn)(Anchors),經(jīng)過非極大值抑制(NMS)方法得到候選框[44]。RPN執(zhí)行粗略的分類操作和邊框回歸操作,將初期篩選的結(jié)果送給RoiPooling層,然后由RoiPooling層執(zhí)行更精確的分類操作和邊框回歸操作,圖2-2就是RPN工作的示意圖。圖2-2RPN工作示意圖圖2-3RPN計(jì)算方法具體將圖片經(jīng)過卷積神經(jīng)網(wǎng)絡(luò)得到高級(jí)抽象表示的特征圖后,經(jīng)過圖上的滑
本文編號(hào):3409392
【文章來源】:天津工業(yè)大學(xué)天津市
【文章頁數(shù)】:62 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
FasterR-CNN結(jié)構(gòu)圖
第二章目標(biāo)檢測(cè)算法分析9圖送給RPN網(wǎng)絡(luò),自此進(jìn)入RPN階段,特征圖也可以看做特征向量。隨后特征圖經(jīng)過一個(gè)3*3的卷積,得到一個(gè)13*13*256的特征圖,然后經(jīng)過兩次1*1的卷積,分別得到13*13*(2*9)、13*13*(4*9)的特征圖,前者用來表示候選框背景和前景的得分,后者主要用來邊框回歸,至此再結(jié)合之前預(yù)定義的錨點(diǎn)(Anchors),經(jīng)過非極大值抑制(NMS)方法得到候選框[44]。RPN執(zhí)行粗略的分類操作和邊框回歸操作,將初期篩選的結(jié)果送給RoiPooling層,然后由RoiPooling層執(zhí)行更精確的分類操作和邊框回歸操作,圖2-2就是RPN工作的示意圖。圖2-2RPN工作示意圖圖2-3RPN計(jì)算方法具體將圖片經(jīng)過卷積神經(jīng)網(wǎng)絡(luò)得到高級(jí)抽象表示的特征圖后,經(jīng)過圖上的滑
第二章目標(biāo)檢測(cè)算法分析9圖送給RPN網(wǎng)絡(luò),自此進(jìn)入RPN階段,特征圖也可以看做特征向量。隨后特征圖經(jīng)過一個(gè)3*3的卷積,得到一個(gè)13*13*256的特征圖,然后經(jīng)過兩次1*1的卷積,分別得到13*13*(2*9)、13*13*(4*9)的特征圖,前者用來表示候選框背景和前景的得分,后者主要用來邊框回歸,至此再結(jié)合之前預(yù)定義的錨點(diǎn)(Anchors),經(jīng)過非極大值抑制(NMS)方法得到候選框[44]。RPN執(zhí)行粗略的分類操作和邊框回歸操作,將初期篩選的結(jié)果送給RoiPooling層,然后由RoiPooling層執(zhí)行更精確的分類操作和邊框回歸操作,圖2-2就是RPN工作的示意圖。圖2-2RPN工作示意圖圖2-3RPN計(jì)算方法具體將圖片經(jīng)過卷積神經(jīng)網(wǎng)絡(luò)得到高級(jí)抽象表示的特征圖后,經(jīng)過圖上的滑
本文編號(hào):3409392
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3409392.html
最近更新
教材專著