天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 自動(dòng)化論文 >

基于注意力機(jī)制的深度學(xué)習(xí)目標(biāo)檢測(cè)算法的研究

發(fā)布時(shí)間:2021-02-27 07:41
  目標(biāo)檢測(cè)探討如何精確的定位并分類物體,它是計(jì)算機(jī)視覺中的一個(gè)重要研究范疇。目標(biāo)檢測(cè)作為基礎(chǔ)性的識(shí)別研究,對(duì)后續(xù)的行人檢測(cè)、人臉識(shí)別、自動(dòng)駕駛等研究都有著至關(guān)重要的影響。雖然關(guān)于目標(biāo)檢測(cè)的研究由來已久,然而依然存在著許多關(guān)鍵問題亟待解決,例如小目標(biāo)的檢測(cè)精度普遍不高、重疊物體檢測(cè)困難、一階段目標(biāo)檢測(cè)算法精度較差、實(shí)時(shí)目標(biāo)檢測(cè)精度與速度的平衡等。本篇論文提出了基于注意力機(jī)制的深度學(xué)習(xí)算法來進(jìn)行目標(biāo)檢測(cè),注意力機(jī)制對(duì)提取的特征進(jìn)行了有針對(duì)性的加權(quán),讓目標(biāo)檢測(cè)更加具有目的性,輸出的特征更具有顯著性。設(shè)計(jì)并訓(xùn)練了一個(gè)新穎的三分支目標(biāo)檢測(cè)模型——TBANet,包含空間網(wǎng)絡(luò)、語義網(wǎng)絡(luò)和上下文網(wǎng)絡(luò),達(dá)到空間細(xì)節(jié)信息、多級(jí)語義信息、上下文信息的高質(zhì)量的獲取,從而實(shí)現(xiàn)了精確的目標(biāo)檢測(cè)。本文針對(duì)注意力機(jī)制進(jìn)行深入研究。首先介紹了注意力機(jī)制、多分支網(wǎng)絡(luò)和網(wǎng)絡(luò)主干網(wǎng)的研究現(xiàn)狀。然后對(duì)卷積神經(jīng)網(wǎng)絡(luò)、目標(biāo)檢測(cè)算法、注意力機(jī)制的理論進(jìn)行敘述。之后說明了各種注意力模塊和空間金字塔池化模塊的設(shè)計(jì),并進(jìn)行了對(duì)比實(shí)驗(yàn),通過實(shí)驗(yàn)說明了所設(shè)計(jì)模塊的作用及有效性。所提出的算法在PASCAL VOC 2007測(cè)試數(shù)據(jù)集上獲得了83.... 

【文章來源】:內(nèi)蒙古大學(xué)內(nèi)蒙古自治區(qū) 211工程院校

【文章頁數(shù)】:58 頁

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于注意力機(jī)制的深度學(xué)習(xí)目標(biāo)檢測(cè)算法的研究


卷積操作示例圖

計(jì)算圖,示例,卷積,全連接


基于注意力機(jī)制的深度學(xué)習(xí)目標(biāo)檢測(cè)算法的研究8圖2.1卷積操作示例圖Figure2.1Samplediagramofconvolutionoperations池化層(PoolingLayer):卷積神經(jīng)網(wǎng)絡(luò)在某個(gè)位置學(xué)習(xí)到圖像的信息后,在別處都可以識(shí)別相應(yīng)的信息。但是單純的卷積操作堆疊,參數(shù)量龐大,占用大量資源。為了減少參數(shù)及防止出現(xiàn)過擬合(over-fitting),采用池化操作來對(duì)不同位置的特征進(jìn)行聚合統(tǒng)計(jì),計(jì)算圖像一個(gè)區(qū)域上的某個(gè)特定特征的平均值(或最大值)。使用頻率最多的池化操作有最大池化(maxpooling)和平均池化(meanpooling)。以最大池化為例,其過程如圖2.2所示。圖2.2最大池化操作示例圖Figure2.2Samplediagramofmaxpoolingoperations全連接層(FullyConnectedLayer):在卷積神經(jīng)網(wǎng)絡(luò)中,全連接層位于網(wǎng)絡(luò)的最后幾層,起著分類的作用,它的每個(gè)神經(jīng)元與其前一層的所有神經(jīng)元進(jìn)行全連接,其操作與傳統(tǒng)神經(jīng)網(wǎng)絡(luò)相同。由于全連接層的參數(shù)量大,現(xiàn)在有些研究用平均池化(meanpooling)或者用1×1卷積代替它。

網(wǎng)絡(luò)結(jié)構(gòu)圖,特征圖,卷積,思想


基于注意力機(jī)制的深度學(xué)習(xí)目標(biāo)檢測(cè)算法的研究10以原圖中這個(gè)區(qū)域的中心點(diǎn)來作為錨點(diǎn)(anchors)的中心點(diǎn)。并畫出每一個(gè)錨點(diǎn)框,這樣就產(chǎn)生了候選區(qū)域(錨點(diǎn)相當(dāng)于畫出候選區(qū)域的模板)。在每個(gè)滑動(dòng)窗口位置,同時(shí)預(yù)測(cè)多個(gè)候選區(qū)域,其中每個(gè)位置的最大數(shù)目表示為k。候選區(qū)域被輸入到一個(gè)回歸層(reglayer)和一個(gè)分類層(clslayer),回歸層用來給邊界框定位,分類層用來分類是不是目標(biāo)。RPN網(wǎng)絡(luò)結(jié)構(gòu)示意圖如圖2.4所示。圖2.4RPN網(wǎng)絡(luò)結(jié)構(gòu)圖Figure2.4RPNnetworkstructure2.2.2SSD目標(biāo)檢測(cè)算法針對(duì)FasterR-CNN檢測(cè)速度達(dá)不到實(shí)時(shí)和YOLO[41]精度不高的不足之處,WeiLiu等人提出了新的一階段目標(biāo)檢測(cè)算法SSD,該算法融入了錨點(diǎn)的思想,提出了默認(rèn)框(defaultboxes)方法,還借鑒了FasterR-CNN用卷積層做預(yù)測(cè)的思想(即RPN網(wǎng)絡(luò)的思想)。SSD算法采用了類似傳統(tǒng)圖像金字塔的思想,在網(wǎng)絡(luò)的不同位置均勻的對(duì)特征圖進(jìn)行抽樣,獲得不同長(zhǎng)寬比以及尺度的樣本,然后進(jìn)行分類和回歸。低層特征圖具有豐富細(xì)節(jié)信息,而高層則有更多的高級(jí)語義信息。因此,靠前的特征圖利于檢測(cè)小物體,靠后的則利于大物體的檢測(cè)。SSD的主干網(wǎng)是16層的VGG,把原主干網(wǎng)的最后兩個(gè)全連接層改為了卷積層,同時(shí)在后面增加4個(gè)卷積層,利于后續(xù)提取多尺度的特征圖樣本。SSD的網(wǎng)絡(luò)結(jié)構(gòu)如圖2.5所示。圖2.5SSD網(wǎng)絡(luò)結(jié)構(gòu)圖Figure2.5SSDnetworkstructure

【參考文獻(xiàn)】:
期刊論文
[1]基于視覺的目標(biāo)檢測(cè)與跟蹤綜述[J]. 尹宏鵬,陳波,柴毅,劉兆棟.  自動(dòng)化學(xué)報(bào). 2016(10)
[2]人類視覺注意機(jī)制在目標(biāo)檢測(cè)中的應(yīng)用[J]. 桑農(nóng),李正龍,張?zhí)煨?  紅外與激光工程. 2004(01)



本文編號(hào):3053913

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/3053913.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶543ea***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com