基于注意力卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測(cè)算法研究
發(fā)布時(shí)間:2022-08-08 15:58
隨著信息科技與網(wǎng)絡(luò)的迅猛發(fā)展,各種媒體數(shù)據(jù)也隨之海量增長(zhǎng),大量的視覺(jué)數(shù)據(jù)不斷涌現(xiàn)。為了更高效快速地應(yīng)用視覺(jué)數(shù)據(jù),許多研究者開(kāi)始系統(tǒng)地研究計(jì)算機(jī)視覺(jué)技術(shù)。目標(biāo)檢測(cè)作為計(jì)算機(jī)視覺(jué)的重要基礎(chǔ)任務(wù)之一,在視頻監(jiān)控、軍事觀測(cè)、醫(yī)療診斷及自動(dòng)駕駛等許多領(lǐng)域中均具有非常重要的理論及應(yīng)用價(jià)值,因而已逐漸成為計(jì)算機(jī)視覺(jué)及人工智能領(lǐng)域的一個(gè)熱點(diǎn)研究問(wèn)題。隨著學(xué)術(shù)及工業(yè)界對(duì)這一問(wèn)題的不斷研究,目標(biāo)檢測(cè)算法的檢測(cè)精度及速度已經(jīng)有了顯著性的提高,但在實(shí)際應(yīng)用中仍存在著不少挑戰(zhàn):現(xiàn)實(shí)場(chǎng)景中,采集到的圖像、視頻等往往不可避免存在復(fù)雜背景,例如,一些特殊背景與待檢目標(biāo)形態(tài)非常的相似,極易被誤判為待檢目標(biāo),這無(wú)疑會(huì)造成待檢目標(biāo)被錯(cuò)誤識(shí)別的概率增加;現(xiàn)實(shí)場(chǎng)景中,物體的分布雜亂以及觀察角度問(wèn)題,目標(biāo)物體可能會(huì)存在不同程度的遮擋,增加了漏檢的可能性;因拍攝距離和角度問(wèn)題,圖像中目標(biāo)的尺寸也存在著很大的差異,對(duì)于目標(biāo)區(qū)域定位的準(zhǔn)確性存著一定的影響。以上這些問(wèn)題均增加了檢測(cè)的難度,嚴(yán)重影響了檢測(cè)的性能。本文針對(duì)以上挑戰(zhàn)依次對(duì)目標(biāo)檢測(cè)算法進(jìn)行了研究,主要工作內(nèi)容及創(chuàng)新點(diǎn)概述如下:(1)針對(duì)圖像中的復(fù)雜背景干擾及遮擋造成的目標(biāo)被錯(cuò)檢...
【文章頁(yè)數(shù)】:56 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 課題研究背景及意義
1.2 目標(biāo)檢測(cè)算法研究現(xiàn)狀
1.2.1 傳統(tǒng)目標(biāo)檢測(cè)
1.2.2 基于深度學(xué)習(xí)的目標(biāo)檢測(cè)
1.3 主要研究?jī)?nèi)容
1.4 論文組織結(jié)構(gòu)
第2章 相關(guān)理論與技術(shù)
2.1 卷積神經(jīng)網(wǎng)絡(luò)
2.1.1 卷積神經(jīng)網(wǎng)絡(luò)簡(jiǎn)介
2.1.2 常用卷積神經(jīng)網(wǎng)絡(luò)模型
2.2 基于卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測(cè)
2.2.1 目標(biāo)檢測(cè)重要組件
2.2.2 目標(biāo)檢測(cè)基本流程
2.3 注意力機(jī)制
2.3.1 注意力機(jī)制簡(jiǎn)介
2.3.2 注意力機(jī)制的應(yīng)用
2.4 小結(jié)
第3章 復(fù)雜背景下的目標(biāo)檢測(cè)
3.1 引言
3.2 基于注意力機(jī)制和改進(jìn)NMS的輕量級(jí)目標(biāo)檢測(cè)
3.2.1 注意力模塊融合
3.2.2 改進(jìn)NMS
3.2.3 網(wǎng)絡(luò)輕量化
3.2.4 改進(jìn)ROI Pooling
3.3 實(shí)驗(yàn)結(jié)果和分析
3.3.1 數(shù)據(jù)集和評(píng)估指標(biāo)
3.3.2 實(shí)驗(yàn)參數(shù)設(shè)置
3.3.3 消融實(shí)驗(yàn)
3.3.4 對(duì)比現(xiàn)有方法
3.4 小結(jié)
第4章 多尺度目標(biāo)下的目標(biāo)檢測(cè)
4.1 引言
4.2 基于特征增強(qiáng)的多尺度目標(biāo)檢測(cè)
4.2.1 SSD模型
4.2.2 FPN模型
4.2.3 算法實(shí)現(xiàn)
4.3 實(shí)驗(yàn)結(jié)果與分析
4.3.1 數(shù)據(jù)集與評(píng)估措施
4.3.2 實(shí)驗(yàn)參數(shù)設(shè)置
4.3.3 消融實(shí)驗(yàn)
4.3.4 對(duì)比現(xiàn)有方法
4.4 本章小結(jié)
第5章 總結(jié)與展望
5.1 研究工作總結(jié)
5.2 研究展望
參考文獻(xiàn)
攻讀碩士學(xué)位期間的科研成果和其他獲獎(jiǎng)情況
致謝
【參考文獻(xiàn)】:
期刊論文
[1]深度學(xué)習(xí)及其在圖像物體分類(lèi)與檢測(cè)中的應(yīng)用綜述[J]. 劉棟,李素,曹志冬. 計(jì)算機(jī)科學(xué). 2016(12)
[2]卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J]. 李彥冬,郝宗波,雷航. 計(jì)算機(jī)應(yīng)用. 2016(09)
博士論文
[1]基于深度學(xué)習(xí)的圖像分類(lèi)[D]. 孫煒晨.北京郵電大學(xué) 2017
本文編號(hào):3671801
【文章頁(yè)數(shù)】:56 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 課題研究背景及意義
1.2 目標(biāo)檢測(cè)算法研究現(xiàn)狀
1.2.1 傳統(tǒng)目標(biāo)檢測(cè)
1.2.2 基于深度學(xué)習(xí)的目標(biāo)檢測(cè)
1.3 主要研究?jī)?nèi)容
1.4 論文組織結(jié)構(gòu)
第2章 相關(guān)理論與技術(shù)
2.1 卷積神經(jīng)網(wǎng)絡(luò)
2.1.1 卷積神經(jīng)網(wǎng)絡(luò)簡(jiǎn)介
2.1.2 常用卷積神經(jīng)網(wǎng)絡(luò)模型
2.2 基于卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測(cè)
2.2.1 目標(biāo)檢測(cè)重要組件
2.2.2 目標(biāo)檢測(cè)基本流程
2.3 注意力機(jī)制
2.3.1 注意力機(jī)制簡(jiǎn)介
2.3.2 注意力機(jī)制的應(yīng)用
2.4 小結(jié)
第3章 復(fù)雜背景下的目標(biāo)檢測(cè)
3.1 引言
3.2 基于注意力機(jī)制和改進(jìn)NMS的輕量級(jí)目標(biāo)檢測(cè)
3.2.1 注意力模塊融合
3.2.2 改進(jìn)NMS
3.2.3 網(wǎng)絡(luò)輕量化
3.2.4 改進(jìn)ROI Pooling
3.3 實(shí)驗(yàn)結(jié)果和分析
3.3.1 數(shù)據(jù)集和評(píng)估指標(biāo)
3.3.2 實(shí)驗(yàn)參數(shù)設(shè)置
3.3.3 消融實(shí)驗(yàn)
3.3.4 對(duì)比現(xiàn)有方法
3.4 小結(jié)
第4章 多尺度目標(biāo)下的目標(biāo)檢測(cè)
4.1 引言
4.2 基于特征增強(qiáng)的多尺度目標(biāo)檢測(cè)
4.2.1 SSD模型
4.2.2 FPN模型
4.2.3 算法實(shí)現(xiàn)
4.3 實(shí)驗(yàn)結(jié)果與分析
4.3.1 數(shù)據(jù)集與評(píng)估措施
4.3.2 實(shí)驗(yàn)參數(shù)設(shè)置
4.3.3 消融實(shí)驗(yàn)
4.3.4 對(duì)比現(xiàn)有方法
4.4 本章小結(jié)
第5章 總結(jié)與展望
5.1 研究工作總結(jié)
5.2 研究展望
參考文獻(xiàn)
攻讀碩士學(xué)位期間的科研成果和其他獲獎(jiǎng)情況
致謝
【參考文獻(xiàn)】:
期刊論文
[1]深度學(xué)習(xí)及其在圖像物體分類(lèi)與檢測(cè)中的應(yīng)用綜述[J]. 劉棟,李素,曹志冬. 計(jì)算機(jī)科學(xué). 2016(12)
[2]卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J]. 李彥冬,郝宗波,雷航. 計(jì)算機(jī)應(yīng)用. 2016(09)
博士論文
[1]基于深度學(xué)習(xí)的圖像分類(lèi)[D]. 孫煒晨.北京郵電大學(xué) 2017
本文編號(hào):3671801
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3671801.html
最近更新
教材專(zhuān)著