基于深度全卷積網(wǎng)絡的目標檢測方法研究
發(fā)布時間:2020-04-25 02:41
【摘要】:隨著互聯(lián)網(wǎng)技術的快速發(fā)展,目標檢測任務與人們的日常生活緊密地聯(lián)系在一起,該任務在道路監(jiān)控、醫(yī)療診斷以及視頻信息檢索等諸多領域都有廣泛的應用,因此,圖像目標檢測技術成為計算機視覺領域中的熱門研究方向。近幾年來,深度學習的出現(xiàn)使該領域的研究邁出了一大步,利用深度學習的目標檢測框架取得較好的檢測效果,卷積神經(jīng)網(wǎng)絡依靠其強大的特征提取能力,可以在保證較高準確率的情況下適應更多復雜的場景,當前主流算法可以歸為兩大類:基于候選區(qū)域的目標檢測算法,該算法存在檢測速度慢、過程繁瑣等問題,而另一種基于回歸的目標檢測算法是以犧牲精度為代價的,降低了算法的實用性。因此本文針對算法中存在的問題,結合基于區(qū)域和非區(qū)域目標檢測算法的優(yōu)點,提出改進方案。論文的主要工作如下:(1)針對檢測復雜背景下的目標和小尺度目標過程中存在的易漏檢問題,在基于候選區(qū)域的全卷積網(wǎng)絡目標檢測算法RFCN的基礎上進行改進,提出多尺度特征融合模型。該模型采用反向連接的方式對網(wǎng)絡中的多層卷積特征進行融合,并采用目標先驗減少樣本搜索空間,最終得到融合了低層高分辨率特征和高層豐富語義信息的更有利于描述目標的卷積特征。實驗結果表明,融合卷積特征的檢測模型有效提升了對背景復雜的目標和小尺度目標的檢測能力,同時兼顧目標檢測的速度。(2)針對候選區(qū)域框的回歸定位問題,本文提出二維損失函數(shù)來減少預測候選框和真實包圍框之間的損失,以保證對目標的精準定位。實驗結果證明了該損失函數(shù)有效實現(xiàn)了對目標的準確定位,這將更有助于小目標的檢測。(3)針對訓練過程中正負樣本的比例不平衡導致模型訓練收斂速度慢、模型泛化能力不強的問題,提出采用在線難例樣本挖掘算法對網(wǎng)絡模型進行優(yōu)化訓練。該算法能夠平衡訓練時所用正負樣本的比例,加快模型收斂速度的同時使得網(wǎng)絡訓練更加充分。經(jīng)過實驗驗證,改進后的網(wǎng)絡模型檢測精度有了明顯提高,在一定程度上解決了小目標易漏檢的問題。
【圖文】:
述目標檢測的研究背景及意義,然后對目前國內(nèi)外的研究現(xiàn)狀進行了分析,總結主要研究內(nèi)容,最后給出行文安排。1.1 研究背景與意義當前社會,隨著信息科技的快速發(fā)展,信息化越來越顯示出對經(jīng)濟社會發(fā)展的用,尤其是自媒體行業(yè)的異軍突起,使得媒體的傳播和交流方式產(chǎn)生了極為重大,,讓這場信息化戰(zhàn)略格局越發(fā)尖銳,而在這場戰(zhàn)略中,計算機視覺處理技術起著用。計算機視覺[2]是計算機通過攝像機或者電腦代替人眼,從外部獲取圖像信息感知,從而對目標進行識別跟蹤和定位,包括在復雜場景下的目標識別定位,即像中目標的位置和所屬類別。顯而易見,圖像的目標檢測在計算機視覺領域有著缺的作用,是處理視頻監(jiān)控[3]、行為分析[4]等復雜問題的基本途徑。圖像目標檢測的步驟是,對圖像進行預處理并提取圖像信息,最終判定目標的所屬類別并對其定圖 1-1 所示為圖像的目標檢測示意圖。
卷積神經(jīng)網(wǎng)絡本質上是一個由多層網(wǎng)絡組成的感知器,擅長通多一系列方法將圖片中的特征不斷降維,從中提取圖片信息完成檢測任務。一個基本的卷積神經(jīng)網(wǎng)絡通過卷積層與池化層的配合連接,組合成多個卷積組,逐層提取圖像中的特征,在最后連接若干個全連接層完成圖像的分類,達到目標檢測的功能。網(wǎng)絡中各類層用可微函數(shù)將激活數(shù)據(jù)從前一層傳到后一層,輸出模型參數(shù)和計算復雜度會受卷積核大小、池化層策略等的影響。卷積神經(jīng)網(wǎng)絡是針對二維形狀進行識別而特殊設計的神經(jīng)網(wǎng)絡,憑借獨特的局部連接和權值共享方式被成功應用于計算機視覺的各個領域,除此之外,還具有良好的平移、縮放及扭曲不變性,這些特性能夠大大減少網(wǎng)絡中的訓練參數(shù)。卷積神經(jīng)網(wǎng)絡的結構圖如圖 2-1 所示,通過該網(wǎng)絡最終輸出 10 個尺度大小為 5×5 的特征圖。網(wǎng)絡受局部感受野概念的啟發(fā)來模擬特征區(qū)分,并通過共享權值的卷積和池化來降低網(wǎng)絡參數(shù)的數(shù)量級,最終通過傳統(tǒng)神經(jīng)網(wǎng)絡完成檢測分類等任務。
【學位授予單位】:河南大學
【學位級別】:碩士
【學位授予年份】:2019
【分類號】:TP391.41;TP183
本文編號:2639700
【圖文】:
述目標檢測的研究背景及意義,然后對目前國內(nèi)外的研究現(xiàn)狀進行了分析,總結主要研究內(nèi)容,最后給出行文安排。1.1 研究背景與意義當前社會,隨著信息科技的快速發(fā)展,信息化越來越顯示出對經(jīng)濟社會發(fā)展的用,尤其是自媒體行業(yè)的異軍突起,使得媒體的傳播和交流方式產(chǎn)生了極為重大,,讓這場信息化戰(zhàn)略格局越發(fā)尖銳,而在這場戰(zhàn)略中,計算機視覺處理技術起著用。計算機視覺[2]是計算機通過攝像機或者電腦代替人眼,從外部獲取圖像信息感知,從而對目標進行識別跟蹤和定位,包括在復雜場景下的目標識別定位,即像中目標的位置和所屬類別。顯而易見,圖像的目標檢測在計算機視覺領域有著缺的作用,是處理視頻監(jiān)控[3]、行為分析[4]等復雜問題的基本途徑。圖像目標檢測的步驟是,對圖像進行預處理并提取圖像信息,最終判定目標的所屬類別并對其定圖 1-1 所示為圖像的目標檢測示意圖。
卷積神經(jīng)網(wǎng)絡本質上是一個由多層網(wǎng)絡組成的感知器,擅長通多一系列方法將圖片中的特征不斷降維,從中提取圖片信息完成檢測任務。一個基本的卷積神經(jīng)網(wǎng)絡通過卷積層與池化層的配合連接,組合成多個卷積組,逐層提取圖像中的特征,在最后連接若干個全連接層完成圖像的分類,達到目標檢測的功能。網(wǎng)絡中各類層用可微函數(shù)將激活數(shù)據(jù)從前一層傳到后一層,輸出模型參數(shù)和計算復雜度會受卷積核大小、池化層策略等的影響。卷積神經(jīng)網(wǎng)絡是針對二維形狀進行識別而特殊設計的神經(jīng)網(wǎng)絡,憑借獨特的局部連接和權值共享方式被成功應用于計算機視覺的各個領域,除此之外,還具有良好的平移、縮放及扭曲不變性,這些特性能夠大大減少網(wǎng)絡中的訓練參數(shù)。卷積神經(jīng)網(wǎng)絡的結構圖如圖 2-1 所示,通過該網(wǎng)絡最終輸出 10 個尺度大小為 5×5 的特征圖。網(wǎng)絡受局部感受野概念的啟發(fā)來模擬特征區(qū)分,并通過共享權值的卷積和池化來降低網(wǎng)絡參數(shù)的數(shù)量級,最終通過傳統(tǒng)神經(jīng)網(wǎng)絡完成檢測分類等任務。
【學位授予單位】:河南大學
【學位級別】:碩士
【學位授予年份】:2019
【分類號】:TP391.41;TP183
【參考文獻】
相關期刊論文 前1條
1 魏穎,佟國峰,史澤林,于海斌;一種基于多尺度分形新特征的目標檢測方法[J];東北大學學報;2005年11期
本文編號:2639700
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/2639700.html
最近更新
教材專著