關(guān)鍵點特征強化實例分割
發(fā)布時間:2021-01-11 10:05
目標檢測和目標分割是計算機視覺領(lǐng)域中兩個關(guān)系密切的研究方向。目標檢測的目的是將圖像中的物體檢測出來,而目標分割是將圖像中的物體的輪廓分割出來。語義分割是將一張圖片分割成不同種類的物體,每一種類可能包含多個相同屬性的物體。實例分割則是一種對圖像中每一個需要檢測的物體都進行單獨標注和分割的圖像分析方法。實例分割由于需要將每一個目標物體的輪廓標注出來,是一個研究難題。目前的研究在這一領(lǐng)域雖然取得了一定的進展,但是很難獲取具有復雜輪廓的物體的精確目標邊界。這是由于卷積神經(jīng)網(wǎng)絡(luò)中的下采樣和上采樣過程會損失物體邊界上的語義信息。所以本文研究設(shè)計了一種創(chuàng)新的方式,來更精確地分割圖像中的物體。主要工作如下:首先,本文針對目前最流行的幾種基于深度學習的目標檢測和實例分割算法,如MASK R-CNN、Yolo、Deep-lab等,進行了測試和研究。發(fā)現(xiàn)分割的誤差主要來源于物體的細小部分。因此本文提出了一種利用如角點等關(guān)鍵點特征來強化實例分割的方法;贛ASK R-CNN的標準網(wǎng)絡(luò),在網(wǎng)絡(luò)中加入真值關(guān)鍵點作為額外輸入,并且設(shè)計了一個關(guān)鍵點損失函數(shù)來改進對物體細小部分的漏檢。由于對真值標注的時間有限,本文在...
【文章來源】:中國科學院大學(中國科學院寧波材料技術(shù)與工程研究所)浙江省
【文章頁數(shù)】:79 頁
【學位級別】:碩士
【部分圖文】:
MASKR-CNN對復雜物體的分割結(jié)果
關(guān)鍵點特征強化實例分割4部分,但是本文認為一些物體的細小部分往往是對識別一個物體有比較重要意義的部分,比如細長的椅腿和鏤空車輪。傳統(tǒng)方法的分割誤差往往來自于細小部分。從下圖1.2,可以看出,椅子的上半?yún)^(qū)域,椅背和坐墊的分割誤差。幌掳?yún)^(qū)域,椅腿和扶手分割誤差大。圖1.2復雜物體的分割誤差分析Figure1.2Theerroranalysisofcomplexobjectssegmentation目前在實例分割領(lǐng)域,已經(jīng)有研究在傳統(tǒng)的像素特征以外,加入一些額外的信息來強化分割效果。這類方法主要有半卷積[3]、OpenPose[4]、AAF[5]、depth-awareCNN[6]、超像素[7]、輪廓融合[8]等。雖然這些方法的表現(xiàn)形式不同,是通過加入關(guān)節(jié)點、深度、標簽、超像素、輪廓等不同的知識,但是本文認為其都是一種特征強化的方法,是利用像素特征之外的知識來加強實例分割效果。特征強化主要是在網(wǎng)絡(luò)訓練的過程中,加入了像素特征之外的知識來強化網(wǎng)絡(luò)對某些特征的響應。這種強化可以通過多種方式加入,比如depth-awareCNN[6]是在卷積提取特征過程中加入深度特征;超像素是在卷積訓練網(wǎng)絡(luò)或者預測網(wǎng)絡(luò)輸入前進行超像素處理;OpenPose[4]、DensePose是在標注中加入關(guān)節(jié)點特征。相比傳統(tǒng)的通過像素特征,特征強化在一些特定的分割情景下能取得更加精確的分割結(jié)果。為了研究特征強化對實例分割的影響以及找到一種泛化性的特征強化實例分割方法,本文通過引入關(guān)鍵點特征來強化實例分割,提高了分割方法對復雜物體的分割精度。
關(guān)鍵點特征強化實例分割20圖2.1層級神經(jīng)網(wǎng)絡(luò)示意圖Figure2.1Hierarchicalneuralnetworkgraph圖2.2卷積神經(jīng)網(wǎng)絡(luò)的層級結(jié)構(gòu)Figure2.2Hierarchicalstructureofconvolutionalneuralnetworksgraph卷積神經(jīng)網(wǎng)絡(luò)的層級結(jié)構(gòu)基本由以下幾個部分組成:數(shù)據(jù)輸入層Inputlayer、卷積層convlayer、ReLU激勵層、池化層Poolinglayer、全連接層FClayer。1.數(shù)據(jù)輸入層:數(shù)據(jù)輸入層的主要作用是是輸入圖像數(shù)據(jù)進行預處理,一般包括以下三個部分:1.去均值:把輸入圖像數(shù)據(jù)的每個維度的中心坐標都變?yōu)?;2.歸一化:將每個維度的尺度大小歸一化到統(tǒng)一的標準尺度上,這樣可以降低計算過程中由于尺度大小不同帶來的影響;3.PCA和白化:PCA是一種降維操作,白化則是將輸入圖像數(shù)據(jù)在每個特征軸上進行的尺度歸一化。2.卷積計算層:卷積神經(jīng)網(wǎng)絡(luò)的命名就是來源于卷積計算層,這一層是卷積
【參考文獻】:
期刊論文
[1]圖像場景識別中深度學習方法綜述[J]. 宋杰,孟朝暉. 計算機測量與控制. 2018(01)
本文編號:2970573
【文章來源】:中國科學院大學(中國科學院寧波材料技術(shù)與工程研究所)浙江省
【文章頁數(shù)】:79 頁
【學位級別】:碩士
【部分圖文】:
MASKR-CNN對復雜物體的分割結(jié)果
關(guān)鍵點特征強化實例分割4部分,但是本文認為一些物體的細小部分往往是對識別一個物體有比較重要意義的部分,比如細長的椅腿和鏤空車輪。傳統(tǒng)方法的分割誤差往往來自于細小部分。從下圖1.2,可以看出,椅子的上半?yún)^(qū)域,椅背和坐墊的分割誤差。幌掳?yún)^(qū)域,椅腿和扶手分割誤差大。圖1.2復雜物體的分割誤差分析Figure1.2Theerroranalysisofcomplexobjectssegmentation目前在實例分割領(lǐng)域,已經(jīng)有研究在傳統(tǒng)的像素特征以外,加入一些額外的信息來強化分割效果。這類方法主要有半卷積[3]、OpenPose[4]、AAF[5]、depth-awareCNN[6]、超像素[7]、輪廓融合[8]等。雖然這些方法的表現(xiàn)形式不同,是通過加入關(guān)節(jié)點、深度、標簽、超像素、輪廓等不同的知識,但是本文認為其都是一種特征強化的方法,是利用像素特征之外的知識來加強實例分割效果。特征強化主要是在網(wǎng)絡(luò)訓練的過程中,加入了像素特征之外的知識來強化網(wǎng)絡(luò)對某些特征的響應。這種強化可以通過多種方式加入,比如depth-awareCNN[6]是在卷積提取特征過程中加入深度特征;超像素是在卷積訓練網(wǎng)絡(luò)或者預測網(wǎng)絡(luò)輸入前進行超像素處理;OpenPose[4]、DensePose是在標注中加入關(guān)節(jié)點特征。相比傳統(tǒng)的通過像素特征,特征強化在一些特定的分割情景下能取得更加精確的分割結(jié)果。為了研究特征強化對實例分割的影響以及找到一種泛化性的特征強化實例分割方法,本文通過引入關(guān)鍵點特征來強化實例分割,提高了分割方法對復雜物體的分割精度。
關(guān)鍵點特征強化實例分割20圖2.1層級神經(jīng)網(wǎng)絡(luò)示意圖Figure2.1Hierarchicalneuralnetworkgraph圖2.2卷積神經(jīng)網(wǎng)絡(luò)的層級結(jié)構(gòu)Figure2.2Hierarchicalstructureofconvolutionalneuralnetworksgraph卷積神經(jīng)網(wǎng)絡(luò)的層級結(jié)構(gòu)基本由以下幾個部分組成:數(shù)據(jù)輸入層Inputlayer、卷積層convlayer、ReLU激勵層、池化層Poolinglayer、全連接層FClayer。1.數(shù)據(jù)輸入層:數(shù)據(jù)輸入層的主要作用是是輸入圖像數(shù)據(jù)進行預處理,一般包括以下三個部分:1.去均值:把輸入圖像數(shù)據(jù)的每個維度的中心坐標都變?yōu)?;2.歸一化:將每個維度的尺度大小歸一化到統(tǒng)一的標準尺度上,這樣可以降低計算過程中由于尺度大小不同帶來的影響;3.PCA和白化:PCA是一種降維操作,白化則是將輸入圖像數(shù)據(jù)在每個特征軸上進行的尺度歸一化。2.卷積計算層:卷積神經(jīng)網(wǎng)絡(luò)的命名就是來源于卷積計算層,這一層是卷積
【參考文獻】:
期刊論文
[1]圖像場景識別中深度學習方法綜述[J]. 宋杰,孟朝暉. 計算機測量與控制. 2018(01)
本文編號:2970573
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/2970573.html
最近更新
教材專著