基于深度學(xué)習(xí)的弱監(jiān)督圖像分割方法研究
發(fā)布時間:2021-06-26 06:38
圖像分割技術(shù)作為其他圖像處理方法的基礎(chǔ),一直是計算視覺研究的熱點與難點,其在場景解析、自動駕駛等領(lǐng)域發(fā)揮著重要的作用。隨著人工智能的興起,基于深度學(xué)習(xí)的圖像分割方法與早期方法相比有了質(zhì)的飛越,F(xiàn)有基于深度卷積神經(jīng)網(wǎng)絡(luò)的全監(jiān)督圖像分割方法均需要大量的像素級標(biāo)注來提升分割準(zhǔn)確率。因此該類方法需要耗費大量的時間和經(jīng)濟代價來獲取像素級標(biāo)注,從而制約分割性能的進一步提升和模型的泛化能力。為解決這一問題,國內(nèi)外很多學(xué)者嘗試放寬標(biāo)注的精確度,提出基于圖像級標(biāo)注的弱監(jiān)督圖像分割方法。圖像級標(biāo)注只包含圖像的類別信息,對于目標(biāo)的位置、輪廓等信息無任何指導(dǎo)性。本文從該研究的重點和難點入手,針對1)如何利用圖像級標(biāo)注獲取目標(biāo)的位置信息;2)如何獲取目標(biāo)的輪廓/形狀先驗;3)如何利用圖像級標(biāo)注訓(xùn)練分割網(wǎng)絡(luò)等問題展開深入的研究,各部分研究內(nèi)容及創(chuàng)新工作如下:針對傳統(tǒng)圖像分割方法只利用圖像底層特征,缺乏形狀先驗造成分割結(jié)果不理想的問題,提出基于形狀先驗的圖像前景目標(biāo)分割方法。該方法首先提出使用形狀的線性表示和FDCM(fast directional chamfer matching)形狀匹配算法生成更加準(zhǔn)確的且具...
【文章來源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:138 頁
【學(xué)位級別】:博士
【部分圖文】:
目標(biāo)輪廓及超像素
圖像語義分割是對圖像分割技術(shù)的一種提升。與傳統(tǒng)圖像分割相比,語義分割需要為圖像分割出的目標(biāo)或前景賦予預(yù)先定義的語義標(biāo)簽,從而實現(xiàn)圖像高層抽象語義信息表達的任務(wù)。隨著人工智能技術(shù)迅猛發(fā)展,深度卷積神經(jīng)網(wǎng)絡(luò)模型在圖像語義分割任務(wù)中也取得了較大的進步。本節(jié)將詳細(xì)介紹深度卷積神經(jīng)網(wǎng)絡(luò)的發(fā)展現(xiàn)狀;然后介紹全監(jiān)督條件下基于深度卷積神經(jīng)網(wǎng)絡(luò)的語義分割各方法的優(yōu)缺點;最后給出弱監(jiān)督條件下的語義分割方法研究現(xiàn)狀。1.3.1 深度卷積神經(jīng)網(wǎng)絡(luò)簡介
深度卷積神經(jīng)網(wǎng)絡(luò)(deep convolutional neural network,DCNN)是眾多深度神經(jīng)網(wǎng)絡(luò)中應(yīng)用最廣泛的一種,受生物視覺的認(rèn)知機制啟發(fā)而生,在計算機視覺問題上表現(xiàn)出優(yōu)秀的性能。1989年,LeCun等人確定了卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu),并且應(yīng)用到手寫字符識別中。DCNN是包含卷積運算的前饋神經(jīng)網(wǎng)絡(luò),通常由輸入層、卷積層、池化層、全連接層及輸出層構(gòu)成[68],而卷積層、池化層、全連接層被稱為隱含層。DCNN由輸入層輸入數(shù)據(jù),通過卷積層的共享權(quán)重進行卷積特征提取,輸出給池化層并進行池化運算,逐步得到各層特征,最后經(jīng)由全連接層和輸出層做針對任務(wù)的特征映射,其網(wǎng)絡(luò)結(jié)構(gòu)如圖1-4。卷積層(convolutional layer)為DCNN的核心,每個卷積層由若干個卷積核構(gòu)成,而卷積核的參數(shù)可以通過反向傳遞算法優(yōu)化得到。假設(shè)第l卷積層的特征輸入為xl-1,卷積核為kl,那么經(jīng)過卷積運算輸出的第j個通道的特征為:
【參考文獻】:
期刊論文
[1]基于深度學(xué)習(xí)的場景分割算法研究綜述[J]. 張蕊,李錦濤. 計算機研究與發(fā)展. 2020(04)
[2]基于深度學(xué)習(xí)的圖像語義分割方法綜述[J]. 田萱,王亮,丁琪. 軟件學(xué)報. 2019(02)
[3]基于局部-全局一致性學(xué)習(xí)的弱監(jiān)督人手分割[J]. 謝志堅,李寅霖,鄭碎武. 計算機應(yīng)用與軟件. 2019(01)
[4]醫(yī)學(xué)圖像分析深度學(xué)習(xí)方法研究與挑戰(zhàn)[J]. 田娟秀,劉國才,谷珊珊,鞠忠建,劉勁光,顧冬冬. 自動化學(xué)報. 2018(03)
[5]面向大規(guī)模圖像分類的深度卷積神經(jīng)網(wǎng)絡(luò)優(yōu)化[J]. 白琮,黃玲,陳佳楠,潘翔,陳勝勇. 軟件學(xué)報. 2018(04)
[6]深度學(xué)習(xí)認(rèn)知計算綜述[J]. 陳偉宏,安吉堯,李仁發(fā),李萬里. 自動化學(xué)報. 2017(11)
[7]深度學(xué)習(xí)在高光譜圖像分類領(lǐng)域的研究現(xiàn)狀與展望[J]. 張?zhí)栧?李映,姜曄楠. 自動化學(xué)報. 2018(06)
[8]深度卷積神經(jīng)網(wǎng)絡(luò)的發(fā)展及其在計算機視覺領(lǐng)域的應(yīng)用[J]. 張順,龔怡宏,王進軍. 計算機學(xué)報. 2019(03)
[9]面向知識自動化的自動問答研究進展[J]. 曾帥,王帥,袁勇,倪曉春,歐陽永基. 自動化學(xué)報. 2017(09)
[10]深度學(xué)習(xí)在目標(biāo)視覺檢測中的應(yīng)用進展與展望[J]. 張慧,王坤峰,王飛躍. 自動化學(xué)報. 2017(08)
本文編號:3250832
【文章來源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:138 頁
【學(xué)位級別】:博士
【部分圖文】:
目標(biāo)輪廓及超像素
圖像語義分割是對圖像分割技術(shù)的一種提升。與傳統(tǒng)圖像分割相比,語義分割需要為圖像分割出的目標(biāo)或前景賦予預(yù)先定義的語義標(biāo)簽,從而實現(xiàn)圖像高層抽象語義信息表達的任務(wù)。隨著人工智能技術(shù)迅猛發(fā)展,深度卷積神經(jīng)網(wǎng)絡(luò)模型在圖像語義分割任務(wù)中也取得了較大的進步。本節(jié)將詳細(xì)介紹深度卷積神經(jīng)網(wǎng)絡(luò)的發(fā)展現(xiàn)狀;然后介紹全監(jiān)督條件下基于深度卷積神經(jīng)網(wǎng)絡(luò)的語義分割各方法的優(yōu)缺點;最后給出弱監(jiān)督條件下的語義分割方法研究現(xiàn)狀。1.3.1 深度卷積神經(jīng)網(wǎng)絡(luò)簡介
深度卷積神經(jīng)網(wǎng)絡(luò)(deep convolutional neural network,DCNN)是眾多深度神經(jīng)網(wǎng)絡(luò)中應(yīng)用最廣泛的一種,受生物視覺的認(rèn)知機制啟發(fā)而生,在計算機視覺問題上表現(xiàn)出優(yōu)秀的性能。1989年,LeCun等人確定了卷積神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu),并且應(yīng)用到手寫字符識別中。DCNN是包含卷積運算的前饋神經(jīng)網(wǎng)絡(luò),通常由輸入層、卷積層、池化層、全連接層及輸出層構(gòu)成[68],而卷積層、池化層、全連接層被稱為隱含層。DCNN由輸入層輸入數(shù)據(jù),通過卷積層的共享權(quán)重進行卷積特征提取,輸出給池化層并進行池化運算,逐步得到各層特征,最后經(jīng)由全連接層和輸出層做針對任務(wù)的特征映射,其網(wǎng)絡(luò)結(jié)構(gòu)如圖1-4。卷積層(convolutional layer)為DCNN的核心,每個卷積層由若干個卷積核構(gòu)成,而卷積核的參數(shù)可以通過反向傳遞算法優(yōu)化得到。假設(shè)第l卷積層的特征輸入為xl-1,卷積核為kl,那么經(jīng)過卷積運算輸出的第j個通道的特征為:
【參考文獻】:
期刊論文
[1]基于深度學(xué)習(xí)的場景分割算法研究綜述[J]. 張蕊,李錦濤. 計算機研究與發(fā)展. 2020(04)
[2]基于深度學(xué)習(xí)的圖像語義分割方法綜述[J]. 田萱,王亮,丁琪. 軟件學(xué)報. 2019(02)
[3]基于局部-全局一致性學(xué)習(xí)的弱監(jiān)督人手分割[J]. 謝志堅,李寅霖,鄭碎武. 計算機應(yīng)用與軟件. 2019(01)
[4]醫(yī)學(xué)圖像分析深度學(xué)習(xí)方法研究與挑戰(zhàn)[J]. 田娟秀,劉國才,谷珊珊,鞠忠建,劉勁光,顧冬冬. 自動化學(xué)報. 2018(03)
[5]面向大規(guī)模圖像分類的深度卷積神經(jīng)網(wǎng)絡(luò)優(yōu)化[J]. 白琮,黃玲,陳佳楠,潘翔,陳勝勇. 軟件學(xué)報. 2018(04)
[6]深度學(xué)習(xí)認(rèn)知計算綜述[J]. 陳偉宏,安吉堯,李仁發(fā),李萬里. 自動化學(xué)報. 2017(11)
[7]深度學(xué)習(xí)在高光譜圖像分類領(lǐng)域的研究現(xiàn)狀與展望[J]. 張?zhí)栧?李映,姜曄楠. 自動化學(xué)報. 2018(06)
[8]深度卷積神經(jīng)網(wǎng)絡(luò)的發(fā)展及其在計算機視覺領(lǐng)域的應(yīng)用[J]. 張順,龔怡宏,王進軍. 計算機學(xué)報. 2019(03)
[9]面向知識自動化的自動問答研究進展[J]. 曾帥,王帥,袁勇,倪曉春,歐陽永基. 自動化學(xué)報. 2017(09)
[10]深度學(xué)習(xí)在目標(biāo)視覺檢測中的應(yīng)用進展與展望[J]. 張慧,王坤峰,王飛躍. 自動化學(xué)報. 2017(08)
本文編號:3250832
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/3250832.html
最近更新
教材專著