基于深度學習的圖像語義分割算法研究
發(fā)布時間:2021-01-24 20:09
基于深度學習的圖像語義分割算法可以提高圖像分割的精度,其優(yōu)越性遠大于傳統(tǒng)機器學習算法,主要體現(xiàn)在分割速度快和分割精度更精準。但是由于淺層網(wǎng)絡輸出的特征圖中信息主要為局部信息,深層網(wǎng)絡輸出的特征圖中主要為全局信息,經(jīng)常面臨著語義和位置信息不可兼得的問題。提出以Res Net-34為骨架,用遷移學習的方法在訓練好的網(wǎng)絡權(quán)重上進行微調(diào),使用跳躍連接將淺層特征與深層特征融合起來用以豐富特征圖的信息,同時引入注意力機制,使整個模型對圖像的不同位置有側(cè)重點,以此來提高分割的精度。通過在Cam Vid數(shù)據(jù)集上的實驗表明,該方法比傳統(tǒng)的全卷積網(wǎng)絡模型在分割準確率上有所提升。
【文章來源】:計算機應用研究. 2020,37(S2)北大核心
【文章頁數(shù)】:3 頁
【部分圖文】:
全卷積網(wǎng)絡結(jié)構(gòu)
2015年Ronneberger等人[9]提出了U-Net,其網(wǎng)絡結(jié)構(gòu)如圖2所示,在該網(wǎng)絡結(jié)構(gòu)中使用了編解碼器的概念。網(wǎng)絡左半部分使用卷積層與池化層進行下采樣,右半部分再使用反卷積同時上采樣。這種編解碼器結(jié)構(gòu)可以很好地提取特征,在醫(yī)療圖像分割中取得了不錯的成果,但是整個網(wǎng)絡仍然會產(chǎn)生梯度消失的現(xiàn)象,所以本文的模型使用殘差網(wǎng)絡來提取特征是十分有必要的。另外U-Net并沒有對輸入待分割的圖像有側(cè)重點,這使得訓練速度慢,并且不利于提升分割的精度。為了解決以上問題,本文使用注意力機制對圖像中需要分割的地方進行重點標記。2017年Badrinarayanan等人[10]提出Seg Net,其網(wǎng)絡結(jié)構(gòu)如圖3所示。該網(wǎng)絡同樣運用了編碼器/解碼器的方法,分別以兩個VGG網(wǎng)絡為編碼器和解碼器。編碼器進行特征提取,解碼器進行上采樣,同時也運用跳躍連接將上一次上采樣得到的特征圖與相對應的下采樣產(chǎn)生的特征圖融合之后再進行上采樣。但是面對如此深層的網(wǎng)絡,很容易產(chǎn)生梯度消失問題,本文模型在提取特征時使用殘差網(wǎng)絡以解決該問題。
2017年Badrinarayanan等人[10]提出Seg Net,其網(wǎng)絡結(jié)構(gòu)如圖3所示。該網(wǎng)絡同樣運用了編碼器/解碼器的方法,分別以兩個VGG網(wǎng)絡為編碼器和解碼器。編碼器進行特征提取,解碼器進行上采樣,同時也運用跳躍連接將上一次上采樣得到的特征圖與相對應的下采樣產(chǎn)生的特征圖融合之后再進行上采樣。但是面對如此深層的網(wǎng)絡,很容易產(chǎn)生梯度消失問題,本文模型在提取特征時使用殘差網(wǎng)絡以解決該問題。2019年Hu等人[11]提出了SENet,該網(wǎng)絡首次將注意力機制用于圖像分割并取得了不錯的效果,注意力機制網(wǎng)絡結(jié)構(gòu)如圖4所示。然而該方法忽視了一個重要問題就是圖像的全局信息與局部信息不可兼得,這就使得網(wǎng)絡提取到的特征圖缺乏淺層網(wǎng)絡所有的局部信息,導致在圖像分割時一些邊緣細節(jié)無法準確分割。本文在其特征提取網(wǎng)絡上進行改進,引入注意力機制使其更好地為圖像不同部分分配權(quán)重,使得整個網(wǎng)絡對圖像的側(cè)重點更明確;同時為了解決圖像的全局信息與局部信息不可兼得問題,使用跳躍連接將深層特征與淺層特征相融合,從而提升分割效果。
本文編號:2997856
【文章來源】:計算機應用研究. 2020,37(S2)北大核心
【文章頁數(shù)】:3 頁
【部分圖文】:
全卷積網(wǎng)絡結(jié)構(gòu)
2015年Ronneberger等人[9]提出了U-Net,其網(wǎng)絡結(jié)構(gòu)如圖2所示,在該網(wǎng)絡結(jié)構(gòu)中使用了編解碼器的概念。網(wǎng)絡左半部分使用卷積層與池化層進行下采樣,右半部分再使用反卷積同時上采樣。這種編解碼器結(jié)構(gòu)可以很好地提取特征,在醫(yī)療圖像分割中取得了不錯的成果,但是整個網(wǎng)絡仍然會產(chǎn)生梯度消失的現(xiàn)象,所以本文的模型使用殘差網(wǎng)絡來提取特征是十分有必要的。另外U-Net并沒有對輸入待分割的圖像有側(cè)重點,這使得訓練速度慢,并且不利于提升分割的精度。為了解決以上問題,本文使用注意力機制對圖像中需要分割的地方進行重點標記。2017年Badrinarayanan等人[10]提出Seg Net,其網(wǎng)絡結(jié)構(gòu)如圖3所示。該網(wǎng)絡同樣運用了編碼器/解碼器的方法,分別以兩個VGG網(wǎng)絡為編碼器和解碼器。編碼器進行特征提取,解碼器進行上采樣,同時也運用跳躍連接將上一次上采樣得到的特征圖與相對應的下采樣產(chǎn)生的特征圖融合之后再進行上采樣。但是面對如此深層的網(wǎng)絡,很容易產(chǎn)生梯度消失問題,本文模型在提取特征時使用殘差網(wǎng)絡以解決該問題。
2017年Badrinarayanan等人[10]提出Seg Net,其網(wǎng)絡結(jié)構(gòu)如圖3所示。該網(wǎng)絡同樣運用了編碼器/解碼器的方法,分別以兩個VGG網(wǎng)絡為編碼器和解碼器。編碼器進行特征提取,解碼器進行上采樣,同時也運用跳躍連接將上一次上采樣得到的特征圖與相對應的下采樣產(chǎn)生的特征圖融合之后再進行上采樣。但是面對如此深層的網(wǎng)絡,很容易產(chǎn)生梯度消失問題,本文模型在提取特征時使用殘差網(wǎng)絡以解決該問題。2019年Hu等人[11]提出了SENet,該網(wǎng)絡首次將注意力機制用于圖像分割并取得了不錯的效果,注意力機制網(wǎng)絡結(jié)構(gòu)如圖4所示。然而該方法忽視了一個重要問題就是圖像的全局信息與局部信息不可兼得,這就使得網(wǎng)絡提取到的特征圖缺乏淺層網(wǎng)絡所有的局部信息,導致在圖像分割時一些邊緣細節(jié)無法準確分割。本文在其特征提取網(wǎng)絡上進行改進,引入注意力機制使其更好地為圖像不同部分分配權(quán)重,使得整個網(wǎng)絡對圖像的側(cè)重點更明確;同時為了解決圖像的全局信息與局部信息不可兼得問題,使用跳躍連接將深層特征與淺層特征相融合,從而提升分割效果。
本文編號:2997856
本文鏈接:http://www.sikaile.net/jianzhugongchenglunwen/2997856.html
最近更新
教材專著