基于深度學(xué)習(xí)的聲吶圖像目標(biāo)識(shí)別
發(fā)布時(shí)間:2021-02-18 17:02
聲吶是用聲波探測(cè)海洋的主要設(shè)備,自誕生以來,一直作為水下信息探測(cè)、定位和通信的主要工具。獲取的聲吶數(shù)據(jù)以圖像的形式將目標(biāo)信息顯示出來,由于受海洋信道的影響和接收基陣的限制,聲吶圖像的處理缺乏完全可靠的模型方法。深度學(xué)習(xí)在近年來廣泛應(yīng)用于圖像識(shí)別和目標(biāo)識(shí)別領(lǐng)域,本文基于聲吶圖像的主要特征表現(xiàn),提出一種基于卷積神經(jīng)網(wǎng)絡(luò)的聲吶圖像目標(biāo)識(shí)別方法。使用中值濾波對(duì)聲吶圖像進(jìn)行濾波處理,隨后選用Canny邊緣檢測(cè)算法和霍夫變換進(jìn)行白線檢測(cè),基于自適應(yīng)閾值化圖像分割算法分割出的目標(biāo),選用卡爾曼濾波器方法實(shí)現(xiàn)目標(biāo)跟蹤。最后對(duì)于跟蹤的目標(biāo)選用卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行分類識(shí)別,對(duì)不同的聲吶圖像目標(biāo)獲得了較高的識(shí)別準(zhǔn)確率。
【文章來源】:艦船科學(xué)技術(shù). 2020,42(23)北大核心
【文章頁(yè)數(shù)】:4 頁(yè)
【部分圖文】:
Canny邊緣檢測(cè)效果示意圖Fig.1SchematicdiagramofCannyedgedetectioneffect有通過它的直線來得到一條正弦
層的層數(shù),采用“擴(kuò)張-深度卷積-壓縮”的思想,首先經(jīng)過卷積核對(duì)輸入數(shù)據(jù)進(jìn)行特征維數(shù)放大,然后經(jīng)過深度卷積進(jìn)行特征提取,最后經(jīng)過的點(diǎn)卷積將放大的特征維數(shù)壓縮回去,解決了特征提取受限于輸入通道數(shù)的問題。LinearBottleneck模塊將全連接層之后的激活函數(shù)由ReLU替換為線性激活函數(shù),而其他層的激活函數(shù)依然是ReLU函數(shù),通過將非線性激活變換為線性激活來捕獲興趣流形,解決低維激活空間的信息損失問題。2個(gè)模塊結(jié)合構(gòu)成了MobileNet_V2網(wǎng)絡(luò)的基本架構(gòu),如圖3所示。圖3MobileNet_V2網(wǎng)絡(luò)微結(jié)構(gòu)Fig.3MobileNet_V2networkmicrostructure5基于卷積神經(jīng)網(wǎng)絡(luò)的聲吶圖像目標(biāo)識(shí)別方法本文基于聲吶圖像的主要特征表現(xiàn)及深度學(xué)習(xí)算法,對(duì)聲吶圖像目標(biāo)識(shí)別提出如下處理方法:1)對(duì)聲吶圖像使用中值濾波去除多余噪聲,進(jìn)行Canny邊緣檢測(cè)算法識(shí)別白線提取邊緣,然后使用霍夫變換提取直線,通過直線交點(diǎn)求解扇形所在圓心;2)針對(duì)預(yù)處理后的聲吶圖像,使用自適應(yīng)閾值化算法進(jìn)行圖像分割,同時(shí)利用分水嶺算法連接灰度相近的目標(biāo),查找分割圖像中的連通區(qū)域,獲得目標(biāo)信息;3)根據(jù)提取得到的目標(biāo)信息,通過匹配算法與卡爾曼濾波器得到的上一幀預(yù)測(cè)結(jié)果進(jìn)行匹配,根據(jù)匹配得到的測(cè)量值更新卡爾曼濾波器來實(shí)現(xiàn)跟蹤目標(biāo);4)將跟蹤得到的目標(biāo)圖像數(shù)據(jù)輸入卷積神經(jīng)網(wǎng)絡(luò),自動(dòng)提取特征進(jìn)行聲吶圖像目標(biāo)識(shí)別。將跟蹤結(jié)果中的目標(biāo)圖片提取出來作為數(shù)據(jù)集,并采用隨機(jī)反轉(zhuǎn)、旋轉(zhuǎn)、亮度變化等方法來擴(kuò)充數(shù)據(jù)集,以防止由于數(shù)據(jù)量太小帶來的過擬合。訓(xùn)練環(huán)境是在Ubuntu系統(tǒng)中,基于Python3.7.2的PyTorch1.2,配置GPU所使用的環(huán)境是CUDA10.0和Cudnn7.6.2。采用
【參考文獻(xiàn)】:
期刊論文
[1]一種基于自適應(yīng)閾值的圖像分割算法[J]. 王茜,彭中,劉莉. 北京理工大學(xué)學(xué)報(bào). 2003(04)
本文編號(hào):3039837
【文章來源】:艦船科學(xué)技術(shù). 2020,42(23)北大核心
【文章頁(yè)數(shù)】:4 頁(yè)
【部分圖文】:
Canny邊緣檢測(cè)效果示意圖Fig.1SchematicdiagramofCannyedgedetectioneffect有通過它的直線來得到一條正弦
層的層數(shù),采用“擴(kuò)張-深度卷積-壓縮”的思想,首先經(jīng)過卷積核對(duì)輸入數(shù)據(jù)進(jìn)行特征維數(shù)放大,然后經(jīng)過深度卷積進(jìn)行特征提取,最后經(jīng)過的點(diǎn)卷積將放大的特征維數(shù)壓縮回去,解決了特征提取受限于輸入通道數(shù)的問題。LinearBottleneck模塊將全連接層之后的激活函數(shù)由ReLU替換為線性激活函數(shù),而其他層的激活函數(shù)依然是ReLU函數(shù),通過將非線性激活變換為線性激活來捕獲興趣流形,解決低維激活空間的信息損失問題。2個(gè)模塊結(jié)合構(gòu)成了MobileNet_V2網(wǎng)絡(luò)的基本架構(gòu),如圖3所示。圖3MobileNet_V2網(wǎng)絡(luò)微結(jié)構(gòu)Fig.3MobileNet_V2networkmicrostructure5基于卷積神經(jīng)網(wǎng)絡(luò)的聲吶圖像目標(biāo)識(shí)別方法本文基于聲吶圖像的主要特征表現(xiàn)及深度學(xué)習(xí)算法,對(duì)聲吶圖像目標(biāo)識(shí)別提出如下處理方法:1)對(duì)聲吶圖像使用中值濾波去除多余噪聲,進(jìn)行Canny邊緣檢測(cè)算法識(shí)別白線提取邊緣,然后使用霍夫變換提取直線,通過直線交點(diǎn)求解扇形所在圓心;2)針對(duì)預(yù)處理后的聲吶圖像,使用自適應(yīng)閾值化算法進(jìn)行圖像分割,同時(shí)利用分水嶺算法連接灰度相近的目標(biāo),查找分割圖像中的連通區(qū)域,獲得目標(biāo)信息;3)根據(jù)提取得到的目標(biāo)信息,通過匹配算法與卡爾曼濾波器得到的上一幀預(yù)測(cè)結(jié)果進(jìn)行匹配,根據(jù)匹配得到的測(cè)量值更新卡爾曼濾波器來實(shí)現(xiàn)跟蹤目標(biāo);4)將跟蹤得到的目標(biāo)圖像數(shù)據(jù)輸入卷積神經(jīng)網(wǎng)絡(luò),自動(dòng)提取特征進(jìn)行聲吶圖像目標(biāo)識(shí)別。將跟蹤結(jié)果中的目標(biāo)圖片提取出來作為數(shù)據(jù)集,并采用隨機(jī)反轉(zhuǎn)、旋轉(zhuǎn)、亮度變化等方法來擴(kuò)充數(shù)據(jù)集,以防止由于數(shù)據(jù)量太小帶來的過擬合。訓(xùn)練環(huán)境是在Ubuntu系統(tǒng)中,基于Python3.7.2的PyTorch1.2,配置GPU所使用的環(huán)境是CUDA10.0和Cudnn7.6.2。采用
【參考文獻(xiàn)】:
期刊論文
[1]一種基于自適應(yīng)閾值的圖像分割算法[J]. 王茜,彭中,劉莉. 北京理工大學(xué)學(xué)報(bào). 2003(04)
本文編號(hào):3039837
本文鏈接:http://www.sikaile.net/kejilunwen/chuanbolw/3039837.html
最近更新
教材專著