微弱聲信號(hào)的特征提取與辨識(shí)
發(fā)布時(shí)間:2021-01-01 04:40
由于計(jì)算機(jī)技術(shù)飛速發(fā)展以及聲信號(hào)辨識(shí)與定位技術(shù)的不斷完善,信息探測(cè)技術(shù)已經(jīng)成為當(dāng)今戰(zhàn)場(chǎng)中不能缺失的一部分,聲信號(hào)探測(cè)由于自己全天候、易隱蔽和探測(cè)性能好的優(yōu)點(diǎn),成為了各個(gè)國(guó)家研究的焦點(diǎn)。但是在真實(shí)探測(cè)中存在著強(qiáng)噪聲的影響,導(dǎo)致目標(biāo)聲信號(hào)變得“微弱”,難以辨識(shí)出當(dāng)今戰(zhàn)場(chǎng)中各種目標(biāo)聲信號(hào)。因此,展開對(duì)微弱聲信號(hào)降噪處理、特征提取以及辨識(shí)研究具有重要的現(xiàn)實(shí)意義,本文從預(yù)處理、特征提取以及微弱聲信號(hào)辨識(shí)三大部分進(jìn)行分析和設(shè)計(jì),構(gòu)建微弱聲信號(hào)辨識(shí)系統(tǒng)。(1)針對(duì)傳統(tǒng)活動(dòng)語(yǔ)音檢測(cè)在強(qiáng)噪聲環(huán)境下的局限性,提出了一種基于能量概率最大值的自適應(yīng)活動(dòng)語(yǔ)音檢測(cè)算法,能夠有效地分離帶噪聲信號(hào)段與背景噪聲段。另一方面將自適應(yīng)活動(dòng)語(yǔ)音檢測(cè)算法與最小均方誤差對(duì)數(shù)譜幅度估計(jì)降噪算法相結(jié)合,同時(shí)將每幀的噪聲幅度譜進(jìn)行自適應(yīng)平滑,相較于傳統(tǒng)最小均方誤差對(duì)數(shù)譜幅度估計(jì)算法而言,降噪后的目標(biāo)聲信號(hào)的信噪比能夠提高10-18dB。(2)針對(duì)腳步聲模型的特性和傳統(tǒng)頻率提取算法不能有效提取微弱聲信號(hào)頻率的問題,提出了一種互相關(guān)與傅里葉變換相結(jié)合的聲信號(hào)頻率特征提取算法,經(jīng)實(shí)驗(yàn)驗(yàn)證該算法能夠有效提取出微弱聲信號(hào)的主要頻率成分,從4類聲...
【文章來源】: 張皓然 西南科技大學(xué)
【文章頁(yè)數(shù)】:78 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
隨機(jī)共振框架圖
第二章微弱聲信號(hào)理論研究9圖2-2卷積神經(jīng)網(wǎng)絡(luò)基本框架圖輸入層是整個(gè)神經(jīng)網(wǎng)絡(luò)的輸入,在聲信號(hào)辨識(shí)處理中的卷積神經(jīng)網(wǎng)絡(luò),神經(jīng)網(wǎng)絡(luò)的輸入為目標(biāo)聲信號(hào)通過特征提取而得到的二維圖像。卷積層是整個(gè)神經(jīng)網(wǎng)絡(luò)的核心部分,卷積層主要作用是對(duì)輸入層的二維矩陣進(jìn)行卷積處理,搜尋與卷積核相匹配的特征,越與卷積核相匹配的特征,卷積后該區(qū)域的值也就越大,那么該區(qū)域特征就越明顯。池化層也被稱為下采樣層,池化層的目的是為了從原本特征中篩選出更能體現(xiàn)聲音本質(zhì)的特征,防止過擬合現(xiàn)象。由于樣本特征跟卷積層的核函數(shù)越匹配,該區(qū)域的值就越大,池化層通過每個(gè)區(qū)域值來過濾掉較小的特征,能夠最大限度地降低權(quán)重參數(shù),節(jié)省計(jì)算消耗。全連接層相當(dāng)于是整個(gè)卷積神經(jīng)網(wǎng)絡(luò)的“分類器”[29]。卷積層和池化層可以理解為聲信號(hào)的特征提取過程,全連接層就是對(duì)提取到的特征進(jìn)行分類處理。全連接層與前面兩層不同的是,它是全局操作,它從前一層獲取輸入,并全局分析所有前一層的輸出。然后利用所有特征進(jìn)行辨識(shí)模型的建立,最后用于數(shù)據(jù)分類[21]。輸出層也就是辨識(shí)結(jié)果的輸出,但是為了防止過擬合問題,通常可以在輸出層上面添加dropout層來解決問題。卷積神經(jīng)網(wǎng)絡(luò)作為開始興起的一種聲信號(hào)辨識(shí)算法,在處理大樣本數(shù)據(jù)集時(shí),具有其他聲信號(hào)辨識(shí)難以達(dá)到的準(zhǔn)確率。但是處理小樣本數(shù)據(jù)集時(shí),卷積神經(jīng)網(wǎng)絡(luò)就具有訓(xùn)練度不夠的局限性,并且聲紋的辨識(shí)性能更取決于精準(zhǔn)匹配,卷積神經(jīng)網(wǎng)絡(luò)由于自身在池化層階段對(duì)特征的優(yōu)化,可能會(huì)把低頻數(shù)據(jù)抹除掉,會(huì)造成目標(biāo)聲紋的辨識(shí)率下降的情況。在針對(duì)微弱聲信號(hào)的情況下,由于卷積網(wǎng)絡(luò)自身的魯棒性不足,無法對(duì)信噪比過低的聲信號(hào)進(jìn)行辨識(shí),不能夠得到很好的聲紋辨識(shí)效果。2.3微弱聲信號(hào)辨識(shí)原理及流程由于本文處
西南科技大學(xué)碩士學(xué)位論文13圖3-1VAD檢測(cè)開幀時(shí)間效果圖(-2dB人聲信號(hào))其中圖3-1中紅色垂直實(shí)線表示檢測(cè)到該段信號(hào)中第一段突變信號(hào)的開始,實(shí)際輸出的開幀時(shí)間為檢測(cè)到的第一段突變信號(hào)開始的時(shí)間。VAD作用二:將端點(diǎn)檢測(cè)后得出目標(biāo)聲信號(hào)段以外的部分設(shè)定為噪聲段,最后將其中長(zhǎng)度最長(zhǎng)的噪聲段輸出,為后續(xù)降噪提供背景噪聲,并存入背景數(shù)據(jù)庫(kù)中,以備VAD失效時(shí)降噪算法調(diào)用。VAD檢測(cè)背景噪聲效果如圖3-2所示。圖3-2VAD截取背景噪聲效果圖(0dB下人聲信號(hào))其中圖3-2中紅色實(shí)線和藍(lán)色虛線為檢測(cè)到一段目標(biāo)信號(hào)的開始和結(jié)束,實(shí)際輸出的背景噪聲段為藍(lán)色虛線和紅色實(shí)線之間的噪聲段中最長(zhǎng)的一段。由于噪聲影響,使得VAD檢測(cè)到的目標(biāo)信號(hào)段會(huì)比實(shí)際偏長(zhǎng),則得到的背景噪聲段會(huì)比實(shí)際偏短,最大程度上保證了所截取出的最長(zhǎng)噪聲段中不包含突變信號(hào),從而保證為后續(xù)降噪所提供的背景噪聲的準(zhǔn)確性。3.2.1VAD基本模塊VAD檢測(cè)性能一般由兩個(gè)部分來決定,特征提取和目標(biāo)/非目標(biāo)判決。通過提取到能分離目標(biāo)聲信號(hào)和背景噪聲的特征,并根據(jù)所選取的特征來設(shè)定合適的門限值來作為判決準(zhǔn)則,然后將提取得到的特征值與設(shè)定的門限值進(jìn)行對(duì)比,從而得到判決結(jié)果圖3-3為低信噪比環(huán)境下的VAD算法流程。圖3-3VAD算法流程圖VAD特征選取一般是由其所處理的目標(biāo)聲信號(hào)的特征所決定,根據(jù)域的差異大致可以分成以下三類:第一類為時(shí)域特征端點(diǎn)檢測(cè),根據(jù)時(shí)域中的特征參數(shù)進(jìn)行區(qū)分,包括時(shí)域能量、對(duì)數(shù)能量以及時(shí)域短時(shí)過零率等特征[31],時(shí)域特征具有計(jì)算速度快和
【參考文獻(xiàn)】:
期刊論文
[1]露天礦山爆破信號(hào)時(shí)頻特征提取與分析[J]. 王陀,林夢(mèng)吟,曾藝婷,顧城,秦明,付曉強(qiáng). 三明學(xué)院學(xué)報(bào). 2020(02)
[2]非接觸戰(zhàn)場(chǎng)傷情探測(cè)技術(shù)現(xiàn)狀與應(yīng)用展望[J]. 張楊,呂昊,梁福來,焦騰,于霄,李釗,王健琪. 醫(yī)療衛(wèi)生裝備. 2019(07)
[3]基于FPGA的自適應(yīng)濾波技術(shù)在雷達(dá)信號(hào)處理中的應(yīng)用研究[J]. 李軻,張國(guó)棟,冀啟東. 艦船電子工程. 2018(12)
[4]藏語(yǔ)語(yǔ)音時(shí)域參數(shù)提取關(guān)鍵技術(shù)研究[J]. 卓嘎,姜軍,董志誠(chéng). 電腦知識(shí)與技術(shù). 2018(08)
[5]譜減法與維納濾波法相結(jié)合的睡眠鼾聲降噪處理[J]. 彭健新,唐云飛. 華南理工大學(xué)學(xué)報(bào)(自然科學(xué)版). 2018(03)
[6]低空飛行聲目標(biāo)特征提取技術(shù)研究[J]. 朱紹程,劉利民. 電聲技術(shù). 2017(Z2)
[7]基于卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測(cè)研究綜述[J]. 李旭冬,葉茂,李濤. 計(jì)算機(jī)應(yīng)用研究. 2017(10)
[8]復(fù)雜噪聲場(chǎng)景下的活動(dòng)語(yǔ)音檢測(cè)方法[J]. 郭武,馬嘯空. 清華大學(xué)學(xué)報(bào)(自然科學(xué)版). 2016(11)
[9]基于GUI的自適應(yīng)濾波器仿真平臺(tái)設(shè)計(jì)[J]. 王麗. 軟件導(dǎo)刊. 2015(08)
[10]短時(shí)譜特征的漢語(yǔ)重音檢測(cè)方法研究[J]. 趙云雪,張瓏,鄭世杰. 計(jì)算機(jī)科學(xué)與探索. 2014(09)
碩士論文
[1]導(dǎo)航信號(hào)體制抗壓制式干擾研究[D]. 劉江楠.西安電子科技大學(xué) 2017
[2]基于流形學(xué)習(xí)的語(yǔ)音特征提取研究[D]. 徐玉功.山東大學(xué) 2017
[3]基于S變換和改進(jìn)譜減法的語(yǔ)音識(shí)別系統(tǒng)[D]. 蔣淵淵.貴州師范大學(xué) 2017
[4]基于LMD和HSMM的旋轉(zhuǎn)機(jī)械故障診斷方法研究[D]. 張菲.西南交通大學(xué) 2016
[5]語(yǔ)音端點(diǎn)檢測(cè)方法研究[D]. 張超.大連理工大學(xué) 2016
[6]快速卷積多載波傳輸方法研究[D]. 趙錦程.東南大學(xué) 2016
[7]基于機(jī)器學(xué)習(xí)的多傳感器目標(biāo)識(shí)別技術(shù)研究[D]. 李雪飛.沈陽(yáng)理工大學(xué) 2016
[8]基于LMS算法的臺(tái)桌式主動(dòng)隔振系統(tǒng)前饋控制研究[D]. 付翔宇.電子科技大學(xué) 2015
[9]列車軸承復(fù)雜聲學(xué)環(huán)境下軌邊故障診斷方法研究[D]. 王超.中國(guó)科學(xué)技術(shù)大學(xué) 2015
[10]基于麥克風(fēng)陣列的語(yǔ)音增強(qiáng)算法研究[D]. 王永杰.西安電子科技大學(xué) 2014
本文編號(hào):2950929
【文章來源】: 張皓然 西南科技大學(xué)
【文章頁(yè)數(shù)】:78 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
隨機(jī)共振框架圖
第二章微弱聲信號(hào)理論研究9圖2-2卷積神經(jīng)網(wǎng)絡(luò)基本框架圖輸入層是整個(gè)神經(jīng)網(wǎng)絡(luò)的輸入,在聲信號(hào)辨識(shí)處理中的卷積神經(jīng)網(wǎng)絡(luò),神經(jīng)網(wǎng)絡(luò)的輸入為目標(biāo)聲信號(hào)通過特征提取而得到的二維圖像。卷積層是整個(gè)神經(jīng)網(wǎng)絡(luò)的核心部分,卷積層主要作用是對(duì)輸入層的二維矩陣進(jìn)行卷積處理,搜尋與卷積核相匹配的特征,越與卷積核相匹配的特征,卷積后該區(qū)域的值也就越大,那么該區(qū)域特征就越明顯。池化層也被稱為下采樣層,池化層的目的是為了從原本特征中篩選出更能體現(xiàn)聲音本質(zhì)的特征,防止過擬合現(xiàn)象。由于樣本特征跟卷積層的核函數(shù)越匹配,該區(qū)域的值就越大,池化層通過每個(gè)區(qū)域值來過濾掉較小的特征,能夠最大限度地降低權(quán)重參數(shù),節(jié)省計(jì)算消耗。全連接層相當(dāng)于是整個(gè)卷積神經(jīng)網(wǎng)絡(luò)的“分類器”[29]。卷積層和池化層可以理解為聲信號(hào)的特征提取過程,全連接層就是對(duì)提取到的特征進(jìn)行分類處理。全連接層與前面兩層不同的是,它是全局操作,它從前一層獲取輸入,并全局分析所有前一層的輸出。然后利用所有特征進(jìn)行辨識(shí)模型的建立,最后用于數(shù)據(jù)分類[21]。輸出層也就是辨識(shí)結(jié)果的輸出,但是為了防止過擬合問題,通常可以在輸出層上面添加dropout層來解決問題。卷積神經(jīng)網(wǎng)絡(luò)作為開始興起的一種聲信號(hào)辨識(shí)算法,在處理大樣本數(shù)據(jù)集時(shí),具有其他聲信號(hào)辨識(shí)難以達(dá)到的準(zhǔn)確率。但是處理小樣本數(shù)據(jù)集時(shí),卷積神經(jīng)網(wǎng)絡(luò)就具有訓(xùn)練度不夠的局限性,并且聲紋的辨識(shí)性能更取決于精準(zhǔn)匹配,卷積神經(jīng)網(wǎng)絡(luò)由于自身在池化層階段對(duì)特征的優(yōu)化,可能會(huì)把低頻數(shù)據(jù)抹除掉,會(huì)造成目標(biāo)聲紋的辨識(shí)率下降的情況。在針對(duì)微弱聲信號(hào)的情況下,由于卷積網(wǎng)絡(luò)自身的魯棒性不足,無法對(duì)信噪比過低的聲信號(hào)進(jìn)行辨識(shí),不能夠得到很好的聲紋辨識(shí)效果。2.3微弱聲信號(hào)辨識(shí)原理及流程由于本文處
西南科技大學(xué)碩士學(xué)位論文13圖3-1VAD檢測(cè)開幀時(shí)間效果圖(-2dB人聲信號(hào))其中圖3-1中紅色垂直實(shí)線表示檢測(cè)到該段信號(hào)中第一段突變信號(hào)的開始,實(shí)際輸出的開幀時(shí)間為檢測(cè)到的第一段突變信號(hào)開始的時(shí)間。VAD作用二:將端點(diǎn)檢測(cè)后得出目標(biāo)聲信號(hào)段以外的部分設(shè)定為噪聲段,最后將其中長(zhǎng)度最長(zhǎng)的噪聲段輸出,為后續(xù)降噪提供背景噪聲,并存入背景數(shù)據(jù)庫(kù)中,以備VAD失效時(shí)降噪算法調(diào)用。VAD檢測(cè)背景噪聲效果如圖3-2所示。圖3-2VAD截取背景噪聲效果圖(0dB下人聲信號(hào))其中圖3-2中紅色實(shí)線和藍(lán)色虛線為檢測(cè)到一段目標(biāo)信號(hào)的開始和結(jié)束,實(shí)際輸出的背景噪聲段為藍(lán)色虛線和紅色實(shí)線之間的噪聲段中最長(zhǎng)的一段。由于噪聲影響,使得VAD檢測(cè)到的目標(biāo)信號(hào)段會(huì)比實(shí)際偏長(zhǎng),則得到的背景噪聲段會(huì)比實(shí)際偏短,最大程度上保證了所截取出的最長(zhǎng)噪聲段中不包含突變信號(hào),從而保證為后續(xù)降噪所提供的背景噪聲的準(zhǔn)確性。3.2.1VAD基本模塊VAD檢測(cè)性能一般由兩個(gè)部分來決定,特征提取和目標(biāo)/非目標(biāo)判決。通過提取到能分離目標(biāo)聲信號(hào)和背景噪聲的特征,并根據(jù)所選取的特征來設(shè)定合適的門限值來作為判決準(zhǔn)則,然后將提取得到的特征值與設(shè)定的門限值進(jìn)行對(duì)比,從而得到判決結(jié)果圖3-3為低信噪比環(huán)境下的VAD算法流程。圖3-3VAD算法流程圖VAD特征選取一般是由其所處理的目標(biāo)聲信號(hào)的特征所決定,根據(jù)域的差異大致可以分成以下三類:第一類為時(shí)域特征端點(diǎn)檢測(cè),根據(jù)時(shí)域中的特征參數(shù)進(jìn)行區(qū)分,包括時(shí)域能量、對(duì)數(shù)能量以及時(shí)域短時(shí)過零率等特征[31],時(shí)域特征具有計(jì)算速度快和
【參考文獻(xiàn)】:
期刊論文
[1]露天礦山爆破信號(hào)時(shí)頻特征提取與分析[J]. 王陀,林夢(mèng)吟,曾藝婷,顧城,秦明,付曉強(qiáng). 三明學(xué)院學(xué)報(bào). 2020(02)
[2]非接觸戰(zhàn)場(chǎng)傷情探測(cè)技術(shù)現(xiàn)狀與應(yīng)用展望[J]. 張楊,呂昊,梁福來,焦騰,于霄,李釗,王健琪. 醫(yī)療衛(wèi)生裝備. 2019(07)
[3]基于FPGA的自適應(yīng)濾波技術(shù)在雷達(dá)信號(hào)處理中的應(yīng)用研究[J]. 李軻,張國(guó)棟,冀啟東. 艦船電子工程. 2018(12)
[4]藏語(yǔ)語(yǔ)音時(shí)域參數(shù)提取關(guān)鍵技術(shù)研究[J]. 卓嘎,姜軍,董志誠(chéng). 電腦知識(shí)與技術(shù). 2018(08)
[5]譜減法與維納濾波法相結(jié)合的睡眠鼾聲降噪處理[J]. 彭健新,唐云飛. 華南理工大學(xué)學(xué)報(bào)(自然科學(xué)版). 2018(03)
[6]低空飛行聲目標(biāo)特征提取技術(shù)研究[J]. 朱紹程,劉利民. 電聲技術(shù). 2017(Z2)
[7]基于卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測(cè)研究綜述[J]. 李旭冬,葉茂,李濤. 計(jì)算機(jī)應(yīng)用研究. 2017(10)
[8]復(fù)雜噪聲場(chǎng)景下的活動(dòng)語(yǔ)音檢測(cè)方法[J]. 郭武,馬嘯空. 清華大學(xué)學(xué)報(bào)(自然科學(xué)版). 2016(11)
[9]基于GUI的自適應(yīng)濾波器仿真平臺(tái)設(shè)計(jì)[J]. 王麗. 軟件導(dǎo)刊. 2015(08)
[10]短時(shí)譜特征的漢語(yǔ)重音檢測(cè)方法研究[J]. 趙云雪,張瓏,鄭世杰. 計(jì)算機(jī)科學(xué)與探索. 2014(09)
碩士論文
[1]導(dǎo)航信號(hào)體制抗壓制式干擾研究[D]. 劉江楠.西安電子科技大學(xué) 2017
[2]基于流形學(xué)習(xí)的語(yǔ)音特征提取研究[D]. 徐玉功.山東大學(xué) 2017
[3]基于S變換和改進(jìn)譜減法的語(yǔ)音識(shí)別系統(tǒng)[D]. 蔣淵淵.貴州師范大學(xué) 2017
[4]基于LMD和HSMM的旋轉(zhuǎn)機(jī)械故障診斷方法研究[D]. 張菲.西南交通大學(xué) 2016
[5]語(yǔ)音端點(diǎn)檢測(cè)方法研究[D]. 張超.大連理工大學(xué) 2016
[6]快速卷積多載波傳輸方法研究[D]. 趙錦程.東南大學(xué) 2016
[7]基于機(jī)器學(xué)習(xí)的多傳感器目標(biāo)識(shí)別技術(shù)研究[D]. 李雪飛.沈陽(yáng)理工大學(xué) 2016
[8]基于LMS算法的臺(tái)桌式主動(dòng)隔振系統(tǒng)前饋控制研究[D]. 付翔宇.電子科技大學(xué) 2015
[9]列車軸承復(fù)雜聲學(xué)環(huán)境下軌邊故障診斷方法研究[D]. 王超.中國(guó)科學(xué)技術(shù)大學(xué) 2015
[10]基于麥克風(fēng)陣列的語(yǔ)音增強(qiáng)算法研究[D]. 王永杰.西安電子科技大學(xué) 2014
本文編號(hào):2950929
本文鏈接:http://www.sikaile.net/kejilunwen/xinxigongchenglunwen/2950929.html
最近更新
教材專著