基于神經(jīng)網(wǎng)絡(luò)的面罩語音識(shí)別方法研究
發(fā)布時(shí)間:2023-05-17 22:45
全面罩是潛水員水下作業(yè)必不可少的設(shè)備之一,隨著對(duì)海洋深入的探索,越來越多的智能設(shè)備被用到淺海水聲通信及作業(yè)中。面罩語音識(shí)別作為人機(jī)交互的重要接口,給潛水員帶來了極大的便利,對(duì)提高潛水員水下作業(yè)的效率,保障潛水員的生命安全有著重要的意義。考慮到實(shí)際環(huán)境中,會(huì)有各種海洋噪聲的干擾,影響人機(jī)交互的正常進(jìn)行。本文將語音增強(qiáng)算法和語音識(shí)別算法級(jí)聯(lián)起來,先對(duì)帶噪面罩語音做增強(qiáng)處理,然后對(duì)增強(qiáng)后的面罩語音進(jìn)行識(shí)別,主要工作和研究內(nèi)容如下:(1)面罩語音信號(hào)預(yù)處理。首先通過對(duì)比面罩語音和空氣語音的語譜圖來分析面罩語音的特性,結(jié)果顯示面罩語音信號(hào)的高頻分量削弱甚至丟失。然后對(duì)面罩語音信號(hào)進(jìn)行了預(yù)處理及特征參數(shù)提取。(2)面罩語音增強(qiáng)算法研究。提出了一種改進(jìn)的維納濾波算法,在計(jì)算增益函數(shù)前先采用譜熵法檢測(cè)面罩語音每一幀的狀態(tài),對(duì)無話幀進(jìn)行噪聲功率譜更新,同時(shí)引入增益控制參數(shù),在增強(qiáng)面罩語音的同時(shí),盡可能減少原始面罩語音失真。對(duì)比分析了增強(qiáng)后面罩語音的時(shí)域波形圖和語譜圖,研究表明該算法隨著增益控制參數(shù)增大,殘留噪聲不斷減小,若參數(shù)太大則會(huì)使得帶噪面罩語音失真較為嚴(yán)重。與兩種經(jīng)典增強(qiáng)算法對(duì)比,改進(jìn)的維納濾波算...
【文章頁數(shù)】:71 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 課題研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀與發(fā)展趨勢(shì)
1.2.1 語音增強(qiáng)技術(shù)研究現(xiàn)狀
1.2.2 語音識(shí)別技術(shù)研究現(xiàn)狀
1.2.3 國內(nèi)外發(fā)展趨勢(shì)
1.3 研究內(nèi)容與章節(jié)安排
1.3.1 主要研究內(nèi)容
1.3.2 論文章節(jié)安排
第二章 語音信號(hào)預(yù)處理及特征參數(shù)提取
2.1 語音信號(hào)產(chǎn)生
2.1.1 語音信號(hào)的產(chǎn)生原理
2.1.2 面罩語音信號(hào)及其特性
2.2 語音信號(hào)預(yù)處理
2.2.1 預(yù)加重
2.2.2 分幀及加窗
2.2.3 端點(diǎn)檢測(cè)
2.3 語音信號(hào)的特征參數(shù)提取
2.4 本章小結(jié)
第三章 面罩語音增強(qiáng)
3.1 噪聲及特性分析
3.2 噪聲對(duì)面罩語音信號(hào)的影響
3.3 語音增強(qiáng)算法
3.3.1 譜減法
3.3.2 維納濾波法
3.4 改進(jìn)的維納濾波算法
3.4.1 譜熵法
3.4.2 改進(jìn)的維納濾波算法
3.5 實(shí)驗(yàn)仿真及結(jié)果分析
3.6 本章小結(jié)
第四章 基于神經(jīng)網(wǎng)絡(luò)的面罩語音識(shí)別
4.1 神經(jīng)網(wǎng)絡(luò)
4.1.1 神經(jīng)元
4.1.2 神經(jīng)網(wǎng)絡(luò)
4.1.3 Dropout
4.2 BP神經(jīng)網(wǎng)絡(luò)
4.3 卷積神經(jīng)網(wǎng)絡(luò)
4.3.1 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
4.3.2 局部連接和權(quán)值共享
4.3.3 局部響應(yīng)歸一化
4.3.4 卷積操作
4.3.5 子采樣
4.3.6 Softmax回歸
4.3.7 優(yōu)化的卷積神經(jīng)網(wǎng)絡(luò)
4.4 長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)
4.4.1 循環(huán)神經(jīng)網(wǎng)絡(luò)
4.4.2 長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)
4.5 實(shí)驗(yàn)仿真及結(jié)果分析
4.5.1 實(shí)驗(yàn)環(huán)境
4.5.2 實(shí)驗(yàn)過程及結(jié)果分析
4.6 本章小結(jié)
第五章 帶噪面罩語音識(shí)別
5.1 系統(tǒng)整體框架
5.1.1 預(yù)處理
5.1.2 語音增強(qiáng)
5.1.3 特征提取
5.1.4 面罩語音識(shí)別
5.2 實(shí)驗(yàn)仿真及結(jié)果分析
5.2.1 實(shí)驗(yàn)環(huán)境
5.2.2 實(shí)驗(yàn)過程及結(jié)果分析
5.3 本章小結(jié)
第六章 結(jié)論與展望
6.1 結(jié)論
6.2 展望
參考文獻(xiàn)
攻讀學(xué)位期間所取得的相關(guān)科研成果
致謝
本文編號(hào):3818149
【文章頁數(shù)】:71 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 課題研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀與發(fā)展趨勢(shì)
1.2.1 語音增強(qiáng)技術(shù)研究現(xiàn)狀
1.2.2 語音識(shí)別技術(shù)研究現(xiàn)狀
1.2.3 國內(nèi)外發(fā)展趨勢(shì)
1.3 研究內(nèi)容與章節(jié)安排
1.3.1 主要研究內(nèi)容
1.3.2 論文章節(jié)安排
第二章 語音信號(hào)預(yù)處理及特征參數(shù)提取
2.1 語音信號(hào)產(chǎn)生
2.1.1 語音信號(hào)的產(chǎn)生原理
2.1.2 面罩語音信號(hào)及其特性
2.2 語音信號(hào)預(yù)處理
2.2.1 預(yù)加重
2.2.2 分幀及加窗
2.2.3 端點(diǎn)檢測(cè)
2.3 語音信號(hào)的特征參數(shù)提取
2.4 本章小結(jié)
第三章 面罩語音增強(qiáng)
3.1 噪聲及特性分析
3.2 噪聲對(duì)面罩語音信號(hào)的影響
3.3 語音增強(qiáng)算法
3.3.1 譜減法
3.3.2 維納濾波法
3.4 改進(jìn)的維納濾波算法
3.4.1 譜熵法
3.4.2 改進(jìn)的維納濾波算法
3.5 實(shí)驗(yàn)仿真及結(jié)果分析
3.6 本章小結(jié)
第四章 基于神經(jīng)網(wǎng)絡(luò)的面罩語音識(shí)別
4.1 神經(jīng)網(wǎng)絡(luò)
4.1.1 神經(jīng)元
4.1.2 神經(jīng)網(wǎng)絡(luò)
4.1.3 Dropout
4.2 BP神經(jīng)網(wǎng)絡(luò)
4.3 卷積神經(jīng)網(wǎng)絡(luò)
4.3.1 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
4.3.2 局部連接和權(quán)值共享
4.3.3 局部響應(yīng)歸一化
4.3.4 卷積操作
4.3.5 子采樣
4.3.6 Softmax回歸
4.3.7 優(yōu)化的卷積神經(jīng)網(wǎng)絡(luò)
4.4 長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)
4.4.1 循環(huán)神經(jīng)網(wǎng)絡(luò)
4.4.2 長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)
4.5 實(shí)驗(yàn)仿真及結(jié)果分析
4.5.1 實(shí)驗(yàn)環(huán)境
4.5.2 實(shí)驗(yàn)過程及結(jié)果分析
4.6 本章小結(jié)
第五章 帶噪面罩語音識(shí)別
5.1 系統(tǒng)整體框架
5.1.1 預(yù)處理
5.1.2 語音增強(qiáng)
5.1.3 特征提取
5.1.4 面罩語音識(shí)別
5.2 實(shí)驗(yàn)仿真及結(jié)果分析
5.2.1 實(shí)驗(yàn)環(huán)境
5.2.2 實(shí)驗(yàn)過程及結(jié)果分析
5.3 本章小結(jié)
第六章 結(jié)論與展望
6.1 結(jié)論
6.2 展望
參考文獻(xiàn)
攻讀學(xué)位期間所取得的相關(guān)科研成果
致謝
本文編號(hào):3818149
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/3818149.html
最近更新
教材專著