聲學(xué)回聲消除與波束成形語音增強(qiáng)方法研究
發(fā)布時(shí)間:2021-08-08 23:51
語音是人類最自然的交互方式。近年來,智能音箱得到市場(chǎng)認(rèn)可,發(fā)展迅速,方便了人們的生活。但是,當(dāng)人們距離智能設(shè)備較遠(yuǎn)時(shí),麥克風(fēng)陣列采集的語音信號(hào)的信噪比較低,若不經(jīng)過語音增強(qiáng)處理而直接進(jìn)行識(shí)別,其語音識(shí)別效果會(huì)很差。此外,當(dāng)智能設(shè)備本身播放聲音時(shí)進(jìn)行語音關(guān)鍵詞喚醒,其難度較大,而若應(yīng)用聲學(xué)回聲消除技術(shù),這會(huì)明顯提高喚醒率。單聲道語音增強(qiáng)方法雖然能夠有效地抑制背景噪聲,但會(huì)對(duì)期望信號(hào)造成畸變,而麥克風(fēng)陣列波束成形技術(shù)則可以有效地增強(qiáng)語音信號(hào)且語音失真度較小。本文利用麥克風(fēng)陣列信號(hào)估計(jì)聲場(chǎng)傳遞函數(shù)比,進(jìn)行語音分離,然后進(jìn)一步用維納濾波進(jìn)行降噪處理。此外,研究了聲學(xué)回聲消除技術(shù)。本文的主要工作如下:(1)介紹了麥克風(fēng)陣列語音增強(qiáng)算法的國(guó)內(nèi)外研究現(xiàn)狀和聲學(xué)回聲消除的背景,簡(jiǎn)述了幾種聲源定位和語音重疊幀檢測(cè)算法。(2)基于WebRTC開源代碼中的AEC模塊,實(shí)現(xiàn)了聲學(xué)回聲消除。特別是,在算法實(shí)現(xiàn)過程中,采用分塊頻域自適應(yīng)濾波算法,并在歸一化最小均方算法中加入防梯度爆炸處理,保證了算法的實(shí)時(shí)性和回聲消除性能。此外,應(yīng)用非線性處理技術(shù),去除殘余回聲,省去了雙端檢測(cè)處理。實(shí)驗(yàn)結(jié)果表明,本文的聲學(xué)回聲消除...
【文章來源】:大連理工大學(xué)遼寧省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:59 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 選題的背景及意義
1.2 麥克風(fēng)陣列技術(shù)
1.3 發(fā)展歷程及研究現(xiàn)狀
1.3.1 波束成形
1.3.2 語音重疊幀檢測(cè)
1.3.3 聲源定位
1.4 本文結(jié)構(gòu)安排
2 相關(guān)背景知識(shí)
2.1 信號(hào)處理數(shù)學(xué)基礎(chǔ)
2.2 回聲消除背景知識(shí)
2.2.1 自適應(yīng)濾波器
2.2.2 LMS算法
2.2.3 NLMS算法
2.3 麥克風(fēng)陣列聲源測(cè)向算法
2.3.1 傳統(tǒng)譜估計(jì)法
2.3.2 Capon最小方差算法
2.3.3 MUSIC算法測(cè)向
3 聲學(xué)回聲消除
3.1 基于WebRTC的AEC算法
3.1.1 算法簡(jiǎn)介
3.1.2 AEC算法流程
3.1.3 遠(yuǎn)端和近端信號(hào)延時(shí)對(duì)齊
3.1.4 非線性處理(NLP)
3.2 改進(jìn)算法
3.2.1 分塊頻域自適應(yīng)濾波算法
3.2.2 聯(lián)合最優(yōu)NLMS算法
3.2.3 改進(jìn)算法
3.3 性能評(píng)估
3.3.1 實(shí)驗(yàn)條件
3.3.2 實(shí)驗(yàn)波形圖
3.3.3 ERLE和SER測(cè)試
3.3.4 歸一化失配率
4 改進(jìn)LCMV結(jié)合WPF波束成形算法
4.1 波束成形算法
4.1.1 波束成形最優(yōu)權(quán)重矢量
4.1.2 MVDR算法
4.1.3 LCMV算法
4.1.4 GSC結(jié)構(gòu)
4.2 基于LCMV和后置濾波的波束成形算法
4.2.1 改進(jìn)的自適應(yīng)波束成形
4.2.2 語音重疊幀檢測(cè)算法
4.2.3 說話人索引
4.3 性能評(píng)估
4.3.1 實(shí)驗(yàn)條件
4.3.2 實(shí)際錄音增強(qiáng)
4.3.3 語音分離能力評(píng)估
4.3.4 輸出信干噪比評(píng)估
4.3.5 增強(qiáng)語音MOS值
結(jié)論
參考文獻(xiàn)
致謝
本文編號(hào):3330925
【文章來源】:大連理工大學(xué)遼寧省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:59 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 選題的背景及意義
1.2 麥克風(fēng)陣列技術(shù)
1.3 發(fā)展歷程及研究現(xiàn)狀
1.3.1 波束成形
1.3.2 語音重疊幀檢測(cè)
1.3.3 聲源定位
1.4 本文結(jié)構(gòu)安排
2 相關(guān)背景知識(shí)
2.1 信號(hào)處理數(shù)學(xué)基礎(chǔ)
2.2 回聲消除背景知識(shí)
2.2.1 自適應(yīng)濾波器
2.2.2 LMS算法
2.2.3 NLMS算法
2.3 麥克風(fēng)陣列聲源測(cè)向算法
2.3.1 傳統(tǒng)譜估計(jì)法
2.3.2 Capon最小方差算法
2.3.3 MUSIC算法測(cè)向
3 聲學(xué)回聲消除
3.1 基于WebRTC的AEC算法
3.1.1 算法簡(jiǎn)介
3.1.2 AEC算法流程
3.1.3 遠(yuǎn)端和近端信號(hào)延時(shí)對(duì)齊
3.1.4 非線性處理(NLP)
3.2 改進(jìn)算法
3.2.1 分塊頻域自適應(yīng)濾波算法
3.2.2 聯(lián)合最優(yōu)NLMS算法
3.2.3 改進(jìn)算法
3.3 性能評(píng)估
3.3.1 實(shí)驗(yàn)條件
3.3.2 實(shí)驗(yàn)波形圖
3.3.3 ERLE和SER測(cè)試
3.3.4 歸一化失配率
4 改進(jìn)LCMV結(jié)合WPF波束成形算法
4.1 波束成形算法
4.1.1 波束成形最優(yōu)權(quán)重矢量
4.1.2 MVDR算法
4.1.3 LCMV算法
4.1.4 GSC結(jié)構(gòu)
4.2 基于LCMV和后置濾波的波束成形算法
4.2.1 改進(jìn)的自適應(yīng)波束成形
4.2.2 語音重疊幀檢測(cè)算法
4.2.3 說話人索引
4.3 性能評(píng)估
4.3.1 實(shí)驗(yàn)條件
4.3.2 實(shí)際錄音增強(qiáng)
4.3.3 語音分離能力評(píng)估
4.3.4 輸出信干噪比評(píng)估
4.3.5 增強(qiáng)語音MOS值
結(jié)論
參考文獻(xiàn)
致謝
本文編號(hào):3330925
本文鏈接:http://www.sikaile.net/kejilunwen/wltx/3330925.html
最近更新
教材專著