噪聲環(huán)境下魯棒語音識別技術的研究
發(fā)布時間:2024-02-28 18:31
語音交流是人類最方便的交流方式。隨著科技的發(fā)展,以語音識別技術為核心的人機交互方式日益流行起來。經(jīng)過六十多年的發(fā)展,語音識別技術已經(jīng)有了極大的提升,在安靜環(huán)境下,語音識別系統(tǒng)的性能接近人類水平,而在有噪聲干擾的情況下,語音識別系統(tǒng)的識別準確率大打折扣。在噪聲環(huán)境下提高語音識別系統(tǒng)的魯棒性已經(jīng)成為語音識別技術投入大規(guī)模使用的關鍵之一。本文主要針對噪聲環(huán)境下語音識別系統(tǒng)性能下降的情況,使用語音增強算法對輸入語音進行降噪處理,提升輸入語音的質量以提高語音識別系統(tǒng)的魯棒性。而傳統(tǒng)意義上的語音增強算法會使語音產(chǎn)生畸變和失真,因此需要針對自動語音識別系統(tǒng)的特性對語音增強算法進行改進。本文主要的工作有:(1)研究了基于人耳聽覺掩蔽效應和諧波恢復原理的改進維納濾波算法。首先研究了人耳的聽覺掩蔽效應,并對掩蔽閾值的求解方法進行了介紹,其次對最小值統(tǒng)計噪聲估計(Minimum Stasistics,MS)算法和基于最小值約束的遞歸平均噪聲估計方法(Minima-Controlled Recrsive Average,MCRA)進行了研究,然后提出改進方案,第一步,結合掩蔽閾值調整噪聲能量譜的估計;第二步,...
【文章頁數(shù)】:94 頁
【學位級別】:碩士
【部分圖文】:
本文編號:3913859
【文章頁數(shù)】:94 頁
【學位級別】:碩士
【部分圖文】:
圖1–3DNN,GMM系統(tǒng)在訓練和測試的SNR失配時的性能下降Fig1–3PerformancedegradationofDNN,GMMsystemwhenSNRbetweentrainingandtestingmismatch
圖1–3DNN,GMM系統(tǒng)在訓練和測試的SNR失配時的性能下降erformancedegradationofDNN,GMMsystemwhenSNRbetweentrainingandtesti復雜場景、噪聲環(huán)境下的魯棒語音識別已經(jīng)成為了語音識別領域....
圖2-1語音信號產(chǎn)生原理圖
11圖2-1語音信號產(chǎn)生原理圖為兩種激勵討論,濁音激勵和清音激
圖2-7DNN-HMM聲學模型示意圖
圖2-7DNN-HMM聲學模型示意圖介紹
圖3-11kHz出人耳的掩蔽效應
圖3-11kHz出人耳的掩蔽效應值計算能夠應用到實際語音信號處理過程中去,那么必須求
本文編號:3913859
本文鏈接:http://www.sikaile.net/kejilunwen/wltx/3913859.html
最近更新
教材專著