低信噪比環(huán)境下的語音識(shí)別方法研究
本文選題:語音增強(qiáng) + 低信噪比 ; 參考:《聲學(xué)技術(shù)》2017年01期
【摘要】:單通道語音信號(hào)在信噪比較大的環(huán)境下經(jīng)過增強(qiáng)后再識(shí)別,能表現(xiàn)出較高的識(shí)別率。但是在低信噪比環(huán)境下,增強(qiáng)后語音信號(hào)的識(shí)別率急劇下降。針對此種情況,提出了一種用在識(shí)別系統(tǒng)前端的語音增強(qiáng)算法,該增強(qiáng)算法將采集到的帶噪語音信號(hào)先使用對數(shù)最小均方誤差(Logarithmic Minimum Mean Square Error,Log MMSE)提高其信噪比,然后再利用改進(jìn)的維納濾波去除噪聲殘留并提升語音可懂度,最后用梅爾頻率倒譜系數(shù)(Mel-Frequency Cepstral Coefficients,MFCC)和隱馬爾科夫模型(Hidden Markov Model,HMM)對增強(qiáng)后的語音信號(hào)做特征提取并識(shí)別。實(shí)驗(yàn)分析結(jié)果表明,該方法能有效地抑制背景噪聲并減少噪聲殘留,顯著提升低信噪比環(huán)境下語音識(shí)別的準(zhǔn)確性。
[Abstract]:The single channel speech signal can be recognized with high recognition rate after enhancement in the environment of high signal-to-noise ratio (SNR). But in low SNR environment, the recognition rate of enhanced speech signal decreases sharply. In this paper, a speech enhancement algorithm used in the front end of the recognition system is proposed. The noisy speech signal is first enhanced by logarithmic Minimum Mean Square error MMSE (logarithmic Minimum Mean Square error MMSE), which is used to improve the signal-to-noise ratio (SNR) of the noisy speech signal. Then the improved Wiener filter is used to remove the noise residue and improve the speech intelligibility. Finally, the enhanced speech signal is extracted and recognized by using Mel-Frequency Cepstral coefficients (MFCC) and Hidden Markov Model-HMMM (Hidden Markov Model). The experimental results show that the proposed method can effectively suppress background noise and reduce the residual noise, and improve the accuracy of speech recognition in low SNR environment.
【作者單位】: 桂林電子科技大學(xué)信息與通信學(xué)院;
【基金】:國家自然科學(xué)基金(61461011) 教育部重點(diǎn)實(shí)驗(yàn)室2016年主任基金(CRKL160107)資助項(xiàng)目
【分類號(hào)】:TN912.34
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 郭遠(yuǎn)瓊;提高語音識(shí)別率點(diǎn)滴[J];電腦技術(shù);2000年03期
2 邢文;語音識(shí)別[J];個(gè)人電腦;2000年02期
3 ;語音識(shí)別的真相[J];個(gè)人電腦;2001年12期
4 ;語音識(shí)別漸入佳境[J];個(gè)人電腦;2002年03期
5 ;微軟語音識(shí)別軟件可與人直接對話[J];自動(dòng)化博覽;2003年04期
6 ;語音識(shí)別[J];印刷世界;2004年01期
7 杰里米·瓦格斯塔夫;讓語音識(shí)別軟件 解放你的雙手[J];農(nóng)業(yè)圖書情報(bào)學(xué)刊;2004年03期
8 韓紀(jì)慶,王歡良,李海峰,鄭鐵然;基于語音識(shí)別的發(fā)音學(xué)習(xí)技術(shù)[J];電聲技術(shù);2004年09期
9 陳孝強(qiáng);語音識(shí)別擬起新潮[J];微電腦世界;2005年07期
10 韓紀(jì)慶;張磊;鄭鐵然;;網(wǎng)絡(luò)環(huán)境下的語音識(shí)別方法[J];計(jì)算機(jī)科學(xué);2005年01期
相關(guān)會(huì)議論文 前10條
1 張歆奕;吳今培;張其善;;語音的共性特征及其在語音識(shí)別中的應(yīng)用[A];第十屆全國信號(hào)處理學(xué)術(shù)年會(huì)(CCSP-2001)論文集[C];2001年
2 杜樹木;何良華;;一種新的基于段長分布的語音識(shí)別模型[A];2009年通信理論與信號(hào)處理學(xué)術(shù)年會(huì)論文集[C];2009年
3 李楨;高萬林;歐文浩;徐山川;;基于關(guān)鍵詞語音識(shí)別的農(nóng)業(yè)信息語音服務(wù)系統(tǒng)的研究與實(shí)現(xiàn)[A];中國農(nóng)業(yè)工程學(xué)會(huì)電氣信息與自動(dòng)化專業(yè)委員會(huì)、中國電機(jī)工程學(xué)會(huì)農(nóng)村電氣化分會(huì)科技與教育專委會(huì)2010年學(xué)術(shù)年會(huì)論文摘要[C];2010年
4 張冰;龍長才;羅海風(fēng);;熟悉掩蔽音背景下的目標(biāo)語音識(shí)別[A];泛在信息社會(huì)中的聲學(xué)——中國聲學(xué)學(xué)會(huì)2010年全國會(huì)員代表大會(huì)暨學(xué)術(shù)會(huì)議論文集[C];2010年
5 王承發(fā);趙德彬;金山;苗百利;朱志瑩;;語音識(shí)別應(yīng)用中抗噪聲干擾方法的初步探討[A];第二屆全國人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集[C];1992年
6 杜笑平;楊啟綱;楊家沅;;過零周期轉(zhuǎn)移概率矩陣語音識(shí)別部件的研制[A];第二屆全國人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集[C];1992年
7 季宏;劉志文;杜燕玲;黃曾陽;;語音識(shí)別中的音字轉(zhuǎn)換[A];第三屆全國人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集[C];1994年
8 葛余博;楊大利;曾德超;;噪聲環(huán)境下語音識(shí)別的幾個(gè)問題(一)[A];第三屆全國人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集[C];1994年
9 朱奇峰;俞鐵城;;聽覺中的協(xié)同現(xiàn)象和其對語音識(shí)別影響的探討[A];第四屆全國人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集[C];1996年
10 姚磊;黃泰翼;陳景東;;一種高魯棒性語音識(shí)別的通用自適應(yīng)方法研究[A];第四屆全國人機(jī)語音通訊學(xué)術(shù)會(huì)議論文集[C];1996年
相關(guān)重要報(bào)紙文章 前10條
1 黃夢;方案商積極切入語音識(shí)別市場[N];電腦商報(bào);2006年
2 閆婷;語音識(shí)別 理想與現(xiàn)實(shí)的距離[N];計(jì)算機(jī)世界;2007年
3 劉喜喜;語音識(shí)別將把鼠標(biāo)鍵盤打入冷宮?[N];中國計(jì)算機(jī)報(bào);2008年
4 樂天;語音識(shí)別:讓你的手機(jī)更聰明[N];計(jì)算機(jī)世界;2011年
5 特約作者 王佳彬;語音識(shí)別漸入佳境[N];電腦報(bào);2002年
6 雨夏;語音識(shí)別重在應(yīng)用[N];計(jì)算機(jī)世界;2001年
7 ;語音識(shí)別企業(yè)應(yīng)用前景光明[N];計(jì)算機(jī)世界;2003年
8 王向東 欒煥博 林守勛 錢躍良;語音識(shí)別:抗噪音能力有待加強(qiáng)[N];計(jì)算機(jī)世界;2006年
9 上海 高博;讓電腦“聽懂”人話[N];電腦報(bào);2008年
10 張彤;語音識(shí)別融入統(tǒng)一通信[N];網(wǎng)絡(luò)世界;2008年
相關(guān)博士學(xué)位論文 前10條
1 許金普;農(nóng)產(chǎn)品市場信息采集的語音識(shí)別魯棒性方法研究[D];中國農(nóng)業(yè)科學(xué)院;2015年
2 包希日莫;面向蒙古語的語音識(shí)別聲學(xué)建模研究[D];內(nèi)蒙古大學(xué);2016年
3 吳斌;語音識(shí)別中的后處理技術(shù)研究[D];北京郵電大學(xué);2008年
4 奉小慧;音頻噪聲環(huán)境下唇動(dòng)信息在語音識(shí)別中的應(yīng)用技術(shù)研究[D];華南理工大學(xué);2010年
5 孫f,
本文編號(hào):1952016
本文鏈接:http://www.sikaile.net/kejilunwen/xinxigongchenglunwen/1952016.html