基于HMM-ANN模型的語(yǔ)音識(shí)別技術(shù)研究
本文關(guān)鍵詞:基于HMM-ANN模型的語(yǔ)音識(shí)別技術(shù)研究
更多相關(guān)文章: 語(yǔ)音識(shí)別 HMM-ANN混合模型 端點(diǎn)檢測(cè) 特征提取
【摘要】:在語(yǔ)音識(shí)別(ASR,Automatic Speech Recognition)領(lǐng)域中運(yùn)用最廣的隱馬爾可夫模型(HMM,Hidden Markov Model)和人工神經(jīng)網(wǎng)絡(luò)(ANN,Artificial Neural Network)這兩種模型各自均有優(yōu)缺點(diǎn)。HMM有極強(qiáng)的動(dòng)態(tài)建模能力,在處理具有動(dòng)態(tài)性能的語(yǔ)音信號(hào)時(shí)有著很好的優(yōu)勢(shì),卻在分類(lèi)功能上不足。ANN強(qiáng)大的輸入輸出映射能力使得它在處理模式分類(lèi)與判決的問(wèn)題上得天獨(dú)厚,然而它對(duì)動(dòng)態(tài)信號(hào)處理能力的不足也是不可忽視的。本文提出使用HMM-ANN混合模型來(lái)提高信號(hào)的處理能力,從而提高ASR系統(tǒng)的識(shí)別率。其中,ANN采用了概率神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法。論文主要完成了以下工作:(1)總結(jié)ASR的研究現(xiàn)狀和基本原理,比較HMM和ANN兩種模型的優(yōu)點(diǎn)和不足,提出HMM-ANN混合模型,并利用MATLAB軟件分別仿真實(shí)現(xiàn)了HMM、ANN以及HMM-ANN這三種模型下的小詞匯量、孤立漢語(yǔ)的語(yǔ)音識(shí)別功能。(2)比較了三種模型下語(yǔ)音識(shí)別的識(shí)別率,實(shí)驗(yàn)結(jié)果表明,混合模型的識(shí)別率最高。(3)對(duì)語(yǔ)音識(shí)別的魯棒性進(jìn)行了研究。一方面,端點(diǎn)檢測(cè)時(shí)提出了改進(jìn)后的檢測(cè)算法。在用傳統(tǒng)的雙門(mén)限檢測(cè)算法前,先用小波閾值去噪原理提高語(yǔ)音信號(hào)的信噪比,再進(jìn)行檢測(cè)。實(shí)驗(yàn)結(jié)果證明,在噪聲環(huán)境下,改進(jìn)后的算法表現(xiàn)出更好的抗噪性,即語(yǔ)音識(shí)別的魯棒性更好,識(shí)別率更高。另一方面,特征提取時(shí)提出了改進(jìn)后的提取算法。與傳統(tǒng)的Mel頻率倒譜系數(shù)(MFCC)相比,本文提出的基于近似估計(jì)非零項(xiàng)法原理的譜減法的SS-MFCC參數(shù)更能代表純凈語(yǔ)音的特征,且對(duì)應(yīng)的語(yǔ)音識(shí)別率更高,即魯棒性更好。
【關(guān)鍵詞】:語(yǔ)音識(shí)別 HMM-ANN混合模型 端點(diǎn)檢測(cè) 特征提取
【學(xué)位授予單位】:南昌航空大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類(lèi)號(hào)】:TN912.34
【目錄】:
- 摘要3-4
- ABSTRACT4-8
- 第1章 緒論8-15
- 1.1 引言8-9
- 1.2 研究背景與意義9-10
- 1.3 國(guó)內(nèi)外研究現(xiàn)狀10-13
- 1.4 主要研究?jī)?nèi)容13
- 1.5 論文組織結(jié)構(gòu)13-15
- 第2章 語(yǔ)音識(shí)別的概述15-31
- 2.1 語(yǔ)音識(shí)別的基本原理15
- 2.2 語(yǔ)音信號(hào)的預(yù)處理15-23
- 2.2.1 數(shù)字化16-17
- 2.2.2 預(yù)加重17
- 2.2.3 分幀加窗17-19
- 2.2.4 端點(diǎn)檢測(cè)19-23
- 2.3 語(yǔ)音信號(hào)的特征提取23-29
- 2.3.1 Mel頻率倒普系數(shù)(MFCC)24-26
- 2.3.2 基于譜減法估計(jì)的改進(jìn)算法26-29
- 2.4 模板訓(xùn)練與模板匹配29-30
- 2.5 本章小結(jié)30-31
- 第3章 HMM語(yǔ)音識(shí)別技術(shù)的研究31-39
- 3.1 HMM模型簡(jiǎn)介31
- 3.2 HMM的數(shù)學(xué)模型31-32
- 3.3 HMM模型的三個(gè)基本問(wèn)題32-38
- 3.3.1 前向-后向算法33-35
- 3.3.2 Viterbi算法35-36
- 3.3.3 Baum-Welch算法36-38
- 3.4 本章小結(jié)38-39
- 第4章 ANN語(yǔ)音識(shí)別技術(shù)的研究39-46
- 4.1 ANN的概述39
- 4.2 ANN的基本組成要素39-42
- 4.2.1 神經(jīng)元39-40
- 4.2.2 網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)40-41
- 4.2.3 網(wǎng)絡(luò)學(xué)習(xí)算法41-42
- 4.3 概率神經(jīng)網(wǎng)絡(luò)42-45
- 4.3.1 PNN概述42
- 4.3.2 PNN的識(shí)別過(guò)程42-45
- 4.4 本章小結(jié)45-46
- 第5章 HMM-ANN語(yǔ)音識(shí)別技術(shù)的研究46-51
- 5.1 HMM-ANN的結(jié)合依據(jù)46
- 5.2 HMM-ANN的結(jié)合方式46-47
- 5.3 HMM-ANN的語(yǔ)音識(shí)別過(guò)程47-50
- 5.4 本章小結(jié)50-51
- 第6章 仿真與實(shí)驗(yàn)分析51-73
- 6.1 準(zhǔn)備工作51-53
- 6.2 預(yù)處理53-61
- 6.3 特征提取61-63
- 6.4 HMM-ANN混合模型的仿真63-72
- 6.4.1 HMM訓(xùn)練模型63-66
- 6.4.2 PNN訓(xùn)練模型66-67
- 6.4.3 實(shí)驗(yàn)結(jié)果與分析67-70
- 6.4.4 討論70-72
- 6.5 本章小結(jié)72-73
- 第7章 總結(jié)與展望73-74
- 7.1 工作總結(jié)73
- 7.2 研究展望73-74
- 參考文獻(xiàn)74-79
- 攻讀碩士期間發(fā)表論文情況79-80
- 致謝80-81
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 ;飛利浦推出最新語(yǔ)音識(shí)別技術(shù)[J];現(xiàn)代通信;2000年08期
2 劉朝陽(yáng);語(yǔ)音識(shí)別技術(shù)的未來(lái)[J];互聯(lián)網(wǎng)周刊;2000年07期
3 ;語(yǔ)音識(shí)別技術(shù)的產(chǎn)業(yè)化[J];金卡工程;2002年12期
4 劉云冰;;語(yǔ)音識(shí)別技術(shù)的回顧與展望[J];軟件導(dǎo)刊;2005年13期
5 賀無(wú)名;;語(yǔ)音識(shí)別技術(shù)及其研究進(jìn)展[J];中國(guó)科技信息;2006年18期
6 黃昆;;嵌入式,語(yǔ)音識(shí)別技術(shù)新趨向[J];中國(guó)計(jì)算機(jī)用戶;2006年45期
7 高新濤;陳乖麗;;語(yǔ)音識(shí)別技術(shù)的發(fā)展現(xiàn)狀及應(yīng)用前景[J];甘肅科技縱橫;2007年04期
8 任杰;;語(yǔ)音識(shí)別技術(shù)概述[J];大眾科技;2010年08期
9 廖锎;;淺析語(yǔ)音識(shí)別技術(shù)的發(fā)展及趨勢(shì)[J];科技傳播;2010年17期
10 ;谷歌推出手機(jī)語(yǔ)音識(shí)別技術(shù)[J];電腦與電信;2010年08期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條
1 蔡偉建;;人工神經(jīng)網(wǎng)絡(luò)理論在語(yǔ)音識(shí)別技術(shù)中的應(yīng)用[A];第八屆全國(guó)信息獲取與處理學(xué)術(shù)會(huì)議論文集[C];2010年
2 張化云;韓兆兵;徐波;;語(yǔ)音服務(wù)器中的語(yǔ)音識(shí)別技術(shù)[A];開(kāi)創(chuàng)新世紀(jì)的通信技術(shù)——第七屆全國(guó)青年通信學(xué)術(shù)會(huì)議論文集[C];2001年
3 方棣棠;李樹(shù)青;;語(yǔ)音識(shí)別技術(shù)突破之路——如何使語(yǔ)音識(shí)別技術(shù)走向?qū)嵱肹A];第八屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];2005年
4 賈磊;;深度神經(jīng)網(wǎng)絡(luò)建模的最新工業(yè)進(jìn)展和結(jié)合語(yǔ)義理解的語(yǔ)音識(shí)別技術(shù)[A];第十二屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議(NCMMSC'2013)論文集[C];2013年
5 趙美澤;王峰;;基于消除混響的語(yǔ)音識(shí)別技術(shù)研究[A];2008通信理論與技術(shù)新發(fā)展——第十三屆全國(guó)青年通信學(xué)術(shù)會(huì)議論文集(下)[C];2008年
6 蔡志博;俞鐵城;;語(yǔ)音識(shí)別技術(shù)的應(yīng)用[A];西部大開(kāi)發(fā) 科教先行與可持續(xù)發(fā)展——中國(guó)科協(xié)2000年學(xué)術(shù)年會(huì)文集[C];2000年
7 呂成國(guó);趙冰;;低信噪比下語(yǔ)音識(shí)別技術(shù)的研究[A];黑龍江省計(jì)算機(jī)學(xué)會(huì)2007年學(xué)術(shù)交流年會(huì)論文集[C];2007年
8 魏峰;徐成;曾祺;;基于HMM的語(yǔ)音識(shí)別技術(shù)研究[A];2006通信理論與技術(shù)新進(jìn)展——第十一屆全國(guó)青年通信學(xué)術(shù)會(huì)議論文集[C];2006年
9 黃媛;俞舸;呂士楠;;車(chē)載識(shí)別庫(kù)的設(shè)計(jì)和制作[A];中國(guó)聲學(xué)學(xué)會(huì)2006年全國(guó)聲學(xué)學(xué)術(shù)會(huì)議論文集[C];2006年
10 張茹;韓紀(jì)慶;;基于DTW算法的自動(dòng)發(fā)音錯(cuò)誤檢測(cè)[A];第八屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];2005年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前10條
1 陳琳;語(yǔ)音識(shí)別技術(shù)升級(jí),人機(jī)對(duì)話時(shí)代來(lái)臨[N];第一財(cái)經(jīng)日?qǐng)?bào);2007年
2 京晨;中科院最新語(yǔ)音識(shí)別技術(shù)面世[N];福建科技報(bào);2002年
3 IBM中國(guó)研究中心 沈麗琴博士;語(yǔ)音識(shí)別技術(shù)離我們有多遠(yuǎn)[N];光明日?qǐng)?bào);2000年
4 ;語(yǔ)音識(shí)別技術(shù)前景誘人[N];人民郵電;2001年
5 ;用語(yǔ)言“改變”世界[N];計(jì)算機(jī)世界;2001年
6 英國(guó)《經(jīng)濟(jì)學(xué)人》;有錯(cuò)請(qǐng)糾正:語(yǔ)音識(shí)別技術(shù)新進(jìn)展[N];世界報(bào);2010年
7 ;精彩演繹語(yǔ)音識(shí)別技術(shù)[N];人民郵電;2001年
8 記者 王雙;我市參加第九屆“高交會(huì)”收獲成果[N];盤(pán)錦日?qǐng)?bào);2007年
9 記者 薛冬;中文語(yǔ)音識(shí)別技術(shù)取得突破[N];光明日?qǐng)?bào);2002年
10 王朝選;科大訊飛語(yǔ)音識(shí)別技術(shù)取得重大進(jìn)展[N];中國(guó)高新技術(shù)產(chǎn)業(yè)導(dǎo)報(bào);2008年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前3條
1 王歡良;基于混淆網(wǎng)絡(luò)和輔助信息的語(yǔ)音識(shí)別技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2007年
2 張軍;抗噪聲語(yǔ)音識(shí)別技術(shù)的研究[D];華南理工大學(xué);2003年
3 董婧;魯棒語(yǔ)音識(shí)別技術(shù)的研究[D];吉林大學(xué);2007年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 張朝陽(yáng);語(yǔ)音識(shí)別技術(shù)在盲用導(dǎo)航系統(tǒng)中的應(yīng)用[D];北方工業(yè)大學(xué);2011年
2 錢(qián)磊;外業(yè)調(diào)繪系統(tǒng)中的語(yǔ)音識(shí)別技術(shù)研究[D];長(zhǎng)安大學(xué);2015年
3 鄭磊;魯棒性連續(xù)語(yǔ)音識(shí)別的研究及其在Android平臺(tái)的應(yīng)用[D];電子科技大學(xué);2014年
4 王琳;噪聲環(huán)境下的魯棒語(yǔ)音識(shí)別技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2016年
5 胡嘉林;基于語(yǔ)音識(shí)別技術(shù)的溫室自動(dòng)化控制系統(tǒng)研究[D];昆明理工大學(xué);2015年
6 楊波;基于語(yǔ)音識(shí)別技術(shù)的白馬語(yǔ)言保護(hù)研究[D];蘭州大學(xué);2016年
7 胡寶花;基于HMM-ANN模型的語(yǔ)音識(shí)別技術(shù)研究[D];南昌航空大學(xué);2016年
8 羅云;語(yǔ)音識(shí)別技術(shù)在超聲波系統(tǒng)中的應(yīng)用[D];四川大學(xué);2005年
9 洪祥元;基于語(yǔ)音識(shí)別技術(shù)的智能地球儀系統(tǒng)設(shè)計(jì)[D];北京交通大學(xué);2012年
10 陳一寧;英語(yǔ)口語(yǔ)學(xué)習(xí)中的語(yǔ)音識(shí)別技術(shù)[D];上海交通大學(xué);2010年
,本文編號(hào):759802
本文鏈接:http://www.sikaile.net/kejilunwen/xinxigongchenglunwen/759802.html