武漢方言語音識別系統(tǒng)研究
本文關(guān)鍵詞:武漢方言語音識別系統(tǒng)研究
更多相關(guān)文章: 武漢方言 語音識別 小波變換 重分形
【摘要】:語音識別自上世紀(jì)50年代興起一直是研究的熱點之一。我國研究語音識別技術(shù)較國外稍晚,自八十年代為其設(shè)立專項開始,到今天為止已經(jīng)取得很多突破性的進展,但仍然有很多技術(shù)難關(guān)沒有攻破,除了語音識別技術(shù)的復(fù)雜性,漢語方言的多樣性也給其帶來了諸多的挑戰(zhàn)。當(dāng)前,已經(jīng)有一些科研人員將地方方言考慮到語音識別系統(tǒng)之中,但是由于這才處于開始階段,仍然有很多關(guān)鍵性問題沒有被解決。完整的連續(xù)語音識別系統(tǒng)主要包括四個部分:預(yù)處理,特征提取,聲學(xué)模型和語言模型。預(yù)處理模塊主要是對輸入語音信號進行處理,原始語音信號通常受到噪音的干擾,以及聲源緣故可能造成的信號較弱,通過預(yù)處理之后,語音信號在不失真的情況下能過濾掉大部分噪音,且使得原本較弱的信號得到加強。特征提取主要是提取語音信號中能夠區(qū)別不同信號的特征參數(shù),目前應(yīng)用最為廣泛的特征參數(shù)是Mel倒譜系數(shù)。聲學(xué)模型通過訓(xùn)練語音庫獲取參數(shù)模型,識別階段得到最佳參數(shù)流。語音模型的作用就是根據(jù)聲學(xué)層的參數(shù)流預(yù)測某個自然語言出現(xiàn)的概率。本文根據(jù)著重討論其中三部分:預(yù)處理中語音端點檢測、基于HMM的聲學(xué)模型和基于統(tǒng)計的語言模型。完成的主要工作如下:1)分析了武漢方言的發(fā)音特點,對比普通話的發(fā)音特性,標(biāo)注出其差異性,提取其語音特征,創(chuàng)建小型的武漢方言語音識別語料庫。2)利用小波重構(gòu)語音信號,平滑處理背景噪音,改善語音端點檢測在低信噪比情形下檢測準(zhǔn)確率低的缺點。3)提出一種基于重分形的語音端點檢測方法。利用語音信號的分形特性,逐次求取分形維數(shù),并計算其與語音段和非語音段的相關(guān)性,以此確定語音信號的端點。4)構(gòu)建基于HTK的武漢方言語音識別系統(tǒng),從不同維度提取武漢方言的不同特征參數(shù)進行語音識別實驗。
【關(guān)鍵詞】:武漢方言 語音識別 小波變換 重分形
【學(xué)位授予單位】:武漢工程大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TN912.34
【目錄】:
- 摘要5-6
- ABSTRACT6-10
- 第1章 緒論10-16
- 1.1 語音識別研究背景10-12
- 1.1.1 語音識別的發(fā)展歷史與現(xiàn)狀10-11
- 1.1.2 國內(nèi)語音識別的發(fā)展歷史與現(xiàn)狀11-12
- 1.2 語音識別關(guān)鍵技術(shù)概述12-13
- 1.3 課題研究內(nèi)容及意義13-16
- 1.3.1 研究意義13-14
- 1.3.2 論文結(jié)構(gòu)安排14-16
- 第2章 語音端點檢測16-22
- 2.1 語音端點檢測概述16
- 2.2 語音端點檢測原理16-18
- 2.3 常用語音端點檢測算法18-20
- 2.3.1 短時能量18
- 2.3.2 短時平均過零率18-19
- 2.3.3 基于短時能量和過零率的雙門限檢測方法19-20
- 2.4 本章小結(jié)20-22
- 第3章 基于小波變換的重分形語音端點檢測方法22-38
- 3.1 概述22-25
- 3.1.1 分形簡介22-23
- 3.1.2 典型單重分形維數(shù)23-24
- 3.1.3 分形盒維數(shù)計算方法24-25
- 3.2 多重分形25-27
- 3.2.1 多重分形概述25-26
- 3.2.2 廣義維數(shù)計算方法26-27
- 3.3 分形維數(shù)的信號度量能力27-29
- 3.4 小波去噪29-33
- 3.4.1 小波去噪原理29-30
- 3.4.2 合理選擇分解與重構(gòu)尺度30-33
- 3.5 重分形的語音端點檢測技術(shù)33-38
- 3.5.1 多重分形端點檢測基本原理33-34
- 3.5.2 重分形的相關(guān)性度量方法34
- 3.5.3 重分形的語音端點檢測實現(xiàn)過程34-38
- 第4章 基于HMM的聲學(xué)模型38-48
- 4.1 HMM基本原理38-40
- 4.2 HMM的核心問題40-41
- 4.3 HMM基本算法41-46
- 4.3.1 向前-向后算法41-44
- 4.3.2 Viterbi算法44-45
- 4.3.3 Baum-Welch算法45-46
- 4.4 本章小結(jié)46-48
- 第5章 語言模型48-56
- 5.1 語言模型的分類48-51
- 5.1.1 基于規(guī)則的語言模型48-49
- 5.1.2 基于統(tǒng)計的語言模型49-51
- 5.2 語言模型的平滑技術(shù)51-54
- 5.2.1 線性插值平滑52
- 5.2.2 Good-Turing平滑法52-53
- 5.2.3 Katz平滑技術(shù)53-54
- 5.3 語言模型的度量54-55
- 5.3.1 困惑度54-55
- 5.3.2 熵55
- 5.4 本章小結(jié)55-56
- 第6章 基于HTK的武漢方言語音識別系統(tǒng)的構(gòu)建56-64
- 6.1 HTK工作基本原理56-57
- 6.2 語音采集與語料庫建立57-59
- 6.2.1 聲學(xué)模型建模單元的選取57-58
- 6.2.2 武漢方言注音符號系統(tǒng)58
- 6.2.3 語料庫建立58-59
- 6.3 特征提取59-60
- 6.4 語言模型的建立與訓(xùn)練60-63
- 6.5 聲學(xué)模型訓(xùn)練63-64
- 第7章 實驗及數(shù)據(jù)分析64-70
- 7.1 實驗樣本64
- 7.2 實驗評價標(biāo)準(zhǔn)64-66
- 7.3 實驗方案設(shè)計與結(jié)果分析66-70
- 第8章 總結(jié)與展望70-72
- 參考文獻72-78
- 攻讀碩士期間已發(fā)表的論文78-80
- 致謝80
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 韓紀(jì)慶,王承發(fā),呂成國,張磊,任為民,馬永林;噪聲環(huán)境下頑健的語音識別系統(tǒng)[J];電聲技術(shù);2002年01期
2 單翼翔,張昊天,李虎生,鐘林,張進,劉加,劉潤生;郵包校核語音識別系統(tǒng)的實時實現(xiàn)[J];電子學(xué)報;2002年04期
3 許海天,吳及,王作英;漢語連續(xù)數(shù)字串語音識別系統(tǒng)[J];計算機工程與應(yīng)用;2002年02期
4 梁釗;分布式語音識別系統(tǒng)及其相關(guān)技術(shù)[J];計算機工程與應(yīng)用;2002年12期
5 武劍虹,黃石磊,匡鏡明;語音識別系統(tǒng)測試平臺設(shè)計[J];電訊技術(shù);2003年04期
6 孫恒,李春;嵌入式語音識別系統(tǒng)的研究[J];計算機與現(xiàn)代化;2003年06期
7 孟建庭,吳及,王作英;分布式語音識別系統(tǒng)的架構(gòu)分析和具體實現(xiàn)[J];電聲技術(shù);2004年08期
8 郭罡,李錦宇,李小兵,劉波,王仁華;嵌入式命令詞語音識別系統(tǒng)[J];信號處理;2004年05期
9 黃啟良;漢語方言語音識別系統(tǒng)的構(gòu)建[J];廣西科學(xué)院學(xué)報;2005年03期
10 劉彬;董金明;;語音識別系統(tǒng)[J];電子測量技術(shù);2005年06期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 王仁華;倪晉富;;語音識別系統(tǒng)評估初探[A];第二屆全國人機語音通訊學(xué)術(shù)會議論文集[C];1992年
2 遲邊進;方棣棠;;粗識別在大字表語音識別系統(tǒng)中的應(yīng)用[A];第一屆全國語言識別學(xué)術(shù)報告與展示會論文集[C];1990年
3 劉家松;劉承璽;李愛軍;;對語音識別系統(tǒng)中一些環(huán)節(jié)的計算方法的選擇[A];第一屆全國語言識別學(xué)術(shù)報告與展示會論文集[C];1990年
4 秦勇;莫福源;李昌立;關(guān)定華;;漢語超大詞匯語音識別系統(tǒng)的研究與實現(xiàn)[A];第四屆全國人機語音通訊學(xué)術(shù)會議論文集[C];1996年
5 幸璐璐;謝莎莎;王俠;孫甲松;王作英;;利用廢料模型改進受限域語音識別系統(tǒng)[A];第八屆全國人機語音通訊學(xué)術(shù)會議論文集[C];2005年
6 胡春靜;吳善培;;不定人的語音識別系統(tǒng)[A];第三屆全國人機語音通訊學(xué)術(shù)會議論文集[C];1994年
7 方敏;浦劍濤;李成榮;臺憲青;;嵌入式語音識別系統(tǒng)的研究和實現(xiàn)[A];第七屆全國人機語音通訊學(xué)術(shù)會議(NCMMSC7)論文集[C];2003年
8 高勤;吳昊;袁麗;吳璽宏;遲惠生;;語音識別系統(tǒng)實時優(yōu)化方法研究及實現(xiàn)[A];第八屆全國人機語音通訊學(xué)術(shù)會議論文集[C];2005年
9 孫甲松;肖熙;王作英;;利用有調(diào)拼音模型改進語音識別系統(tǒng)的穩(wěn)健性[A];第七屆全國人機語音通訊學(xué)術(shù)會議(NCMMSC7)論文集[C];2003年
10 陳立偉;趙春暉;;一種抗噪聲語音識別系統(tǒng)的設(shè)計[A];第二屆全國信息獲取與處理學(xué)術(shù)會議論文集[C];2004年
中國重要報紙全文數(shù)據(jù)庫 前10條
1 平遠;多語種交談式語音識別系統(tǒng)[N];北京電子報;2000年
2 張群英;IBM新中文語音識別系統(tǒng)動口不動手[N];中國計算機報;2000年
3 ;e-t@lk語音識別系統(tǒng)亮相中國[N];國際商報;2000年
4 北大企研中心研究部 科強 楚天 一清;我惟一 我存在[N];中國計算機報;2001年
5 ;集成信息技術(shù)提高物流精準(zhǔn)度[N];現(xiàn)代物流報;2008年
6 吳德強;機器人出國當(dāng)導(dǎo)游[N];北京科技報;2004年
7 本報記者 操秀英;手機當(dāng)?shù)?電腦讓路?[N];科技日報;2007年
8 本報記者 齊芳 通訊員 發(fā)強;中科院聲學(xué)所:探索聲音的奧秘[N];光明日報;2004年
9 宋玉慧;“傻瓜家電”在沈走俏[N];中國電子報;2002年
10 特約撰稿人 朱麗亞 本報記者 潘峰;黃學(xué)東人生路上總是快一步[N];中國高新技術(shù)產(chǎn)業(yè)導(dǎo)報;2003年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 飛龍;蒙古語語音識別系統(tǒng)的研究與優(yōu)化[D];內(nèi)蒙古大學(xué);2009年
2 王坤卿;小詞匯量語音識別系統(tǒng)[D];中國石油大學(xué);2010年
3 魏力;嵌入式語音識別系統(tǒng)的研究[D];武漢理工大學(xué);2006年
4 肖翠萍;小波變換在語音識別系統(tǒng)的研究與實現(xiàn)[D];吉林大學(xué);2004年
5 賀寬;車載多媒體語音識別系統(tǒng)設(shè)計[D];武漢理工大學(xué);2008年
6 斯蕓蕓;嵌入式語音識別系統(tǒng)的設(shè)計與實現(xiàn)[D];重慶大學(xué);2012年
7 高朝煌;非特定人漢語連續(xù)數(shù)字語音識別系統(tǒng)的研究與實現(xiàn)[D];西安電子科技大學(xué);2011年
8 周艷萍;機器人嵌入式語音識別系統(tǒng)設(shè)計與開發(fā)[D];華南理工大學(xué);2012年
9 龐陟儒;支持向量機語音識別系統(tǒng)的數(shù)據(jù)分析預(yù)選取算法研究[D];太原理工大學(xué);2013年
10 葉亮亮;基于拼音音元的語音識別系統(tǒng)研究與設(shè)計[D];重慶大學(xué);2013年
,本文編號:725533
本文鏈接:http://www.sikaile.net/kejilunwen/wltx/725533.html