天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

武漢方言語音識別系統(tǒng)研究

發(fā)布時間:2017-08-23 14:22

  本文關(guān)鍵詞:武漢方言語音識別系統(tǒng)研究


  更多相關(guān)文章: 武漢方言 語音識別 小波變換 重分形


【摘要】:語音識別自上世紀(jì)50年代興起一直是研究的熱點之一。我國研究語音識別技術(shù)較國外稍晚,自八十年代為其設(shè)立專項開始,到今天為止已經(jīng)取得很多突破性的進展,但仍然有很多技術(shù)難關(guān)沒有攻破,除了語音識別技術(shù)的復(fù)雜性,漢語方言的多樣性也給其帶來了諸多的挑戰(zhàn)。當(dāng)前,已經(jīng)有一些科研人員將地方方言考慮到語音識別系統(tǒng)之中,但是由于這才處于開始階段,仍然有很多關(guān)鍵性問題沒有被解決。完整的連續(xù)語音識別系統(tǒng)主要包括四個部分:預(yù)處理,特征提取,聲學(xué)模型和語言模型。預(yù)處理模塊主要是對輸入語音信號進行處理,原始語音信號通常受到噪音的干擾,以及聲源緣故可能造成的信號較弱,通過預(yù)處理之后,語音信號在不失真的情況下能過濾掉大部分噪音,且使得原本較弱的信號得到加強。特征提取主要是提取語音信號中能夠區(qū)別不同信號的特征參數(shù),目前應(yīng)用最為廣泛的特征參數(shù)是Mel倒譜系數(shù)。聲學(xué)模型通過訓(xùn)練語音庫獲取參數(shù)模型,識別階段得到最佳參數(shù)流。語音模型的作用就是根據(jù)聲學(xué)層的參數(shù)流預(yù)測某個自然語言出現(xiàn)的概率。本文根據(jù)著重討論其中三部分:預(yù)處理中語音端點檢測、基于HMM的聲學(xué)模型和基于統(tǒng)計的語言模型。完成的主要工作如下:1)分析了武漢方言的發(fā)音特點,對比普通話的發(fā)音特性,標(biāo)注出其差異性,提取其語音特征,創(chuàng)建小型的武漢方言語音識別語料庫。2)利用小波重構(gòu)語音信號,平滑處理背景噪音,改善語音端點檢測在低信噪比情形下檢測準(zhǔn)確率低的缺點。3)提出一種基于重分形的語音端點檢測方法。利用語音信號的分形特性,逐次求取分形維數(shù),并計算其與語音段和非語音段的相關(guān)性,以此確定語音信號的端點。4)構(gòu)建基于HTK的武漢方言語音識別系統(tǒng),從不同維度提取武漢方言的不同特征參數(shù)進行語音識別實驗。
【關(guān)鍵詞】:武漢方言 語音識別 小波變換 重分形
【學(xué)位授予單位】:武漢工程大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TN912.34
【目錄】:
  • 摘要5-6
  • ABSTRACT6-10
  • 第1章 緒論10-16
  • 1.1 語音識別研究背景10-12
  • 1.1.1 語音識別的發(fā)展歷史與現(xiàn)狀10-11
  • 1.1.2 國內(nèi)語音識別的發(fā)展歷史與現(xiàn)狀11-12
  • 1.2 語音識別關(guān)鍵技術(shù)概述12-13
  • 1.3 課題研究內(nèi)容及意義13-16
  • 1.3.1 研究意義13-14
  • 1.3.2 論文結(jié)構(gòu)安排14-16
  • 第2章 語音端點檢測16-22
  • 2.1 語音端點檢測概述16
  • 2.2 語音端點檢測原理16-18
  • 2.3 常用語音端點檢測算法18-20
  • 2.3.1 短時能量18
  • 2.3.2 短時平均過零率18-19
  • 2.3.3 基于短時能量和過零率的雙門限檢測方法19-20
  • 2.4 本章小結(jié)20-22
  • 第3章 基于小波變換的重分形語音端點檢測方法22-38
  • 3.1 概述22-25
  • 3.1.1 分形簡介22-23
  • 3.1.2 典型單重分形維數(shù)23-24
  • 3.1.3 分形盒維數(shù)計算方法24-25
  • 3.2 多重分形25-27
  • 3.2.1 多重分形概述25-26
  • 3.2.2 廣義維數(shù)計算方法26-27
  • 3.3 分形維數(shù)的信號度量能力27-29
  • 3.4 小波去噪29-33
  • 3.4.1 小波去噪原理29-30
  • 3.4.2 合理選擇分解與重構(gòu)尺度30-33
  • 3.5 重分形的語音端點檢測技術(shù)33-38
  • 3.5.1 多重分形端點檢測基本原理33-34
  • 3.5.2 重分形的相關(guān)性度量方法34
  • 3.5.3 重分形的語音端點檢測實現(xiàn)過程34-38
  • 第4章 基于HMM的聲學(xué)模型38-48
  • 4.1 HMM基本原理38-40
  • 4.2 HMM的核心問題40-41
  • 4.3 HMM基本算法41-46
  • 4.3.1 向前-向后算法41-44
  • 4.3.2 Viterbi算法44-45
  • 4.3.3 Baum-Welch算法45-46
  • 4.4 本章小結(jié)46-48
  • 第5章 語言模型48-56
  • 5.1 語言模型的分類48-51
  • 5.1.1 基于規(guī)則的語言模型48-49
  • 5.1.2 基于統(tǒng)計的語言模型49-51
  • 5.2 語言模型的平滑技術(shù)51-54
  • 5.2.1 線性插值平滑52
  • 5.2.2 Good-Turing平滑法52-53
  • 5.2.3 Katz平滑技術(shù)53-54
  • 5.3 語言模型的度量54-55
  • 5.3.1 困惑度54-55
  • 5.3.2 熵55
  • 5.4 本章小結(jié)55-56
  • 第6章 基于HTK的武漢方言語音識別系統(tǒng)的構(gòu)建56-64
  • 6.1 HTK工作基本原理56-57
  • 6.2 語音采集與語料庫建立57-59
  • 6.2.1 聲學(xué)模型建模單元的選取57-58
  • 6.2.2 武漢方言注音符號系統(tǒng)58
  • 6.2.3 語料庫建立58-59
  • 6.3 特征提取59-60
  • 6.4 語言模型的建立與訓(xùn)練60-63
  • 6.5 聲學(xué)模型訓(xùn)練63-64
  • 第7章 實驗及數(shù)據(jù)分析64-70
  • 7.1 實驗樣本64
  • 7.2 實驗評價標(biāo)準(zhǔn)64-66
  • 7.3 實驗方案設(shè)計與結(jié)果分析66-70
  • 第8章 總結(jié)與展望70-72
  • 參考文獻72-78
  • 攻讀碩士期間已發(fā)表的論文78-80
  • 致謝80

【相似文獻】

中國期刊全文數(shù)據(jù)庫 前10條

1 韓紀(jì)慶,王承發(fā),呂成國,張磊,任為民,馬永林;噪聲環(huán)境下頑健的語音識別系統(tǒng)[J];電聲技術(shù);2002年01期

2 單翼翔,張昊天,李虎生,鐘林,張進,劉加,劉潤生;郵包校核語音識別系統(tǒng)的實時實現(xiàn)[J];電子學(xué)報;2002年04期

3 許海天,吳及,王作英;漢語連續(xù)數(shù)字串語音識別系統(tǒng)[J];計算機工程與應(yīng)用;2002年02期

4 梁釗;分布式語音識別系統(tǒng)及其相關(guān)技術(shù)[J];計算機工程與應(yīng)用;2002年12期

5 武劍虹,黃石磊,匡鏡明;語音識別系統(tǒng)測試平臺設(shè)計[J];電訊技術(shù);2003年04期

6 孫恒,李春;嵌入式語音識別系統(tǒng)的研究[J];計算機與現(xiàn)代化;2003年06期

7 孟建庭,吳及,王作英;分布式語音識別系統(tǒng)的架構(gòu)分析和具體實現(xiàn)[J];電聲技術(shù);2004年08期

8 郭罡,李錦宇,李小兵,劉波,王仁華;嵌入式命令詞語音識別系統(tǒng)[J];信號處理;2004年05期

9 黃啟良;漢語方言語音識別系統(tǒng)的構(gòu)建[J];廣西科學(xué)院學(xué)報;2005年03期

10 劉彬;董金明;;語音識別系統(tǒng)[J];電子測量技術(shù);2005年06期

中國重要會議論文全文數(shù)據(jù)庫 前10條

1 王仁華;倪晉富;;語音識別系統(tǒng)評估初探[A];第二屆全國人機語音通訊學(xué)術(shù)會議論文集[C];1992年

2 遲邊進;方棣棠;;粗識別在大字表語音識別系統(tǒng)中的應(yīng)用[A];第一屆全國語言識別學(xué)術(shù)報告與展示會論文集[C];1990年

3 劉家松;劉承璽;李愛軍;;對語音識別系統(tǒng)中一些環(huán)節(jié)的計算方法的選擇[A];第一屆全國語言識別學(xué)術(shù)報告與展示會論文集[C];1990年

4 秦勇;莫福源;李昌立;關(guān)定華;;漢語超大詞匯語音識別系統(tǒng)的研究與實現(xiàn)[A];第四屆全國人機語音通訊學(xué)術(shù)會議論文集[C];1996年

5 幸璐璐;謝莎莎;王俠;孫甲松;王作英;;利用廢料模型改進受限域語音識別系統(tǒng)[A];第八屆全國人機語音通訊學(xué)術(shù)會議論文集[C];2005年

6 胡春靜;吳善培;;不定人的語音識別系統(tǒng)[A];第三屆全國人機語音通訊學(xué)術(shù)會議論文集[C];1994年

7 方敏;浦劍濤;李成榮;臺憲青;;嵌入式語音識別系統(tǒng)的研究和實現(xiàn)[A];第七屆全國人機語音通訊學(xué)術(shù)會議(NCMMSC7)論文集[C];2003年

8 高勤;吳昊;袁麗;吳璽宏;遲惠生;;語音識別系統(tǒng)實時優(yōu)化方法研究及實現(xiàn)[A];第八屆全國人機語音通訊學(xué)術(shù)會議論文集[C];2005年

9 孫甲松;肖熙;王作英;;利用有調(diào)拼音模型改進語音識別系統(tǒng)的穩(wěn)健性[A];第七屆全國人機語音通訊學(xué)術(shù)會議(NCMMSC7)論文集[C];2003年

10 陳立偉;趙春暉;;一種抗噪聲語音識別系統(tǒng)的設(shè)計[A];第二屆全國信息獲取與處理學(xué)術(shù)會議論文集[C];2004年

中國重要報紙全文數(shù)據(jù)庫 前10條

1 平遠;多語種交談式語音識別系統(tǒng)[N];北京電子報;2000年

2 張群英;IBM新中文語音識別系統(tǒng)動口不動手[N];中國計算機報;2000年

3 ;e-t@lk語音識別系統(tǒng)亮相中國[N];國際商報;2000年

4 北大企研中心研究部 科強 楚天 一清;我惟一 我存在[N];中國計算機報;2001年

5 ;集成信息技術(shù)提高物流精準(zhǔn)度[N];現(xiàn)代物流報;2008年

6 吳德強;機器人出國當(dāng)導(dǎo)游[N];北京科技報;2004年

7 本報記者 操秀英;手機當(dāng)?shù)?電腦讓路?[N];科技日報;2007年

8 本報記者 齊芳 通訊員 發(fā)強;中科院聲學(xué)所:探索聲音的奧秘[N];光明日報;2004年

9 宋玉慧;“傻瓜家電”在沈走俏[N];中國電子報;2002年

10 特約撰稿人 朱麗亞 本報記者 潘峰;黃學(xué)東人生路上總是快一步[N];中國高新技術(shù)產(chǎn)業(yè)導(dǎo)報;2003年

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 飛龍;蒙古語語音識別系統(tǒng)的研究與優(yōu)化[D];內(nèi)蒙古大學(xué);2009年

2 王坤卿;小詞匯量語音識別系統(tǒng)[D];中國石油大學(xué);2010年

3 魏力;嵌入式語音識別系統(tǒng)的研究[D];武漢理工大學(xué);2006年

4 肖翠萍;小波變換在語音識別系統(tǒng)的研究與實現(xiàn)[D];吉林大學(xué);2004年

5 賀寬;車載多媒體語音識別系統(tǒng)設(shè)計[D];武漢理工大學(xué);2008年

6 斯蕓蕓;嵌入式語音識別系統(tǒng)的設(shè)計與實現(xiàn)[D];重慶大學(xué);2012年

7 高朝煌;非特定人漢語連續(xù)數(shù)字語音識別系統(tǒng)的研究與實現(xiàn)[D];西安電子科技大學(xué);2011年

8 周艷萍;機器人嵌入式語音識別系統(tǒng)設(shè)計與開發(fā)[D];華南理工大學(xué);2012年

9 龐陟儒;支持向量機語音識別系統(tǒng)的數(shù)據(jù)分析預(yù)選取算法研究[D];太原理工大學(xué);2013年

10 葉亮亮;基于拼音音元的語音識別系統(tǒng)研究與設(shè)計[D];重慶大學(xué);2013年

,

本文編號:725533

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/wltx/725533.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶eece9***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com