基于HMM的可訓(xùn)練傣語語音合成系統(tǒng)
本文關(guān)鍵詞:基于HMM的可訓(xùn)練傣語語音合成系統(tǒng)
更多相關(guān)文章: 語音合成 可訓(xùn)練 傣語 隱馬爾可夫模型 STRAIGHT合成器
【摘要】:語音合成就是通過計算機將任意文字信息轉(zhuǎn)換為可聽懂且高自然度的聲音信息進行輸出的一種技術(shù)。近年來,隨著數(shù)字信號處理技術(shù)和計算機技術(shù)的快速發(fā)展,語音合成技術(shù)發(fā)展也日益成熟,被廣泛應(yīng)用于人機語音通信中。云南是一個少數(shù)民族聚集的邊疆省份,少數(shù)民族人口數(shù)約為1400多萬。其中,有120多萬傣族同胞使用傣語,且主要分布于德宏、保山、西雙版納一帶。隨著傣漢民族間的經(jīng)濟交流和文化交流日益頻繁,傣語語音合成研究的重要性也就不言而喻。本文針對西雙版納新傣文,以開發(fā)傣語語音合成系統(tǒng)為目的,采用基于隱馬爾可夫模型的可訓(xùn)練語音合成方法,對傣語語音合成系統(tǒng)進行了研究。論文的主要工作包括:1.闡述了基于HMM的語音合成基本原理,并在此基礎(chǔ)上研究了傣語可訓(xùn)練語音合成系統(tǒng)的實現(xiàn)方案。2.根據(jù)西雙版納傣語語音特征,完成語音語料庫的構(gòu)建、音素列表的確定、單音子和三音子標(biāo)注文件的獲取和上下文屬性和問題集的設(shè)計等傣語語音合成數(shù)據(jù)準(zhǔn)備工作。3.采用HTK工具包,以均勻切分的1300句語音語料為初始訓(xùn)練數(shù)據(jù),生成每個音子的HMM初始模型。通過多次循環(huán)訓(xùn)練和音子強制對齊,生成音子自動切分標(biāo)注文件。4.基于STRAIGHT合成器的語音合成平臺,對1300句已標(biāo)注的傣語語句進行特征參數(shù)提取和HMM聲學(xué)模型訓(xùn)練以及后端合成器的構(gòu)建。采用訓(xùn)練好的聲學(xué)模型對分析好的待合成語料進行HMM模型決策和參數(shù)預(yù)測,利用STRAIGHT合成器對預(yù)測參數(shù)進行語音波形的生成。實驗結(jié)果表明,利用訓(xùn)練好的聲學(xué)模型,能夠合成出可懂度和自然度都可接受的傣語語句,說明本文采用的傣語合成方案以及音子自動標(biāo)注方法具有可行性。
【關(guān)鍵詞】:語音合成 可訓(xùn)練 傣語 隱馬爾可夫模型 STRAIGHT合成器
【學(xué)位授予單位】:云南大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TN912.33
【目錄】:
- 摘要3-4
- Abstract4-7
- 第一章 緒論7-13
- 1.1 語音合成概述7-11
- 1.1.1 什么是語音合成7-8
- 1.1.2 語音合成技術(shù)方法分類8-9
- 1.1.3 語音合成的發(fā)展歷史與現(xiàn)狀研究9-11
- 1.2 傣語語音合成概述11-12
- 1.2.1 傣語概述11
- 1.2.2 傣語語音合成現(xiàn)狀11-12
- 1.3 作者的工作12
- 1.4 論文的組織12-13
- 第二章 基于HMM的可訓(xùn)練語音合成系統(tǒng)13-19
- 2.1 HMM模型簡介13-16
- 2.1.1 離散馬爾可夫鏈13
- 2.1.2 隱馬爾可夫模型13-15
- 2.1.3 HMM三個基本問題15-16
- 2.2 HMM在語音合成中的應(yīng)用16
- 2.3 合成系統(tǒng)框架16-19
- 2.3.1 合成系統(tǒng)介紹16-18
- 2.3.2 基于HMM的可訓(xùn)練語音合成的特點18-19
- 第三章 傣語語音合成數(shù)據(jù)準(zhǔn)備19-41
- 3.1 語音語料庫構(gòu)建19-20
- 3.1.1 語料獲取19-20
- 3.1.2 錄制語音20
- 3.1.3 發(fā)音文稿校正20
- 3.2 音素列表確定20-25
- 3.3 標(biāo)注文件獲取25-39
- 3.3.1 單音子文件25-36
- 3.3.2 三音子文件36-39
- 3.4 上下文屬性和問題集設(shè)計39-41
- 第四章 傣語語音合成系統(tǒng)構(gòu)建41-51
- 4.1 環(huán)境和工具41-42
- 4.1.1 環(huán)境概述41
- 4.1.2 工具簡介41-42
- 4.2 建模參數(shù)配置42
- 4.3 模型訓(xùn)練42-47
- 4.3.1 特征參數(shù)文件提取42-43
- 4.3.2 HMM模型訓(xùn)練43-47
- 4.4 合成語音47-48
- 4.5 實驗結(jié)果48-51
- 第五章 總結(jié)和展望51-53
- 5.1 總結(jié)51-52
- 5.2 展望52-53
- 參考文獻53-55
- 攻讀碩士學(xué)位期間完成的科研成果55-56
- 致謝56
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 ;移動設(shè)備的又一增值服務(wù)──移動設(shè)備嵌入式語音合成系統(tǒng)[J];通信世界;2001年22期
2 ;科大訊飛新一代語音合成系統(tǒng)新特性[J];通訊世界;2005年06期
3 艾散·帕合提;蔡亞永;買爾丹·祖農(nóng);;語音合成系統(tǒng)的研究與應(yīng)用[J];信息通信;2012年05期
4 朱軍,翟宗起,柴立功,胡永生;智能語音合成系統(tǒng)的研究與實現(xiàn)[J];微機發(fā)展;1997年04期
5 呂慶莉,年瑋;明日的播音明星 幾可亂真的人工語音問世[J];國外科技動態(tài);2003年03期
6 沈承,曹廣益,朱新堅;低成本超大容量電子語音說明書系統(tǒng)的開發(fā)[J];微型機與應(yīng)用;2001年03期
7 ;科大訊飛推出最新語音合成系統(tǒng)InterPhonic C&E v2.1[J];電信科學(xué);2003年04期
8 ;新產(chǎn)品、新技術(shù)簡訊[J];電子科技文摘;2003年12期
9 賈熹濱;尹寶才;李敬華;;語音同步的可視語音合成技術(shù)研究[J];北京工業(yè)大學(xué)學(xué)報;2005年06期
10 張鵬;;嵌入式語音合成系統(tǒng)的一種設(shè)計方案[J];中國水運(理論版);2006年03期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 王仁華;;語音合成系統(tǒng)發(fā)展與最新進展[A];第九屆全國人機語音通訊學(xué)術(shù)會議論文集[C];2007年
2 敖其爾;鞏政;呼日勒巴特爾;王小喻;;蒙古語音合成系統(tǒng)[A];第二屆全國人機語音通訊學(xué)術(shù)會議論文集[C];1992年
3 董世偉;張家,
本文編號:923446
本文鏈接:http://www.sikaile.net/kejilunwen/xinxigongchenglunwen/923446.html