維吾爾語連續(xù)語音流中音素的自動切分算法研究與實現
發(fā)布時間:2022-02-20 20:59
語料庫的建設是語音信息處理的基礎工作,其中除了在語料收集和錄音等方面做大量工作外,做準確的標注也是建立完善語料庫的必要工作,因為這直接影響語音處理工作的結果。本文就以建立維吾爾語音語料庫為目的,為了減少人工工作量,提高標注準確率,結合維吾爾語語音特征,通過HTK工具實現了基于單音素HMM模型的自動切分算法和基于三音素HMM模型的自動切分算法。其中完成了文本設計、錄音、手動標注、音素列表的確定、上下文屬性集與問題集的設計、帶時間標注文件與不帶時間的上下文相關標注文件的生成等數據準備工作;研究HMM和HTK的用法,配置適合維吾爾語音素級自動切分的HMM拓撲結構,通過訓練得到單音素模型和三音素模型,對任意輸入的語音句子自動切分,最后分析了兩種算法的切分準確度、存在的問題及對策等。實驗結果證明基于三音素HMM模型的自動切分準確率高于基于單音素模型的自動切分準確率。
【文章來源】:新疆大學新疆維吾爾自治區(qū)211工程院校
【文章頁數】:60 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 課題研究背景及意義
1.1.1 課題背景
1.1.2 研究意義
1.2 語音自動切分技術的研究現狀
1.2.1 人工切分方法
1.2.2 基于HMM 的自動切分方法
1.2.3 基于DTW 的自動切分方法
1.2.4 其他方法及總結
1.3 本文的研究內容及安排
第二章 語音自動切分的相關技術
2.1 語音切分單元的選取
2.2 模型訓練和匹配技術
2.3 HMM 簡介
2.3.1 HMM 基本概念
2.3.2 HMM 的三個基本問題
2.4 HTK 工具簡介
第三章 維吾爾語連續(xù)語音流中音素的自動切分算法研究和實現
3.1 維吾爾語語音學基礎
3.1.1 音素和音節(jié)
3.1.2 元音和輔音
3.2 維吾爾語語音自動切分基元的選取
3.3 數據準備
3.3.1 文本語料的收集與挑選
3.3.2 語音語料的設計與錄音
3.4 基于單音素HMM 模型的音素自動切分算法
3.4.1 自動切分流程
3.4.2 模型參數配置
3.4.3 音素列表的確定
3.4.4 帶時間的標注文件
3.4.5 單音素模型的初始化和訓練
3.4.6 音素自動切分
3.5 基于三音素HMM 模型的音素自動切分算法
3.5.1 自動切分流程
3.5.2 上下文屬性的設計
3.5.3 問題集的設計
3.5.4 不帶時間的上下文相關標注文件
3.5.5 上下文相關模型的訓練
3.5.6 音素自動切分
第四章 實驗結果與分析
4.1 實驗結果
4.2 存在的問題及其對策
第五章 總結與展望
5.1 總結
5.2 展望
參考文獻
在研期間發(fā)表論文及參與課題
致謝
【參考文獻】:
期刊論文
[1]BP人工神經元網絡與漢語語音的音節(jié)切分[J]. 胡瑞敏,薛東輝,姚天任,黃鐵俠. 華中理工大學學報. 1996(S2)
博士論文
[1]基于隱馬爾科夫模型的語音合成技術研究[D]. 吳義堅.中國科學技術大學 2006
碩士論文
[1]面向語音合成的維吾爾語韻律層級自動標注算法研究[D]. 努爾比婭·塔依爾.新疆大學 2010
[2]HMM在基于參數的語音合成系統(tǒng)中的應用[D]. 杜嘉.上海交通大學 2008
[3]基于HMM的維吾爾語音合成系統(tǒng)的研究與實現[D]. 艾斯卡爾·肉孜.新疆大學 2008
[4]方言口音普通話語音自動切分算法研究[D]. 杜守栓.中國科學院研究生院(計算技術研究所) 2006
本文編號:3635795
【文章來源】:新疆大學新疆維吾爾自治區(qū)211工程院校
【文章頁數】:60 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 課題研究背景及意義
1.1.1 課題背景
1.1.2 研究意義
1.2 語音自動切分技術的研究現狀
1.2.1 人工切分方法
1.2.2 基于HMM 的自動切分方法
1.2.3 基于DTW 的自動切分方法
1.2.4 其他方法及總結
1.3 本文的研究內容及安排
第二章 語音自動切分的相關技術
2.1 語音切分單元的選取
2.2 模型訓練和匹配技術
2.3 HMM 簡介
2.3.1 HMM 基本概念
2.3.2 HMM 的三個基本問題
2.4 HTK 工具簡介
第三章 維吾爾語連續(xù)語音流中音素的自動切分算法研究和實現
3.1 維吾爾語語音學基礎
3.1.1 音素和音節(jié)
3.1.2 元音和輔音
3.2 維吾爾語語音自動切分基元的選取
3.3 數據準備
3.3.1 文本語料的收集與挑選
3.3.2 語音語料的設計與錄音
3.4 基于單音素HMM 模型的音素自動切分算法
3.4.1 自動切分流程
3.4.2 模型參數配置
3.4.3 音素列表的確定
3.4.4 帶時間的標注文件
3.4.5 單音素模型的初始化和訓練
3.4.6 音素自動切分
3.5 基于三音素HMM 模型的音素自動切分算法
3.5.1 自動切分流程
3.5.2 上下文屬性的設計
3.5.3 問題集的設計
3.5.4 不帶時間的上下文相關標注文件
3.5.5 上下文相關模型的訓練
3.5.6 音素自動切分
第四章 實驗結果與分析
4.1 實驗結果
4.2 存在的問題及其對策
第五章 總結與展望
5.1 總結
5.2 展望
參考文獻
在研期間發(fā)表論文及參與課題
致謝
【參考文獻】:
期刊論文
[1]BP人工神經元網絡與漢語語音的音節(jié)切分[J]. 胡瑞敏,薛東輝,姚天任,黃鐵俠. 華中理工大學學報. 1996(S2)
博士論文
[1]基于隱馬爾科夫模型的語音合成技術研究[D]. 吳義堅.中國科學技術大學 2006
碩士論文
[1]面向語音合成的維吾爾語韻律層級自動標注算法研究[D]. 努爾比婭·塔依爾.新疆大學 2010
[2]HMM在基于參數的語音合成系統(tǒng)中的應用[D]. 杜嘉.上海交通大學 2008
[3]基于HMM的維吾爾語音合成系統(tǒng)的研究與實現[D]. 艾斯卡爾·肉孜.新疆大學 2008
[4]方言口音普通話語音自動切分算法研究[D]. 杜守栓.中國科學院研究生院(計算技術研究所) 2006
本文編號:3635795
本文鏈接:http://www.sikaile.net/wenyilunwen/yuyanyishu/3635795.html