面向語音合成的緬甸語文本分析與實現(xiàn)
發(fā)布時間:2024-04-18 03:57
緬甸語是緬甸的官方語言,屬漢藏語系藏緬甸語族緬甸語支,與同語系的漢語和藏語語音合成研究相比,緬甸語語音合成相關(guān)研究亟待重視。本文以開發(fā)緬甸語語音合成系統(tǒng)為目的,構(gòu)建發(fā)音語料庫,研究并實現(xiàn)文本歸一化、分詞和文本注音。本文的主要工作包括:(1)構(gòu)建發(fā)音語料庫。從緬甸語網(wǎng)站上抓取大約600M原始文本語料,去除語料中的非法字符和重復(fù)句子,并統(tǒng)一文本語料的字符編碼方式。統(tǒng)計文本語料庫中的高頻詞、句子長度、句子類型、聲韻母的分布,將其作為發(fā)音語料選取的依據(jù);為了使發(fā)音語料庫包含的發(fā)音現(xiàn)象、語言現(xiàn)象更加完整,通過句子之間的相似度比較作為另一個選取依據(jù);最終挑選出的發(fā)音語料庫規(guī)模為5000句。(2)文本歸一化。研究了數(shù)字、縮寫詞以及特殊字符的歸一化問題,對不同類型的字符分別提出了具體的歸一化方案并進行了實現(xiàn)。(3)實現(xiàn)三種分詞方法。設(shè)計并實現(xiàn)了基于正向最大匹配(Forward Maximum Matching,簡稱FMM)的分詞、基于條件隨機場模型(Conditional Random Fields,簡稱CRF)分詞以及基于雙向長短期記憶神經(jīng)網(wǎng)絡(luò)+條件隨機場模型(Bidirectional Long ...
【文章頁數(shù)】:68 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 緬甸語簡介
1.2 緬甸語語音合成系統(tǒng)概述
1.3 研究思路及論文的主要工作
1.4 論文組織結(jié)構(gòu)
第二章 緬甸語發(fā)音語料庫的構(gòu)建
2.1 緬甸語字符和音節(jié)介紹
2.2 發(fā)音語料庫的構(gòu)建
2.2.1 選取流程
2.2.2 選取算法
2.2.3 實驗結(jié)果及分析
2.3 語音語料庫的錄制
2.4 本章小結(jié)
第三章 緬甸語文本歸一化
3.1 歸一化簡介
3.2 數(shù)字和縮寫詞歸一化
3.3 特殊字符歸一化
3.4 本章小結(jié)
第四章 緬甸語分詞方法及實現(xiàn)
4.1 基于FMM的分詞
4.2 基于CRF的分詞
4.2.1 標注方式
4.2.2 特征模板
4.2.3 CRF分詞過程
4.3 基于BiLSTM+CRF的分詞
4.3.1 LSTM介紹
4.3.2 BiLSTM+CRF網(wǎng)絡(luò)
4.4 實驗結(jié)果與分析
4.4.1 分詞語料庫的構(gòu)建
4.4.2 分詞結(jié)果的評估
4.4.3 實驗結(jié)果及分析
4.5 本章小結(jié)
第五章 緬甸語文本自動注音
5.1 自動注音簡介
5.1.1 聲母的注音
5.1.2 韻母的注音
5.2 自動注音方法
5.2.1 基于聲韻母拼接的注音方法
5.2.2 基于變音變調(diào)規(guī)則的注音方法
5.2.3 基于CRF模型的注音方法
5.3 實驗結(jié)果及分析
5.4 本章小結(jié)
第六章 總結(jié)與展望
6.1 總結(jié)
6.2 展望
參考文獻
攻讀碩士學位期間完成的科研成果
致謝
本文編號:3957383
【文章頁數(shù)】:68 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 緬甸語簡介
1.2 緬甸語語音合成系統(tǒng)概述
1.3 研究思路及論文的主要工作
1.4 論文組織結(jié)構(gòu)
第二章 緬甸語發(fā)音語料庫的構(gòu)建
2.1 緬甸語字符和音節(jié)介紹
2.2 發(fā)音語料庫的構(gòu)建
2.2.1 選取流程
2.2.2 選取算法
2.2.3 實驗結(jié)果及分析
2.3 語音語料庫的錄制
2.4 本章小結(jié)
第三章 緬甸語文本歸一化
3.1 歸一化簡介
3.2 數(shù)字和縮寫詞歸一化
3.3 特殊字符歸一化
3.4 本章小結(jié)
第四章 緬甸語分詞方法及實現(xiàn)
4.1 基于FMM的分詞
4.2 基于CRF的分詞
4.2.1 標注方式
4.2.2 特征模板
4.2.3 CRF分詞過程
4.3 基于BiLSTM+CRF的分詞
4.3.1 LSTM介紹
4.3.2 BiLSTM+CRF網(wǎng)絡(luò)
4.4 實驗結(jié)果與分析
4.4.1 分詞語料庫的構(gòu)建
4.4.2 分詞結(jié)果的評估
4.4.3 實驗結(jié)果及分析
4.5 本章小結(jié)
第五章 緬甸語文本自動注音
5.1 自動注音簡介
5.1.1 聲母的注音
5.1.2 韻母的注音
5.2 自動注音方法
5.2.1 基于聲韻母拼接的注音方法
5.2.2 基于變音變調(diào)規(guī)則的注音方法
5.2.3 基于CRF模型的注音方法
5.3 實驗結(jié)果及分析
5.4 本章小結(jié)
第六章 總結(jié)與展望
6.1 總結(jié)
6.2 展望
參考文獻
攻讀碩士學位期間完成的科研成果
致謝
本文編號:3957383
本文鏈接:http://www.sikaile.net/kejilunwen/xinxigongchenglunwen/3957383.html
最近更新
教材專著