馬來語語音合成系統(tǒng)的實(shí)現(xiàn)與改進(jìn)
發(fā)布時(shí)間:2021-11-19 20:15
隨著語音合成、語音識(shí)別等技術(shù)的快速發(fā)展,人機(jī)語音交互應(yīng)用越來越普及。如何使機(jī)器發(fā)出與真人一致的聲音,一直是語音技術(shù)研究者追求的目標(biāo),基于DNN(深度神經(jīng)網(wǎng)絡(luò))的深度學(xué)習(xí)已成為提升語音合成系統(tǒng)性能的有效途徑。迄今為止,已取得的語音合成研究成果主要集中在英語、漢語等語言,其他語言的相關(guān)研究成果還需進(jìn)一步豐富。馬來西亞語(簡稱馬來語)屬于屬南島語系馬來-波利尼西亞語族,廣泛使用于馬來西亞、新加坡、文萊等地。本文以開發(fā)馬來語語音合成應(yīng)用系統(tǒng)為目的,采用HMM以及DNN,探索提高語音合成系統(tǒng)性能的途徑。論文的主要工作有:(1)根據(jù)馬來語的書寫與發(fā)音特點(diǎn),分別以聲韻母結(jié)構(gòu)和音素結(jié)構(gòu)實(shí)現(xiàn)馬來語的音子自動(dòng)切分,并根據(jù)自動(dòng)切分結(jié)果選擇了音素結(jié)構(gòu)作為馬來語語音合成的建;。(2)根據(jù)馬來語的語言特征設(shè)計(jì)了五音子上下文屬性與問題集,并實(shí)現(xiàn)上下文屬性集的自動(dòng)生成。在此基礎(chǔ)上,設(shè)計(jì)并調(diào)試了基于HMM與五音子上下文屬性的馬來語語音合成系統(tǒng),實(shí)現(xiàn)了模型的訓(xùn)練以及語音的合成。(3)針對(duì)基于HMM語音合成系統(tǒng)中決策樹聲學(xué)模型的問題,采用全連接的深度神經(jīng)網(wǎng)絡(luò)代替決策樹作為聲學(xué)模型,重新進(jìn)行系統(tǒng)訓(xùn)練與語音合成,相對(duì)于HM...
【文章來源】:云南大學(xué)云南省 211工程院校
【文章頁數(shù)】:67 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2-1從訓(xùn)練音頻中提取的Mel域倒譜特征??
升合成語音的質(zhì)量。??八八八??圖2-3?sp音子三狀態(tài)空跳結(jié)構(gòu)??2.2馬來語語音合成基元的選取??選擇合適的合成單元是語音合成的關(guān)鍵步驟。將選擇的建模單元組成所需的??音子列表,作為維特比算法在對(duì)HMM模型進(jìn)行解碼的過程中的詞典。??從語言學(xué)角度看,馬來語是一種黏著性語言【2G],所以馬來語有明顯的音節(jié)結(jié)??構(gòu),雖然馬來語書寫方式與英語類似,但是其發(fā)音方式并不相同,通過查閱相關(guān)??資料以及咨詢馬來語專家,得到馬來語的發(fā)音與漢語有一定的相似。從音節(jié)結(jié)構(gòu)??分析,馬來語一般以輔音一元音(CV)、輔音一元音一輔音(CVC)、元音(V)??和元音一輔音(VC)結(jié)構(gòu)為主。因此,本文請(qǐng)教了相關(guān)的馬來語專家,參照漢語??的聲韻母劃分方法,根據(jù)音節(jié)的結(jié)構(gòu),在己經(jīng)確定的馬來語合成基元中,又分別??得到鼻音音子、爆破音音子和V-C結(jié)構(gòu)構(gòu)成的韻母音子
I?(i|j—1Hwe?—t?單音??圖2-4馬來語音子自動(dòng)切分的流程??由圖2-4可知,完成馬來語的音子自動(dòng)切分,總共分為三個(gè)階段。以下本文將??對(duì)三個(gè)階段分別進(jìn)行具體的介紹和分析。??首先在第一階段要準(zhǔn)備好訓(xùn)練的數(shù)據(jù)。本文共選取了?2000句馬來語語料和對(duì)??應(yīng)的錄音,將2000句語料進(jìn)行非法字符的篩選并按照音子、音節(jié)、單詞等邊界生??成對(duì)應(yīng)的韻律文本,其中以‘[]’代表詞邊界,‘/’代表音節(jié)邊界,空格代表音??子邊界,如下表所示(以下示例均為以音素結(jié)構(gòu)進(jìn)行切分的樣例):??表2-3邊界信息韻律文本??文本內(nèi)容??馬來語羅馬化文本?anda*harus*sentiasa*menjangkakan??邊界信息韻律文本?[a?n/d?a][h?a/r?u?s][s?e?n/t?i?a/s?a]?[m?e?n/j?a?ng/k?a/k?a?n]??-?■?■■■-■■???,一?■?■?■?■??再核對(duì)韻律文本和語料錄音,排除錯(cuò)誤發(fā)音以及邊界劃分錯(cuò)誤。然后從韻律??文本中生成對(duì)應(yīng)的均勻劃分的單音子標(biāo)注,如下表所示(只選取了一句中的部分,??時(shí)間單位為100ns)。??11??
本文編號(hào):3505783
【文章來源】:云南大學(xué)云南省 211工程院校
【文章頁數(shù)】:67 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2-1從訓(xùn)練音頻中提取的Mel域倒譜特征??
升合成語音的質(zhì)量。??八八八??圖2-3?sp音子三狀態(tài)空跳結(jié)構(gòu)??2.2馬來語語音合成基元的選取??選擇合適的合成單元是語音合成的關(guān)鍵步驟。將選擇的建模單元組成所需的??音子列表,作為維特比算法在對(duì)HMM模型進(jìn)行解碼的過程中的詞典。??從語言學(xué)角度看,馬來語是一種黏著性語言【2G],所以馬來語有明顯的音節(jié)結(jié)??構(gòu),雖然馬來語書寫方式與英語類似,但是其發(fā)音方式并不相同,通過查閱相關(guān)??資料以及咨詢馬來語專家,得到馬來語的發(fā)音與漢語有一定的相似。從音節(jié)結(jié)構(gòu)??分析,馬來語一般以輔音一元音(CV)、輔音一元音一輔音(CVC)、元音(V)??和元音一輔音(VC)結(jié)構(gòu)為主。因此,本文請(qǐng)教了相關(guān)的馬來語專家,參照漢語??的聲韻母劃分方法,根據(jù)音節(jié)的結(jié)構(gòu),在己經(jīng)確定的馬來語合成基元中,又分別??得到鼻音音子、爆破音音子和V-C結(jié)構(gòu)構(gòu)成的韻母音子
I?(i|j—1Hwe?—t?單音??圖2-4馬來語音子自動(dòng)切分的流程??由圖2-4可知,完成馬來語的音子自動(dòng)切分,總共分為三個(gè)階段。以下本文將??對(duì)三個(gè)階段分別進(jìn)行具體的介紹和分析。??首先在第一階段要準(zhǔn)備好訓(xùn)練的數(shù)據(jù)。本文共選取了?2000句馬來語語料和對(duì)??應(yīng)的錄音,將2000句語料進(jìn)行非法字符的篩選并按照音子、音節(jié)、單詞等邊界生??成對(duì)應(yīng)的韻律文本,其中以‘[]’代表詞邊界,‘/’代表音節(jié)邊界,空格代表音??子邊界,如下表所示(以下示例均為以音素結(jié)構(gòu)進(jìn)行切分的樣例):??表2-3邊界信息韻律文本??文本內(nèi)容??馬來語羅馬化文本?anda*harus*sentiasa*menjangkakan??邊界信息韻律文本?[a?n/d?a][h?a/r?u?s][s?e?n/t?i?a/s?a]?[m?e?n/j?a?ng/k?a/k?a?n]??-?■?■■■-■■???,一?■?■?■?■??再核對(duì)韻律文本和語料錄音,排除錯(cuò)誤發(fā)音以及邊界劃分錯(cuò)誤。然后從韻律??文本中生成對(duì)應(yīng)的均勻劃分的單音子標(biāo)注,如下表所示(只選取了一句中的部分,??時(shí)間單位為100ns)。??11??
本文編號(hào):3505783
本文鏈接:http://www.sikaile.net/kejilunwen/xinxigongchenglunwen/3505783.html
最近更新
教材專著