基于深度學(xué)習(xí)的彝語語音合成的研究
【文章頁數(shù)】:47 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖4.2基線E2E模型在使用實(shí)驗(yàn)數(shù)據(jù)A時(shí)的損失收斂圖
第4章彝語語音合成的實(shí)驗(yàn)23為0.5,在進(jìn)行到40k步時(shí)進(jìn)行衰減。訓(xùn)練均進(jìn)行100k步,訓(xùn)練過程中進(jìn)行觀察,每5k步進(jìn)行一次驗(yàn)證集的驗(yàn)證,保證訓(xùn)練的模型不會(huì)有太大偏差。沒訓(xùn)練好的模型在預(yù)測(cè)時(shí),G&L算法的能量參數(shù)設(shè)置為1.2,而其迭代上限為60次。4.2.3實(shí)驗(yàn)評(píng)測(cè)本文對(duì)基于E2....
圖4.4帶有文本分析的E2E模型在使用實(shí)驗(yàn)數(shù)據(jù)A時(shí)的損失收斂圖
第4章彝語語音合成的實(shí)驗(yàn)24對(duì)于帶有文本分析的E2E模型框架,由于加入了專家知識(shí),網(wǎng)絡(luò)結(jié)構(gòu)多出一部分,參數(shù)訓(xùn)練相對(duì)變多。當(dāng)實(shí)驗(yàn)數(shù)據(jù)僅為A時(shí),在35k步左右才趨于平緩,也在70k步左右基本收斂,而使用全部數(shù)據(jù)時(shí),收斂仍在35k不左右趨于平緩,而在70k步左右基本收斂。總得來說,當(dāng)實(shí)....
圖4.3基線E2E模型在使用實(shí)驗(yàn)數(shù)據(jù)A、B時(shí)的損失收斂圖
第4章彝語語音合成的實(shí)驗(yàn)24對(duì)于帶有文本分析的E2E模型框架,由于加入了專家知識(shí),網(wǎng)絡(luò)結(jié)構(gòu)多出一部分,參數(shù)訓(xùn)練相對(duì)變多。當(dāng)實(shí)驗(yàn)數(shù)據(jù)僅為A時(shí),在35k步左右才趨于平緩,也在70k步左右基本收斂,而使用全部數(shù)據(jù)時(shí),收斂仍在35k不左右趨于平緩,而在70k步左右基本收斂?偟脕碚f,當(dāng)實(shí)....
圖4.5帶有文本分析的E2E模型在使用實(shí)驗(yàn)數(shù)據(jù)A、B時(shí)的損失收斂圖
第4章彝語語音合成的實(shí)驗(yàn)25表4.4為針對(duì)兩個(gè)實(shí)驗(yàn)在不同實(shí)驗(yàn)數(shù)據(jù)下,產(chǎn)生不同結(jié)果后計(jì)算所得的MCD,表中結(jié)果分為在驗(yàn)證集上的結(jié)果和在測(cè)試集中的結(jié)果。由表4.4可以看出實(shí)驗(yàn)語料數(shù)量的增多可以有效地降低MCD,即有效地提高合成語音和原始語音的相似度,同時(shí)還可以觀察出帶有文本分析的E2....
本文編號(hào):3978876
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/3978876.html