基于卷積神經(jīng)網(wǎng)絡(luò)的語音合成聲碼器研究
【文章頁數(shù)】:64 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖1.1語音合成系統(tǒng)示意圖
音合成技術(shù)絕大部分都在文語轉(zhuǎn)換層次,即將文字按照一定規(guī)則映射到語音波??形。??圖1.1展示了一個(gè)典型的語音合成系統(tǒng)。文語轉(zhuǎn)換是一個(gè)層次化的信息處理??過程,而且層次越高信息越豐富,這也是文字轉(zhuǎn)換到語音的難點(diǎn)。首先,根據(jù)給??定語言的詞典和相應(yīng)的語法規(guī)則在語言層、語法層和語義層分....
圖1.2語音生成過程
?\規(guī)則/?\?y??圖1.1語音合成系統(tǒng)示意圖。??以劃分為三類:(1)文字按規(guī)則映射到語音波形,簡稱文語轉(zhuǎn)換(Text-To-Speech,??TTS);⑵概念按規(guī)則映射到語音;(3)意向按規(guī)則映射到語音。現(xiàn)階段研宄的語??音合成技術(shù)絕大部分都在文語轉(zhuǎn)換層次,即將文字按照一定....
圖1.3統(tǒng)計(jì)參數(shù)語音合成系統(tǒng)
音段切分和韻律標(biāo)注)作為輸入、聲學(xué)參數(shù)作為輸出利用機(jī)器學(xué)習(xí)方法訓(xùn)練對(duì)應(yīng)??的聲學(xué)模型,最后以聲學(xué)模型為基礎(chǔ)加上后端的合成聲碼器構(gòu)成統(tǒng)計(jì)參數(shù)合成??系統(tǒng),該系統(tǒng)結(jié)構(gòu)如圖1.3所示。??/?輸入?7??/…亥本.../??T??前端??文本[處理丨??音段切分、韻??v?律等文本特征....
圖1.4基于DNN的聲學(xué)模型結(jié)構(gòu)
合成任務(wù)的聲學(xué)建模模t4],實(shí)驗(yàn)表明其聲學(xué)模型精度與合成語音自然度相對(duì)于??基于HMM的統(tǒng)計(jì)參數(shù)建模方法均得到了有效改善。DNN是一種前饋神經(jīng)網(wǎng)絡(luò)??(Feedforward?Neural?Network),基于DNN的聲學(xué)模型如圖1.4所不,這種層級(jí)化??結(jié)構(gòu)和人類的發(fā)音過程有....
本文編號(hào):4043775
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/4043775.html