天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于DNN的漢語(yǔ)到藏語(yǔ)跨語(yǔ)言語(yǔ)音轉(zhuǎn)換的研究

發(fā)布時(shí)間:2022-12-22 01:58
  跨語(yǔ)言語(yǔ)音轉(zhuǎn)換是人工智能研究中的一個(gè)熱點(diǎn)方向。它通過對(duì)源說話人的語(yǔ)音進(jìn)行分析,利用語(yǔ)音轉(zhuǎn)換技術(shù)得到所需要的目標(biāo)語(yǔ)音并且在音質(zhì)上具有源說話人特征。藏族是中國(guó)人口較多的少數(shù)民族之一,如果能借助深度學(xué)習(xí)算法研究漢語(yǔ)到藏語(yǔ)語(yǔ)音的轉(zhuǎn)換技術(shù),能夠很好的促進(jìn)藏族地區(qū)同胞和漢族群眾之間的交流,對(duì)于文化資源豐富的藏族能起到有效的保護(hù)。本文以研究漢語(yǔ)普通話到藏語(yǔ)拉薩話語(yǔ)音轉(zhuǎn)換為目標(biāo),釆用語(yǔ)音識(shí)別和語(yǔ)音合成結(jié)合的方法,實(shí)現(xiàn)了基于深度神經(jīng)網(wǎng)絡(luò)(Deep neural network,DNN)的漢語(yǔ)到藏語(yǔ)的跨語(yǔ)言語(yǔ)音轉(zhuǎn)換系統(tǒng)。并在此基礎(chǔ)上對(duì)合成的藏語(yǔ)語(yǔ)音和語(yǔ)音轉(zhuǎn)換后的音質(zhì)進(jìn)行了主、客觀評(píng)測(cè)。本論文的主要工作與創(chuàng)新如下:1.跨語(yǔ)言語(yǔ)音轉(zhuǎn)換中基于DNN的語(yǔ)音識(shí)別方法研究。通過對(duì)漢語(yǔ)語(yǔ)音識(shí)別的研究,發(fā)現(xiàn)DNN在模型訓(xùn)練過程中截取其中部分已經(jīng)訓(xùn)練好的網(wǎng)絡(luò)進(jìn)行特征訓(xùn)練,得到的新特征在語(yǔ)音識(shí)別效果上相比于梅爾頻率倒譜系數(shù)(Mel Frequency Cepstral Coefficient,MFCC)特征更優(yōu)。首先,對(duì)DNN的模型預(yù)訓(xùn)練、參數(shù)修改、模型優(yōu)化方面進(jìn)行了研宄,并在Kaldi平臺(tái)上搭建了用于語(yǔ)音聲學(xué)特征提取的深度... 

【文章頁(yè)數(shù)】:49 頁(yè)

【學(xué)位級(jí)別】:碩士

【文章目錄】:
摘要
Abstract
第1章 引言
    1.1 研究背景與意義
    1.2 語(yǔ)音轉(zhuǎn)換的研究現(xiàn)狀
    1.3 論文的組織與結(jié)構(gòu)
第2章 漢語(yǔ)到藏語(yǔ)語(yǔ)音轉(zhuǎn)換的基本框架
    2.1 方法提出的背景
    2.2 方法的基本框架
    2.3 本章小結(jié)
第3章 基于DNN的語(yǔ)音識(shí)別
    3.1 深度神經(jīng)網(wǎng)絡(luò)
    3.2 DNN模型訓(xùn)練
        3.2.1 網(wǎng)絡(luò)節(jié)點(diǎn)函數(shù)
        3.2.2 RBM模型
        3.2.3 RBM的屬性
    3.3 DNN-HMM模型
第4章 藏語(yǔ)語(yǔ)音的合成
    4.1 基于HMM的語(yǔ)音合成
    4.2 模型預(yù)處理
        4.2.1 上下文相關(guān)標(biāo)注
        4.2.2 問題集設(shè)計(jì)
        4.2.3 決策樹聚類
    4.3 HMM訓(xùn)練
    4.4 語(yǔ)音合成
    4.5 STRAIGHT算法
    4.6 本章小結(jié)
第5章 實(shí)驗(yàn)及測(cè)評(píng)
    5.1 基于DNN的漢語(yǔ)語(yǔ)音識(shí)別系統(tǒng)實(shí)驗(yàn)
        5.1.1 實(shí)驗(yàn)配置
        5.1.2 深度特征提取
        5.1.3 實(shí)驗(yàn)結(jié)果
    5.2 合成音質(zhì)的評(píng)測(cè)
        5.2.1 客觀評(píng)測(cè)
        5.2.2 主觀評(píng)測(cè)
    5.3 合成語(yǔ)音音質(zhì)的評(píng)測(cè)
        5.3.1 主觀評(píng)測(cè)
        5.3.2 客觀評(píng)測(cè)
    5.4 跨語(yǔ)言語(yǔ)音轉(zhuǎn)換音質(zhì)的評(píng)測(cè)
    5.5 本章小結(jié)
第6章 總結(jié)與展望
    6.1 論文工作總結(jié)
    6.2 工作展望
參考文獻(xiàn)
攻讀碩士期間的研究成果
致謝


【參考文獻(xiàn)】:
期刊論文
[1]采用動(dòng)態(tài)核特征及貝葉斯最大后驗(yàn)估計(jì)的語(yǔ)音轉(zhuǎn)換方法[J]. 李娜,曾向陽(yáng),喬宇,李志鋒.  聲學(xué)學(xué)報(bào). 2015(03)
[2]基于自適應(yīng)粒子群優(yōu)化徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)的語(yǔ)音轉(zhuǎn)換[J]. 張玲華,姚紹芹,解偉超.  數(shù)據(jù)采集與處理. 2015(02)
[3]深度語(yǔ)音信號(hào)與信息處理:研究進(jìn)展與展望[J]. 戴禮榮,張仕良.  數(shù)據(jù)采集與處理. 2014(02)
[4]基于兩層神經(jīng)網(wǎng)絡(luò)的基音檢測(cè)算法[J]. 王民,孫潔,贠衛(wèi)國(guó),劉利,任雪妮.  計(jì)算機(jī)工程與應(yīng)用. 2014(05)
[5]基于說話人自適應(yīng)訓(xùn)練的漢藏雙語(yǔ)語(yǔ)音合成[J]. 王海燕,楊鴻武,甘振業(yè),裴東.  清華大學(xué)學(xué)報(bào)(自然科學(xué)版). 2013(06)

博士論文
[1]語(yǔ)音轉(zhuǎn)換的關(guān)鍵技術(shù)研究[D]. 李波.國(guó)防科學(xué)技術(shù)大學(xué) 2005



本文編號(hào):3723212

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/wltx/3723212.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶a2a71***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com