基于隱變量模型的歌曲轉(zhuǎn)換方法研究
發(fā)布時(shí)間:2017-05-04 09:00
本文關(guān)鍵詞:基于隱變量模型的歌曲轉(zhuǎn)換方法研究,由筆耕文化傳播整理發(fā)布。
【摘要】:語(yǔ)音轉(zhuǎn)換技術(shù)(Voice Conversion)是語(yǔ)音信號(hào)處理的一個(gè)重要分支,近幾年國(guó)內(nèi)外研究學(xué)者在該領(lǐng)域取得了許多研究成果。本文研究?jī)?nèi)容就是要將語(yǔ)音轉(zhuǎn)換技術(shù)應(yīng)用到歌聲轉(zhuǎn)換領(lǐng)域,通過(guò)改變?cè)闯枞说恼Z(yǔ)音個(gè)性特征使其聽(tīng)起來(lái)像目標(biāo)唱歌人在唱歌,同時(shí)維持歌曲內(nèi)容不變。歌聲轉(zhuǎn)換技術(shù)將在電影配音、生理學(xué)、智能人機(jī)交互和生活?yuàn)蕵?lè)等方面均有廣闊前景。目前主流的語(yǔ)音轉(zhuǎn)換方法關(guān)注于建立源和目標(biāo)說(shuō)話人的語(yǔ)音個(gè)性特征映射關(guān)系,通過(guò)這種映射關(guān)系建立語(yǔ)音轉(zhuǎn)換模型。因此語(yǔ)音個(gè)性特征的表征和提取就成了決定模型好壞的關(guān)鍵。本文在對(duì)歌聲中語(yǔ)音信號(hào)特征表征深入研究的基礎(chǔ)上,研究了兩種歌曲轉(zhuǎn)換模型:(1)本文構(gòu)建一種隱變量模型(Latent Variable Model,LVM)將歌曲分解成表示語(yǔ)義的內(nèi)容信息參數(shù)矩陣和體現(xiàn)唱歌人個(gè)性特征信息參數(shù)矩陣,采用個(gè)性特征信息參數(shù)矩陣替換的方法轉(zhuǎn)換唱歌人個(gè)性特征信息;(2)本文設(shè)計(jì)了一種基于深度神經(jīng)網(wǎng)絡(luò)(Deep Belief Networks,DBN)模型歌曲轉(zhuǎn)換方法。首先分別用提取出的源唱歌人和目標(biāo)唱歌人語(yǔ)音頻譜參數(shù)來(lái)訓(xùn)練DBN,分別得到其在高階空間的語(yǔ)音個(gè)性特征表征;然后通過(guò)人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks ANN)來(lái)連接這兩個(gè)高階空間并進(jìn)行特征轉(zhuǎn)換;最后使用基于目標(biāo)唱歌人數(shù)據(jù)訓(xùn)練出的DBN來(lái)對(duì)轉(zhuǎn)換后的特征信息進(jìn)行逆處理得到語(yǔ)音頻譜參數(shù),合成轉(zhuǎn)換后的語(yǔ)音。同時(shí),本文進(jìn)行了實(shí)驗(yàn)以對(duì)上述兩種算法轉(zhuǎn)換性能進(jìn)行分析,實(shí)驗(yàn)表明歌聲轉(zhuǎn)換的是具有可行性的。
【關(guān)鍵詞】:歌聲轉(zhuǎn)換 隱變量模型 深度信念網(wǎng)絡(luò)模型 語(yǔ)音個(gè)性特征
【學(xué)位授予單位】:西安建筑科技大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類(lèi)號(hào)】:TN912.3
【目錄】:
- 摘要3-4
- Abstract4-7
- 第一章 緒論7-11
- 1.1 課題研究背景7
- 1.2 課題研究的目的及意義7-8
- 1.3 國(guó)內(nèi)外研究現(xiàn)狀8-10
- 1.4 本文主要研究?jī)?nèi)容10
- 1.5 本章小結(jié)10-11
- 第二章 語(yǔ)音轉(zhuǎn)換基本原理11-25
- 2.1 語(yǔ)音信號(hào)的產(chǎn)生機(jī)理11-13
- 2.2 語(yǔ)音信號(hào)的特征參數(shù)13-14
- 2.3 語(yǔ)音轉(zhuǎn)換的關(guān)鍵技術(shù)14-19
- 2.3.1 語(yǔ)音信號(hào)的預(yù)處理14-15
- 2.3.2 語(yǔ)音信號(hào)分析合成模型15-17
- 2.3.3 特征參數(shù)對(duì)齊17-18
- 2.3.4 語(yǔ)音庫(kù)設(shè)計(jì)18-19
- 2.4 語(yǔ)音轉(zhuǎn)換系統(tǒng)模型19-24
- 2.4.1 語(yǔ)音轉(zhuǎn)換系統(tǒng)結(jié)構(gòu)19-21
- 2.4.2 經(jīng)典語(yǔ)音轉(zhuǎn)換模型21-23
- 2.4.3 轉(zhuǎn)換效果的評(píng)價(jià)方法23-24
- 2.5 本章小結(jié)24-25
- 第三章基于隱變量模型的歌聲轉(zhuǎn)換方法25-35
- 3.1 隱變量模型的基本知識(shí)25-30
- 3.1.1 數(shù)據(jù)降維的意義25
- 3.1.2 隱變量模型介紹25-26
- 3.1.3 經(jīng)典隱變量模型26-30
- 3.2 基于隱變量模型的歌聲轉(zhuǎn)換算法30-32
- 3.2.1 雙因子隱變量模型30-31
- 3.2.2 基于隱變量模型的語(yǔ)音轉(zhuǎn)換方案31-32
- 3.3 實(shí)驗(yàn)結(jié)果與分析32-34
- 3.4 本章小結(jié)34-35
- 第四章 基于深度信念網(wǎng)絡(luò)模型的歌聲轉(zhuǎn)換方法35-50
- 4.1 深度學(xué)習(xí)的基本知識(shí)35-40
- 4.1.1 深度學(xué)習(xí)發(fā)展歷史35-36
- 4.1.2 典型的深度學(xué)習(xí)結(jié)構(gòu)36-39
- 4.1.3 深度學(xué)習(xí)應(yīng)用39-40
- 4.2 基于DBN的歌聲轉(zhuǎn)換模型40-46
- 4.2.1 DBN的基本原理40-43
- 4.2.2 基于DBN的語(yǔ)音轉(zhuǎn)換算法43-44
- 4.2.3 基于DBN的歌聲轉(zhuǎn)換方案44-46
- 4.3 實(shí)驗(yàn)結(jié)果與分析46-49
- 4.3.1 實(shí)驗(yàn)設(shè)置46
- 4.3.2 轉(zhuǎn)換語(yǔ)音結(jié)果與分析46-49
- 4.4 本章小結(jié)49-50
- 第五章 總結(jié)與展望50-52
- 參考文獻(xiàn)52-55
- 攻讀碩士期間主要的研究成果55-56
- 致謝56
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前1條
1 余凱;賈磊;陳雨強(qiáng);徐偉;;深度學(xué)習(xí)的昨天、今天和明天[J];計(jì)算機(jī)研究與發(fā)展;2013年09期
本文關(guān)鍵詞:基于隱變量模型的歌曲轉(zhuǎn)換方法研究,,由筆耕文化傳播整理發(fā)布。
本文編號(hào):344739
本文鏈接:http://www.sikaile.net/kejilunwen/wltx/344739.html
最近更新
教材專著