面向特定領(lǐng)域藏語統(tǒng)計(jì)參數(shù)語音合成的文本分析研究
發(fā)布時(shí)間:2021-11-12 23:32
中國是一個(gè)由56個(gè)少數(shù)民族組成的國家,藏語人口已達(dá)到38.58萬人次,但是藏語研究相對較晚,尤其是統(tǒng)計(jì)參數(shù)藏語語音合成方面,缺乏相關(guān)文本分析,缺乏對于特定領(lǐng)域的藏語語音合成的文本分析。因此,本文針對已有的統(tǒng)計(jì)參數(shù)語音合成的文本分析中的詞及詞性層和語句層進(jìn)行了改進(jìn),在語句層加入了文本的分類信息,然后利用此文本分析進(jìn)行了藏語語音合成并獲得了較好的合成效果。本論文的主要工作和創(chuàng)新如下:1.提出了3種藏語分詞模型來獲得詞邊界,分別為雙向長短時(shí)記憶網(wǎng)絡(luò)加條件隨機(jī)場模型(Bi-directional long short-term memory with conditional random field model,BiLSTMCRF),卷積神經(jīng)網(wǎng)絡(luò)加雙向長短時(shí)記憶網(wǎng)絡(luò)加條件隨機(jī)場模型(Convolutional neural network bi-directional long short-term memory with conditional random field model,CNNBiLSTMCRF)和序列到序列(Se...
【文章來源】:西北師范大學(xué)甘肅省
【文章頁數(shù)】:52 頁
【學(xué)位級別】:碩士
【部分圖文】:
藏字的組成結(jié)構(gòu)
第2章基于深度學(xué)習(xí)的藏語文本分析相關(guān)問題6第2章基于深度學(xué)習(xí)的藏語文本分析本章主要是介紹了基于深度學(xué)習(xí)的藏語文本分析研究過程中需要用到的一些藏語理論和深度學(xué)習(xí)的相關(guān)模型及方法,如詞向量,Dropout,相關(guān)神經(jīng)網(wǎng)絡(luò)等,通過這些已有的研究理論來進(jìn)行后續(xù)研究。2.1藏語介紹藏語作為我國的一種民族語言,使用人口較多,分布域廣闊,記錄了多彩多樣的藏族文化。藏語是一種拼寫文字,同漢語拼音類似,是通過部首進(jìn)行拼寫,且書寫必須從左到右從上到下。藏字部首在藏字中的位置有6種,如圖2.1所示。藏文中每個(gè)藏字之間都由音節(jié)點(diǎn)進(jìn)行分隔,但是藏詞之間卻不像英文單詞一樣有分隔標(biāo)記,如圖2.2所示為藏詞示例。藏語總有15個(gè)元音,7個(gè)輔音韻尾,48個(gè)韻母,當(dāng)代藏語拉薩音有四個(gè)聲調(diào),分別為高調(diào)、低調(diào)、降調(diào)和升調(diào)。圖2.1藏字的組成結(jié)構(gòu)圖2.2藏詞示例的組成結(jié)構(gòu)2.2深度神經(jīng)網(wǎng)絡(luò)模型2.2.1卷積神經(jīng)網(wǎng)絡(luò)CNN模型結(jié)構(gòu)圖如圖2.3所示,主要有三層構(gòu)成[37]。
第2章基于深度學(xué)習(xí)的藏語文本分析相關(guān)問題7輸入層:假如一個(gè)藏語句子有n個(gè)特征詞且該詞向量維度是k,那么輸入的詞向量矩陣為nk。卷積層:主要對藏文文本進(jìn)行卷積運(yùn)算,如式(2-1)所示。ii:11()iihCfWXb+=+(2-1)此中,結(jié)果用iC表示,h為窗口大小,詞向量矩陣是i:i+h-1X,卷積核是1W,1b為偏置量,f為relu激活函數(shù)。池化層:上一層運(yùn)算后的結(jié)果iC輸入到池化層,對特征iC進(jìn)行壓縮。輸出層:輸入池化層的輸出特征向量,通過類別概率計(jì)算,得到最終的預(yù)測類別yi定義如(2-2)所示:33ymax()iii=softWh+b(2-2)其中,3W為類別權(quán)值矩陣,3b為偏置量。圖2.3CNN模型結(jié)構(gòu)圖2.2.2遞歸神經(jīng)網(wǎng)絡(luò)語言之間存在著相關(guān)性,尤其是上一個(gè)詞和下一個(gè)詞之間聯(lián)系性更強(qiáng)。研究者為了能更好地解決文本語義之間的關(guān)系,提出了遞歸神經(jīng)網(wǎng)絡(luò)(Recurrentneuralnet,RNN),結(jié)構(gòu)展開圖如圖2.4所示,因?yàn)镽NN模型中增加了可以識別自然語言依賴關(guān)系循環(huán)結(jié)構(gòu)。由于該特殊循環(huán)結(jié)構(gòu)的存在保證了隱藏層中節(jié)點(diǎn)能夠相互連接,也保證了上文中分析出來的信息能夠傳遞到下文中,保留全文信息展開總體性的分析[38]。圖2.4RNN模型展開圖
【參考文獻(xiàn)】:
期刊論文
[1]A Novel Active Learning Method Using SVM for Text Classification[J]. Mohamed Goudjil,Mouloud Koudil,Mouldi Bedda,Noureddine Ghoggali. International Journal of Automation and Computing. 2018(03)
[2]基于SVM藏文文本分類的研究與實(shí)現(xiàn)[J]. 賈宏云,群諾,蘇慧婧,次仁羅增,巴桑卓瑪. 電子技術(shù)與軟件工程. 2018(09)
[3]基于深度學(xué)習(xí)的藏文分詞方法[J]. 李博涵,劉匯丹,龍從軍,吳健. 計(jì)算機(jī)工程與設(shè)計(jì). 2018(01)
[4]藏語口語語音語料庫的設(shè)計(jì)與研究[J]. 黃曉輝,李京,馬睿. 計(jì)算機(jī)工程與應(yīng)用. 2018(13)
[5]面向漢語統(tǒng)計(jì)參數(shù)語音合成的標(biāo)注生成方法[J]. 郝東亮,楊鴻武,張策,張帥,郭立釗,楊靜波. 計(jì)算機(jī)工程與應(yīng)用. 2016(19)
[6]TIP-LAS:一個(gè)開源的藏文分詞詞性標(biāo)注系統(tǒng)[J]. 李亞超,江靜,加羊吉,于洪志. 中文信息學(xué)報(bào). 2015(06)
[7]基于知識融合的CRFs藏文分詞系統(tǒng)[J]. 洛桑嘎登,楊媛媛,趙小兵. 中文信息學(xué)報(bào). 2015(06)
[8]基于深度神經(jīng)網(wǎng)絡(luò)的漢語語音合成的研究[J]. 王堅(jiān),張媛媛. 計(jì)算機(jī)科學(xué). 2015(S1)
[9]判別式藏語文本詞性標(biāo)注研究[J]. 華卻才讓,劉群,趙海興. 中文信息學(xué)報(bào). 2014(02)
[10]融合音節(jié)特征的最大熵藏文詞性標(biāo)注研究[J]. 于洪志,李亞超,汪昆,冷本扎西. 中文信息學(xué)報(bào). 2013(05)
博士論文
[1]藏語分詞與詞性標(biāo)注研究[D]. 康才畯.上海師范大學(xué) 2014
本文編號:3491856
【文章來源】:西北師范大學(xué)甘肅省
【文章頁數(shù)】:52 頁
【學(xué)位級別】:碩士
【部分圖文】:
藏字的組成結(jié)構(gòu)
第2章基于深度學(xué)習(xí)的藏語文本分析相關(guān)問題6第2章基于深度學(xué)習(xí)的藏語文本分析本章主要是介紹了基于深度學(xué)習(xí)的藏語文本分析研究過程中需要用到的一些藏語理論和深度學(xué)習(xí)的相關(guān)模型及方法,如詞向量,Dropout,相關(guān)神經(jīng)網(wǎng)絡(luò)等,通過這些已有的研究理論來進(jìn)行后續(xù)研究。2.1藏語介紹藏語作為我國的一種民族語言,使用人口較多,分布域廣闊,記錄了多彩多樣的藏族文化。藏語是一種拼寫文字,同漢語拼音類似,是通過部首進(jìn)行拼寫,且書寫必須從左到右從上到下。藏字部首在藏字中的位置有6種,如圖2.1所示。藏文中每個(gè)藏字之間都由音節(jié)點(diǎn)進(jìn)行分隔,但是藏詞之間卻不像英文單詞一樣有分隔標(biāo)記,如圖2.2所示為藏詞示例。藏語總有15個(gè)元音,7個(gè)輔音韻尾,48個(gè)韻母,當(dāng)代藏語拉薩音有四個(gè)聲調(diào),分別為高調(diào)、低調(diào)、降調(diào)和升調(diào)。圖2.1藏字的組成結(jié)構(gòu)圖2.2藏詞示例的組成結(jié)構(gòu)2.2深度神經(jīng)網(wǎng)絡(luò)模型2.2.1卷積神經(jīng)網(wǎng)絡(luò)CNN模型結(jié)構(gòu)圖如圖2.3所示,主要有三層構(gòu)成[37]。
第2章基于深度學(xué)習(xí)的藏語文本分析相關(guān)問題7輸入層:假如一個(gè)藏語句子有n個(gè)特征詞且該詞向量維度是k,那么輸入的詞向量矩陣為nk。卷積層:主要對藏文文本進(jìn)行卷積運(yùn)算,如式(2-1)所示。ii:11()iihCfWXb+=+(2-1)此中,結(jié)果用iC表示,h為窗口大小,詞向量矩陣是i:i+h-1X,卷積核是1W,1b為偏置量,f為relu激活函數(shù)。池化層:上一層運(yùn)算后的結(jié)果iC輸入到池化層,對特征iC進(jìn)行壓縮。輸出層:輸入池化層的輸出特征向量,通過類別概率計(jì)算,得到最終的預(yù)測類別yi定義如(2-2)所示:33ymax()iii=softWh+b(2-2)其中,3W為類別權(quán)值矩陣,3b為偏置量。圖2.3CNN模型結(jié)構(gòu)圖2.2.2遞歸神經(jīng)網(wǎng)絡(luò)語言之間存在著相關(guān)性,尤其是上一個(gè)詞和下一個(gè)詞之間聯(lián)系性更強(qiáng)。研究者為了能更好地解決文本語義之間的關(guān)系,提出了遞歸神經(jīng)網(wǎng)絡(luò)(Recurrentneuralnet,RNN),結(jié)構(gòu)展開圖如圖2.4所示,因?yàn)镽NN模型中增加了可以識別自然語言依賴關(guān)系循環(huán)結(jié)構(gòu)。由于該特殊循環(huán)結(jié)構(gòu)的存在保證了隱藏層中節(jié)點(diǎn)能夠相互連接,也保證了上文中分析出來的信息能夠傳遞到下文中,保留全文信息展開總體性的分析[38]。圖2.4RNN模型展開圖
【參考文獻(xiàn)】:
期刊論文
[1]A Novel Active Learning Method Using SVM for Text Classification[J]. Mohamed Goudjil,Mouloud Koudil,Mouldi Bedda,Noureddine Ghoggali. International Journal of Automation and Computing. 2018(03)
[2]基于SVM藏文文本分類的研究與實(shí)現(xiàn)[J]. 賈宏云,群諾,蘇慧婧,次仁羅增,巴桑卓瑪. 電子技術(shù)與軟件工程. 2018(09)
[3]基于深度學(xué)習(xí)的藏文分詞方法[J]. 李博涵,劉匯丹,龍從軍,吳健. 計(jì)算機(jī)工程與設(shè)計(jì). 2018(01)
[4]藏語口語語音語料庫的設(shè)計(jì)與研究[J]. 黃曉輝,李京,馬睿. 計(jì)算機(jī)工程與應(yīng)用. 2018(13)
[5]面向漢語統(tǒng)計(jì)參數(shù)語音合成的標(biāo)注生成方法[J]. 郝東亮,楊鴻武,張策,張帥,郭立釗,楊靜波. 計(jì)算機(jī)工程與應(yīng)用. 2016(19)
[6]TIP-LAS:一個(gè)開源的藏文分詞詞性標(biāo)注系統(tǒng)[J]. 李亞超,江靜,加羊吉,于洪志. 中文信息學(xué)報(bào). 2015(06)
[7]基于知識融合的CRFs藏文分詞系統(tǒng)[J]. 洛桑嘎登,楊媛媛,趙小兵. 中文信息學(xué)報(bào). 2015(06)
[8]基于深度神經(jīng)網(wǎng)絡(luò)的漢語語音合成的研究[J]. 王堅(jiān),張媛媛. 計(jì)算機(jī)科學(xué). 2015(S1)
[9]判別式藏語文本詞性標(biāo)注研究[J]. 華卻才讓,劉群,趙海興. 中文信息學(xué)報(bào). 2014(02)
[10]融合音節(jié)特征的最大熵藏文詞性標(biāo)注研究[J]. 于洪志,李亞超,汪昆,冷本扎西. 中文信息學(xué)報(bào). 2013(05)
博士論文
[1]藏語分詞與詞性標(biāo)注研究[D]. 康才畯.上海師范大學(xué) 2014
本文編號:3491856
本文鏈接:http://www.sikaile.net/kejilunwen/xinxigongchenglunwen/3491856.html
最近更新
教材專著