天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 信息工程論文 >

面向特定領(lǐng)域藏語統(tǒng)計(jì)參數(shù)語音合成的文本分析研究

發(fā)布時(shí)間:2021-11-12 23:32
  中國是一個(gè)由56個(gè)少數(shù)民族組成的國家,藏語人口已達(dá)到38.58萬人次,但是藏語研究相對較晚,尤其是統(tǒng)計(jì)參數(shù)藏語語音合成方面,缺乏相關(guān)文本分析,缺乏對于特定領(lǐng)域的藏語語音合成的文本分析。因此,本文針對已有的統(tǒng)計(jì)參數(shù)語音合成的文本分析中的詞及詞性層和語句層進(jìn)行了改進(jìn),在語句層加入了文本的分類信息,然后利用此文本分析進(jìn)行了藏語語音合成并獲得了較好的合成效果。本論文的主要工作和創(chuàng)新如下:1.提出了3種藏語分詞模型來獲得詞邊界,分別為雙向長短時(shí)記憶網(wǎng)絡(luò)加條件隨機(jī)場模型(Bi-directional long short-term memory with conditional random field model,BiLSTMCRF),卷積神經(jīng)網(wǎng)絡(luò)加雙向長短時(shí)記憶網(wǎng)絡(luò)加條件隨機(jī)場模型(Convolutional neural network bi-directional long short-term memory with conditional random field model,CNNBiLSTMCRF)和序列到序列(Se... 

【文章來源】:西北師范大學(xué)甘肅省

【文章頁數(shù)】:52 頁

【學(xué)位級別】:碩士

【部分圖文】:

面向特定領(lǐng)域藏語統(tǒng)計(jì)參數(shù)語音合成的文本分析研究


藏字的組成結(jié)構(gòu)

結(jié)構(gòu)圖,示例,藏語


第2章基于深度學(xué)習(xí)的藏語文本分析相關(guān)問題6第2章基于深度學(xué)習(xí)的藏語文本分析本章主要是介紹了基于深度學(xué)習(xí)的藏語文本分析研究過程中需要用到的一些藏語理論和深度學(xué)習(xí)的相關(guān)模型及方法,如詞向量,Dropout,相關(guān)神經(jīng)網(wǎng)絡(luò)等,通過這些已有的研究理論來進(jìn)行后續(xù)研究。2.1藏語介紹藏語作為我國的一種民族語言,使用人口較多,分布域廣闊,記錄了多彩多樣的藏族文化。藏語是一種拼寫文字,同漢語拼音類似,是通過部首進(jìn)行拼寫,且書寫必須從左到右從上到下。藏字部首在藏字中的位置有6種,如圖2.1所示。藏文中每個(gè)藏字之間都由音節(jié)點(diǎn)進(jìn)行分隔,但是藏詞之間卻不像英文單詞一樣有分隔標(biāo)記,如圖2.2所示為藏詞示例。藏語總有15個(gè)元音,7個(gè)輔音韻尾,48個(gè)韻母,當(dāng)代藏語拉薩音有四個(gè)聲調(diào),分別為高調(diào)、低調(diào)、降調(diào)和升調(diào)。圖2.1藏字的組成結(jié)構(gòu)圖2.2藏詞示例的組成結(jié)構(gòu)2.2深度神經(jīng)網(wǎng)絡(luò)模型2.2.1卷積神經(jīng)網(wǎng)絡(luò)CNN模型結(jié)構(gòu)圖如圖2.3所示,主要有三層構(gòu)成[37]。

展開圖,模型結(jié)構(gòu)


第2章基于深度學(xué)習(xí)的藏語文本分析相關(guān)問題7輸入層:假如一個(gè)藏語句子有n個(gè)特征詞且該詞向量維度是k,那么輸入的詞向量矩陣為nk。卷積層:主要對藏文文本進(jìn)行卷積運(yùn)算,如式(2-1)所示。ii:11()iihCfWXb+=+(2-1)此中,結(jié)果用iC表示,h為窗口大小,詞向量矩陣是i:i+h-1X,卷積核是1W,1b為偏置量,f為relu激活函數(shù)。池化層:上一層運(yùn)算后的結(jié)果iC輸入到池化層,對特征iC進(jìn)行壓縮。輸出層:輸入池化層的輸出特征向量,通過類別概率計(jì)算,得到最終的預(yù)測類別yi定義如(2-2)所示:33ymax()iii=softWh+b(2-2)其中,3W為類別權(quán)值矩陣,3b為偏置量。圖2.3CNN模型結(jié)構(gòu)圖2.2.2遞歸神經(jīng)網(wǎng)絡(luò)語言之間存在著相關(guān)性,尤其是上一個(gè)詞和下一個(gè)詞之間聯(lián)系性更強(qiáng)。研究者為了能更好地解決文本語義之間的關(guān)系,提出了遞歸神經(jīng)網(wǎng)絡(luò)(Recurrentneuralnet,RNN),結(jié)構(gòu)展開圖如圖2.4所示,因?yàn)镽NN模型中增加了可以識別自然語言依賴關(guān)系循環(huán)結(jié)構(gòu)。由于該特殊循環(huán)結(jié)構(gòu)的存在保證了隱藏層中節(jié)點(diǎn)能夠相互連接,也保證了上文中分析出來的信息能夠傳遞到下文中,保留全文信息展開總體性的分析[38]。圖2.4RNN模型展開圖

【參考文獻(xiàn)】:
期刊論文
[1]A Novel Active Learning Method Using SVM for Text Classification[J]. Mohamed Goudjil,Mouloud Koudil,Mouldi Bedda,Noureddine Ghoggali.  International Journal of Automation and Computing. 2018(03)
[2]基于SVM藏文文本分類的研究與實(shí)現(xiàn)[J]. 賈宏云,群諾,蘇慧婧,次仁羅增,巴桑卓瑪.  電子技術(shù)與軟件工程. 2018(09)
[3]基于深度學(xué)習(xí)的藏文分詞方法[J]. 李博涵,劉匯丹,龍從軍,吳健.  計(jì)算機(jī)工程與設(shè)計(jì). 2018(01)
[4]藏語口語語音語料庫的設(shè)計(jì)與研究[J]. 黃曉輝,李京,馬睿.  計(jì)算機(jī)工程與應(yīng)用. 2018(13)
[5]面向漢語統(tǒng)計(jì)參數(shù)語音合成的標(biāo)注生成方法[J]. 郝東亮,楊鴻武,張策,張帥,郭立釗,楊靜波.  計(jì)算機(jī)工程與應(yīng)用. 2016(19)
[6]TIP-LAS:一個(gè)開源的藏文分詞詞性標(biāo)注系統(tǒng)[J]. 李亞超,江靜,加羊吉,于洪志.  中文信息學(xué)報(bào). 2015(06)
[7]基于知識融合的CRFs藏文分詞系統(tǒng)[J]. 洛桑嘎登,楊媛媛,趙小兵.  中文信息學(xué)報(bào). 2015(06)
[8]基于深度神經(jīng)網(wǎng)絡(luò)的漢語語音合成的研究[J]. 王堅(jiān),張媛媛.  計(jì)算機(jī)科學(xué). 2015(S1)
[9]判別式藏語文本詞性標(biāo)注研究[J]. 華卻才讓,劉群,趙海興.  中文信息學(xué)報(bào). 2014(02)
[10]融合音節(jié)特征的最大熵藏文詞性標(biāo)注研究[J]. 于洪志,李亞超,汪昆,冷本扎西.  中文信息學(xué)報(bào). 2013(05)

博士論文
[1]藏語分詞與詞性標(biāo)注研究[D]. 康才畯.上海師范大學(xué) 2014



本文編號:3491856

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/xinxigongchenglunwen/3491856.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶98177***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com