天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 信息工程論文 >

面向語(yǔ)音合成的印尼語(yǔ)文本分析與處理

發(fā)布時(shí)間:2020-10-11 13:09
   讓計(jì)算機(jī)能聽(tīng)、能看、能說(shuō)、能感覺(jué),是未來(lái)人機(jī)交互的發(fā)展方向。語(yǔ)音合成在導(dǎo)航、通信等領(lǐng)域都有廣泛運(yùn)用。目前,文語(yǔ)轉(zhuǎn)換依舊是語(yǔ)音合成的主要方法,即運(yùn)用計(jì)算機(jī)實(shí)現(xiàn)從給定文本到相應(yīng)語(yǔ)音的轉(zhuǎn)換。目前,對(duì)語(yǔ)音合成的研究較集中于英語(yǔ)、漢語(yǔ)等語(yǔ)言中,對(duì)于印尼語(yǔ)的研究相對(duì)較少。印尼語(yǔ)屬馬來(lái)-波利尼西亞語(yǔ)系西印度尼西亞語(yǔ)支,是一種由拉丁字母構(gòu)成的、有明顯詞邊界的語(yǔ)言。本文主要針對(duì)印尼語(yǔ)語(yǔ)音合成系統(tǒng),研究并實(shí)現(xiàn)印尼語(yǔ)前端文本分析中的語(yǔ)音語(yǔ)料庫(kù)構(gòu)建、文本歸一化、音節(jié)化以及音子的劃分。本文的主要工作包括:(1)印尼語(yǔ)發(fā)音語(yǔ)料庫(kù)的構(gòu)建。從印尼語(yǔ)網(wǎng)站中收集了印尼語(yǔ)文本,對(duì)文本進(jìn)行去重和去非法字符處理,并將其用作構(gòu)建印尼語(yǔ)發(fā)音語(yǔ)料庫(kù)的初始文本語(yǔ)料庫(kù)。在該語(yǔ)料庫(kù)的基礎(chǔ)上,綜合考慮句子長(zhǎng)度和高頻詞挑選得到印尼語(yǔ)的發(fā)音語(yǔ)料庫(kù),并用客觀的評(píng)價(jià)標(biāo)準(zhǔn)對(duì)其進(jìn)行評(píng)價(jià)。(2)印尼語(yǔ)文本中非標(biāo)準(zhǔn)“詞”的歸一化。研究了常出現(xiàn)在印尼語(yǔ)文本中的非標(biāo)準(zhǔn)“詞”及其歧義種類,并提出印尼語(yǔ)文本非標(biāo)準(zhǔn)“詞”的歸一化方法和實(shí)現(xiàn)流程。用正則表達(dá)式與關(guān)鍵詞相結(jié)合的方法對(duì)文本中的數(shù)字串、與數(shù)字連用的特殊字符的進(jìn)行歸一化處理,用字符匹配的方法對(duì)文本中的縮寫(xiě)詞進(jìn)行歸一化處理。對(duì)實(shí)驗(yàn)結(jié)果統(tǒng)計(jì)得到文本歸一化正確率達(dá)96.2%。(3)面向語(yǔ)音合成的印尼語(yǔ)的音節(jié)化。研究了印尼語(yǔ)的音節(jié)構(gòu)成,在此基礎(chǔ)上提出適用于語(yǔ)音合成的印尼語(yǔ)音節(jié)化方案,并對(duì)其進(jìn)行實(shí)現(xiàn)。采用基于音節(jié)列表的逆向最大匹配的方法,并在此基礎(chǔ)上添加零聲母規(guī)則實(shí)現(xiàn)音節(jié)劃分。經(jīng)統(tǒng)計(jì)得該次實(shí)驗(yàn)集內(nèi)測(cè)試的正確率為98.2%,集外測(cè)試的正確率為97.1%。(4)印尼語(yǔ)音子的劃分。針對(duì)印尼語(yǔ)語(yǔ)音合成,提出并實(shí)現(xiàn)了基于印尼語(yǔ)特性的音子劃分方案。采用基于聲韻母結(jié)構(gòu)的方法和音素的結(jié)構(gòu)的方法分別確定了音子列表,并運(yùn)用字典匹配的方法實(shí)現(xiàn)印尼語(yǔ)語(yǔ)音語(yǔ)料庫(kù)文本的音子劃分,得到韻律文本。
【學(xué)位單位】:云南大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2019
【中圖分類】:TN912.33;TP391.1
【部分圖文】:

過(guò)程圖,語(yǔ)料庫(kù),過(guò)程


由于句子的長(zhǎng)度會(huì)影響錄音人話音質(zhì)量進(jìn)而影響合成的語(yǔ)音質(zhì)量,故統(tǒng)計(jì)了??文本語(yǔ)料庫(kù)中的句子長(zhǎng)度,即統(tǒng)計(jì)每個(gè)句子中所含的單詞的個(gè)數(shù),其句長(zhǎng)的分布??如圖2-2所示。該直方圖直觀地給出了文本語(yǔ)料庫(kù)中不同長(zhǎng)度句子的分布情況,且??為發(fā)音語(yǔ)料庫(kù)的選取提供了可行性依據(jù),并作為評(píng)判發(fā)音語(yǔ)料庫(kù)質(zhì)量的標(biāo)準(zhǔn)之一。??10??

句子長(zhǎng)度,語(yǔ)料庫(kù),文本,分布直方圖


??圖2-1:語(yǔ)料庫(kù)挑選過(guò)程??本次實(shí)驗(yàn)構(gòu)建的發(fā)音語(yǔ)料庫(kù)由4400個(gè)陳述句,200個(gè)感嘆句,400個(gè)疑問(wèn)句,??共計(jì)5000個(gè)句子組成,其中疑問(wèn)句包括一般疑問(wèn)句和特殊疑問(wèn)句各200句。??由于句子的長(zhǎng)度會(huì)影響錄音人話音質(zhì)量進(jìn)而影響合成的語(yǔ)音質(zhì)量,故統(tǒng)計(jì)了??文本語(yǔ)料庫(kù)中的句子長(zhǎng)度,即統(tǒng)計(jì)每個(gè)句子中所含的單詞的個(gè)數(shù),其句長(zhǎng)的分布??如圖2-2所示。該直方圖直觀地給出了文本語(yǔ)料庫(kù)中不同長(zhǎng)度句子的分布情況,且??為發(fā)音語(yǔ)料庫(kù)的選取提供了可行性依據(jù),并作為評(píng)判發(fā)音語(yǔ)料庫(kù)質(zhì)量的標(biāo)準(zhǔn)之一。??10??

曲線,詞匯,覆蓋率,出現(xiàn)次數(shù)


pada?1455413??根據(jù)所創(chuàng)建的高頻詞詞典及文本語(yǔ)料庫(kù)所含有的總詞數(shù),可以得到詞匯的覆??蓋率曲線如圖2-3所示。該圖的繪制思想為:從詞頻數(shù)最高的詞為起始,累加計(jì)算??每個(gè)詞的出現(xiàn)次數(shù)占文本詞匯總出現(xiàn)次數(shù)的比值,將比值作為繪圖點(diǎn)進(jìn)行連接。??12??
【參考文獻(xiàn)】

相關(guān)期刊論文 前10條

1 李廣偉;戈玲玲;;標(biāo)識(shí)語(yǔ)漢英雙語(yǔ)平行語(yǔ)料庫(kù)的設(shè)計(jì)與創(chuàng)建[J];南華大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版);2015年01期

2 劉豫軍;夏聰;;計(jì)算機(jī)語(yǔ)音合成技術(shù)研究及發(fā)展方向[J];網(wǎng)絡(luò)安全技術(shù)與應(yīng)用;2014年12期

3 紀(jì)正飚;王吉林;趙力;;基于HMM的中英文語(yǔ)音合成技術(shù)研究[J];科學(xué)技術(shù)與工程;2014年32期

4 于延鎖;朱風(fēng)云;李先剛;劉翼;吳璽宏;;面向大語(yǔ)料庫(kù)的語(yǔ)音合成方法研究[J];北京大學(xué)學(xué)報(bào)(自然科學(xué)版);2014年05期

5 馬立東;;英語(yǔ)語(yǔ)音合成系統(tǒng)超前端文本分析知識(shí)庫(kù)的構(gòu)建[J];電腦與信息技術(shù);2013年05期

6 高璐;陳琪;李永宏;于洪志;;藏語(yǔ)語(yǔ)音合成中文本分析的若干問(wèn)題研究[J];西北民族大學(xué)學(xué)報(bào)(自然科學(xué)版);2010年02期

7 趙暉;林成龍;唐朝京;;基于視頻三音子的漢語(yǔ)雙模態(tài)語(yǔ)料庫(kù)的建立[J];中文信息學(xué)報(bào);2009年05期

8 賈玉祥;黃德智;劉武;俞士汶;;中文語(yǔ)音合成中的文本正則化研究[J];中文信息學(xué)報(bào);2008年05期

9 陳靜;李薇;崔忠偉;劉霞;;語(yǔ)音合成技術(shù)的研究及其發(fā)展[J];中國(guó)科技信息;2007年14期

10 吳義堅(jiān);王仁華;;基于HMM的可訓(xùn)練中文語(yǔ)音合成[J];中文信息學(xué)報(bào);2006年04期


相關(guān)博士學(xué)位論文 前2條

1 楊辰雨;語(yǔ)音合成音庫(kù)自動(dòng)標(biāo)注方法研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2014年

2 雷鳴;統(tǒng)計(jì)參數(shù)語(yǔ)音合成中的聲學(xué)模型建模方法研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2012年


相關(guān)碩士學(xué)位論文 前4條

1 王昱;傣語(yǔ)中的漢語(yǔ)借詞發(fā)音規(guī)則及其語(yǔ)音合成方法研究[D];云南大學(xué);2016年

2 侯亭武;基于語(yǔ)料庫(kù)的中文語(yǔ)音合成技術(shù)研究[D];華中科技大學(xué);2015年

3 葉林沿;基于依存關(guān)系樹(shù)的復(fù)句句法特征自動(dòng)選取[D];華中師范大學(xué);2014年

4 梁怡佳;印尼語(yǔ)與漢語(yǔ)語(yǔ)音對(duì)比研究[D];湖南師范大學(xué);2014年



本文編號(hào):2836634

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/xinxigongchenglunwen/2836634.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶4fe60***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com