維吾爾語(yǔ)大詞匯語(yǔ)音識(shí)別系統(tǒng)識(shí)別單元研究
本文選題:維吾爾語(yǔ) + 大詞匯 ; 參考:《北京大學(xué)學(xué)報(bào)(自然科學(xué)版)》2014年01期
【摘要】:維吾爾語(yǔ)是一種黏著語(yǔ),單詞不太適合作為維吾爾語(yǔ)大詞匯連續(xù)語(yǔ)音識(shí)別系統(tǒng)識(shí)別單元。針對(duì)維吾爾語(yǔ)大詞匯連續(xù)語(yǔ)音識(shí)別系統(tǒng)中的識(shí)別單元選擇問(wèn)題,設(shè)計(jì)更適合維吾爾語(yǔ)的子詞識(shí)別單元,提出維吾爾語(yǔ)單詞和子詞相結(jié)合的組合識(shí)別單元構(gòu)建方法,并對(duì)單詞、子詞和組合識(shí)別單元的語(yǔ)言模型和語(yǔ)音識(shí)別性能進(jìn)行評(píng)價(jià)。實(shí)驗(yàn)結(jié)果表明,所提出的識(shí)別單元在單元數(shù)量、語(yǔ)言模型復(fù)雜度等方面表現(xiàn)出更加優(yōu)越的性能,并且使識(shí)別系統(tǒng)的單詞錯(cuò)誤率比基于單詞的系統(tǒng)相對(duì)減少22%。
[Abstract]:Uygur is a kind of adherent language, and words are not suitable for the recognition unit of Uygur large vocabulary continuous speech recognition system. In order to solve the problem of unit selection in Uygur large vocabulary continuous speech recognition system, a sub-word recognition unit which is more suitable for Uygur language is designed, and a method of combining Uygur words with sub-words is proposed. The language model and speech recognition performance of sub-words and combined recognition units are evaluated. The experimental results show that the proposed recognition unit has better performance in terms of the number of units and the complexity of the language model, and the word-error rate of the recognition system is reduced by 22% compared with that of the word-based system.
【作者單位】: 新疆大學(xué)信息科學(xué)與工程學(xué)院;
【基金】:國(guó)家自然科學(xué)基金(61063024,61363063) 新疆維吾爾自治區(qū)多語(yǔ)種信息處理重點(diǎn)實(shí)驗(yàn)室開(kāi)放課題(049807)資助
【分類號(hào)】:TN912.34
【參考文獻(xiàn)】
相關(guān)期刊論文 前4條
1 薛化建;董興華;周喜;吐?tīng)柡椤の崴韭?李曉;;基于子字單元的維吾爾語(yǔ)語(yǔ)音識(shí)別研究[J];計(jì)算機(jī)工程;2011年20期
2 古麗拉·阿東別克,米吉提·阿布力米提;維吾爾語(yǔ)詞切分方法初探[J];中文信息學(xué)報(bào);2004年06期
3 早克熱·卡德?tīng)?艾山·吾買爾;吐?tīng)柛ひ啦祭?帕里旦·吐?tīng)栠d;吳小川;;混合策略的維吾爾語(yǔ)名詞詞干提取系統(tǒng)[J];計(jì)算機(jī)工程與應(yīng)用;2013年01期
4 張小燕;宿建軍;薛化建;王磊;;維吾爾語(yǔ)語(yǔ)音識(shí)別語(yǔ)料庫(kù)中的OOV研究[J];計(jì)算機(jī)工程與設(shè)計(jì);2012年02期
【共引文獻(xiàn)】
相關(guān)期刊論文 前10條
1 王蘇敏;廖晶晶;趙秀鳥(niǎo);;基于DTW和HMM算法的語(yǔ)音識(shí)別系統(tǒng)對(duì)比研究[J];計(jì)算機(jī)光盤軟件與應(yīng)用;2012年11期
2 陳鴿;王廷梅;趙瑋;;一種新的維漢英混排文本顯示模型的設(shè)計(jì)[J];硅谷;2012年16期
3 陳強(qiáng);何炎祥;劉續(xù)樂(lè);孫松濤;彭敏;李飛;;基于句法分析的跨語(yǔ)言情感分析[J];北京大學(xué)學(xué)報(bào)(自然科學(xué)版);2014年01期
4 古麗拉·阿東別克,艾爾肯·伊米爾;維吾爾文校對(duì)中常見(jiàn)錯(cuò)誤分析[J];計(jì)算機(jī)工程與應(yīng)用;2005年27期
5 趙永進(jìn);郭大慶;盧有飛;李英凡;;維文軟件中排版關(guān)鍵技術(shù)的研究與實(shí)現(xiàn)[J];計(jì)算機(jī)工程與應(yīng)用;2007年22期
6 蘇建輝;程晶;蔣同海;;維、哈、柯文版Linux操作系統(tǒng)關(guān)鍵技術(shù)的設(shè)計(jì)實(shí)現(xiàn)[J];計(jì)算機(jī)科學(xué);2008年10期
7 吐?tīng)柕亍ね泻咸?維尼拉·木沙江;艾斯卡爾·艾木都拉;;維、哈、柯全文搜索引擎檢索器的關(guān)鍵技術(shù)[J];計(jì)算機(jī)工程;2008年21期
8 薛化建;董興華;周喜;吐?tīng)柡椤の崴韭?李曉;;基于子字單元的維吾爾語(yǔ)語(yǔ)音識(shí)別研究[J];計(jì)算機(jī)工程;2011年20期
9 張偉;任大明;許曉輝;趙凡;張巖;;維、哈、柯文顯示及排版技術(shù)研究[J];計(jì)算機(jī)應(yīng)用研究;2008年03期
10 吐?tīng)柕亍ね泻咸?維尼拉·木沙江;艾斯卡爾·艾木都拉;;維、哈、柯多文種全文搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)應(yīng)用與軟件;2009年06期
相關(guān)會(huì)議論文 前9條
1 維尼拉·木沙江;吳俊森;吐?tīng)柛ひ啦祭?;維吾爾文搜索引擎的倒排索引設(shè)計(jì)與實(shí)現(xiàn)[A];民族語(yǔ)言文字信息技術(shù)研究——第十一屆全國(guó)民族語(yǔ)言文字信息學(xué)術(shù)研討會(huì)論文集[C];2007年
2 吐?tīng)柕亍ね泻咸?維尼拉·木沙江;米吉提·阿不里米提;;維吾爾文搜索引擎Web Server的實(shí)現(xiàn)[A];民族語(yǔ)言文字信息技術(shù)研究——第十一屆全國(guó)民族語(yǔ)言文字信息學(xué)術(shù)研討會(huì)論文集[C];2007年
3 米吉提·阿不里米提;艾斯卡爾·艾木都拉;吐?tīng)柕亍ね泻咸?;維語(yǔ)詞法分析器研究開(kāi)發(fā)[A];民族語(yǔ)言文字信息技術(shù)研究——第十一屆全國(guó)民族語(yǔ)言文字信息學(xué)術(shù)研討會(huì)論文集[C];2007年
4 吐?tīng)柕亍ね泻咸?維尼拉·木沙江;艾斯卡爾·艾木都拉;;維、哈、柯全文搜索引擎中查詢處理研究與實(shí)現(xiàn)[A];第四屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集(上)[C];2008年
5 李文;李淼;張建;陳雷;雪艷;;一種帶權(quán)值參數(shù)的非監(jiān)督式形態(tài)切分方法[A];少數(shù)民族青年自然語(yǔ)言處理技術(shù)研究與進(jìn)展——第三屆全國(guó)少數(shù)民族青年自然語(yǔ)言信息處理、第二屆全國(guó)多語(yǔ)言知識(shí)庫(kù)建設(shè)聯(lián)合學(xué)術(shù)研討會(huì)論文集[C];2010年
6 海麗且木·艾沙;維尼拉·木沙江;;Web文本分類及其維、哈、柯多文種信息檢索中的應(yīng)用研究[A];少數(shù)民族青年自然語(yǔ)言處理技術(shù)研究與進(jìn)展——第三屆全國(guó)少數(shù)民族青年自然語(yǔ)言信息處理、第二屆全國(guó)多語(yǔ)言知識(shí)庫(kù)建設(shè)聯(lián)合學(xué)術(shù)研討會(huì)論文集[C];2010年
7 王珍;維尼拉·木沙江;趙麗紅;;維、哈、柯文搜索引擎中自動(dòng)分類技術(shù)的應(yīng)用研究[A];少數(shù)民族青年自然語(yǔ)言處理技術(shù)研究與進(jìn)展——第三屆全國(guó)少數(shù)民族青年自然語(yǔ)言信息處理、第二屆全國(guó)多語(yǔ)言知識(shí)庫(kù)建設(shè)聯(lián)合學(xué)術(shù)研討會(huì)論文集[C];2010年
8 通拉嘎;;漢、蒙、藏、維分詞與詞性標(biāo)注技術(shù)發(fā)展現(xiàn)狀研究[A];第五屆全國(guó)青年計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2010年
9 努爾麥麥·提尤魯瓦斯;吾守爾·斯拉木;熱依曼·吐?tīng)栠d;;基于音節(jié)的維吾爾語(yǔ)大詞匯連續(xù)語(yǔ)音識(shí)別系統(tǒng)[A];第十二屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議(NCMMSC'2013)論文集[C];2013年
相關(guān)博士學(xué)位論文 前2條
1 陳潔;基于概念融合的網(wǎng)頁(yè)篩選技術(shù)研究[D];北京郵電大學(xué);2013年
2 劉楠;面向微博短文本的情感分析研究[D];武漢大學(xué);2013年
相關(guān)碩士學(xué)位論文 前10條
1 熱依瑪依·買買提;維、哈、柯搜索引擎中基于文本的圖像檢索技術(shù)的研究[D];新疆大學(xué);2011年
2 趙倩倩;維吾爾語(yǔ)信息檢索[D];天津大學(xué);2012年
3 陳麗珍;維文網(wǎng)絡(luò)中不良文本信息檢索、監(jiān)控系統(tǒng)的研究[D];新疆大學(xué);2006年
4 陳鵬;基于語(yǔ)料庫(kù)的維吾爾語(yǔ)詞干提取和詞性標(biāo)注[D];新疆大學(xué);2006年
5 馬歡;基于不定長(zhǎng)拼接單元的維吾爾語(yǔ)文語(yǔ)轉(zhuǎn)換系統(tǒng)的研究與實(shí)現(xiàn)[D];新疆大學(xué);2006年
6 張冉;主題搜索引擎的研究與設(shè)計(jì)[D];新疆大學(xué);2006年
7 蔡琴;基于HTK的維吾爾語(yǔ)連續(xù)數(shù)字語(yǔ)音識(shí)別研究[D];新疆大學(xué);2007年
8 胡顏琪;維、漢多語(yǔ)種農(nóng)村信息化系統(tǒng)研究與實(shí)現(xiàn)[D];新疆大學(xué);2008年
9 王珍;維、哈、柯文搜索引擎中的自動(dòng)分類技術(shù)研究[D];新疆大學(xué);2010年
10 劉俊;基于windows7的維文多語(yǔ)種操作系統(tǒng)本地化的研究與實(shí)現(xiàn)[D];新疆大學(xué);2012年
【二級(jí)參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 王志明;陶建華;;文本-視覺(jué)語(yǔ)音合成綜述[J];計(jì)算機(jī)研究與發(fā)展;2006年01期
2 李艷紅;鄭家恒;;大規(guī)模語(yǔ)料庫(kù)可用性評(píng)測(cè)方法[J];計(jì)算機(jī)工程與應(yīng)用;2009年16期
3 姑麗加瑪麗·麥麥提艾力;艾斯卡爾·肉孜;艾斯卡爾·艾木都拉;;三音素模型的維吾爾語(yǔ)最佳文本選取算法[J];計(jì)算機(jī)工程與應(yīng)用;2009年18期
4 李永宏;于洪志;孔江平;;藏語(yǔ)連續(xù)語(yǔ)音語(yǔ)料庫(kù)設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)工程與應(yīng)用;2010年13期
5 李晨沖;董濱;潘復(fù)平;曾興雯;顏永紅;;漢語(yǔ)普通話易混淆音素的識(shí)別[J];計(jì)算機(jī)工程;2009年23期
6 殷建平;漢語(yǔ)自動(dòng)分詞方法[J];計(jì)算機(jī)工程與科學(xué);1998年03期
7 章森;劉磊;刁麓弘;;大規(guī)模語(yǔ)音語(yǔ)料庫(kù)及其在TTS中應(yīng)用的幾個(gè)問(wèn)題[J];計(jì)算機(jī)學(xué)報(bào);2010年04期
8 那斯?fàn)柦ね聽(tīng)栠d;吾守爾·斯拉木;;基于隱馬爾可夫模型的維吾爾語(yǔ)連續(xù)語(yǔ)音識(shí)別系統(tǒng)[J];計(jì)算機(jī)應(yīng)用;2009年07期
9 古麗拉·阿東別克,米吉提·阿布力米提;維吾爾語(yǔ)詞切分方法初探[J];中文信息學(xué)報(bào);2004年06期
10 阿依克孜·卡德?tīng)?開(kāi)沙爾·卡德?tīng)?吐?tīng)柛ひ啦祭?;面向自然語(yǔ)言信息處理的維吾爾語(yǔ)名詞形態(tài)分析研究[J];中文信息學(xué)報(bào);2006年03期
相關(guān)會(huì)議論文 前2條
1 張皖志;陶建華;;基于聲韻母基元的嵌入式中文語(yǔ)音合成系統(tǒng)[A];第十二屆全國(guó)信號(hào)處理學(xué)術(shù)年會(huì)(CCSP-2005)論文集[C];2005年
2 艾山·吾買爾;吐?tīng)柛ひ啦焕?早克熱·卡德?tīng)?;維吾爾語(yǔ)名詞詞干提取算法的研究[A];第四屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集(上)[C];2008年
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 那斯?fàn)柦ね聽(tīng)栠d;吾守爾·斯拉木;;基于隱馬爾可夫模型的維吾爾語(yǔ)連續(xù)語(yǔ)音識(shí)別系統(tǒng)[J];計(jì)算機(jī)應(yīng)用;2009年07期
2 蔡琴;吾守爾·斯拉木;;基于HTK的維吾爾語(yǔ)連續(xù)數(shù)字語(yǔ)音識(shí)別[J];現(xiàn)代計(jì)算機(jī);2007年04期
3 王飛飛;吾守爾·斯拉木;那斯?fàn)柦ね聽(tīng)栠d;;基于DDBHMM的維吾爾語(yǔ)音聲學(xué)識(shí)別[J];計(jì)算機(jī)工程;2011年02期
4 蔡瑞昌;;未來(lái)的電話[J];電子技術(shù);1980年08期
5 趙鶴芹;;一個(gè)適用于孤立單詞語(yǔ)音識(shí)別系統(tǒng)的數(shù)據(jù)壓縮方法—WHT算法[J];云南工業(yè)大學(xué)學(xué)報(bào);1990年03期
6 馬天蔚;;讓語(yǔ)音超越桌面[J];每周電腦報(bào);1999年32期
7 ;文字/語(yǔ)音識(shí)別系統(tǒng)[J];中國(guó)電子商情;2001年01期
8 劉云冰;;語(yǔ)音識(shí)別技術(shù)的回顧與展望[J];軟件導(dǎo)刊;2005年13期
9 劉福才;王冬云;;語(yǔ)音識(shí)別技術(shù)及其在控制領(lǐng)域中的應(yīng)用研究(一)[J];可編程控制器與工廠自動(dòng)化;2005年11期
10 王宏;郭艷麗;賈新民;;基于HMM的孤立字識(shí)別[J];昌吉學(xué)院學(xué)報(bào);2006年01期
相關(guān)會(huì)議論文 前10條
1 王昆侖;樊志錦;吐?tīng)柡榻?方曉華;徐紹瓊;吾買爾;;維吾爾語(yǔ)綜合語(yǔ)音數(shù)據(jù)庫(kù)系統(tǒng)[A];第五屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1998年
2 楊學(xué)增;方棣棠;;神經(jīng)網(wǎng)絡(luò)用于語(yǔ)音識(shí)別初探[A];第一屆全國(guó)語(yǔ)言識(shí)別學(xué)術(shù)報(bào)告與展示會(huì)論文集[C];1990年
3 王作英;;非齊次語(yǔ)音識(shí)別HMM模型和THED語(yǔ)音識(shí)別與理解系統(tǒng)[A];第二屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1992年
4 王承發(fā);趙德彬;金山;苗百利;朱志瑩;;語(yǔ)音識(shí)別應(yīng)用中抗噪聲干擾方法的初步探討[A];第二屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1992年
5 胡春靜;吳善培;;不定人的語(yǔ)音識(shí)別系統(tǒng)[A];第三屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1994年
6 董林;袁保宗;周繼成;;一種基于神經(jīng)網(wǎng)絡(luò)的漢語(yǔ)語(yǔ)音識(shí)別方法[A];第九屆全國(guó)信號(hào)處理學(xué)術(shù)年會(huì)(CCSP-99)論文集[C];1999年
7 國(guó)立新;莫福源;李昌立;;基于分段K平均訓(xùn)練的漢語(yǔ)全音節(jié)語(yǔ)音識(shí)別的研究[A];第三屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1994年
8 崔毓菁;劉剛;;基于HMM的語(yǔ)音識(shí)別系統(tǒng)中狀態(tài)輸出概率計(jì)算優(yōu)化算法的研究[A];2007通信理論與技術(shù)新發(fā)展——第十二屆全國(guó)青年通信學(xué)術(shù)會(huì)議論文集(上冊(cè))[C];2007年
9 王承發(fā);肖毅壯;韓紀(jì)慶;;一種語(yǔ)音識(shí)別系統(tǒng)的端點(diǎn)檢測(cè)算法[A];第二屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1992年
10 何為民;趙銳;陳光發(fā);;軍事口令非特定人識(shí)別系統(tǒng)的實(shí)現(xiàn)[A];第三屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];1994年
相關(guān)重要報(bào)紙文章 前10條
1 通訊員 吉春;漢族民警用維吾爾語(yǔ)介紹法律知識(shí)[N];巴音郭楞日?qǐng)?bào);2008年
2 本報(bào)記者 朱彤;俺們的“窮多克特”[N];科技日?qǐng)?bào);2009年
3 高方;讓電影璀璨鄉(xiāng)村的夜晚[N];新疆日?qǐng)?bào)(漢);2008年
4 閻曉明;掌聲傳遞團(tuán)結(jié)的心聲[N];人民日?qǐng)?bào);2009年
5 李 昕;烏魯木齊市舉辦維吾爾語(yǔ)系科普知識(shí)競(jìng)賽[N];大眾科技報(bào);2003年
6 記者 李U,
本文編號(hào):2057558
本文鏈接:http://www.sikaile.net/kejilunwen/wltx/2057558.html