面向維漢機器翻譯的語料篩選技術研究
發(fā)布時間:2017-12-26 00:12
本文關鍵詞:面向維漢機器翻譯的語料篩選技術研究 出處:《計算機應用研究》2016年12期 論文類型:期刊論文
【摘要】:統(tǒng)計機器翻譯是目前主流的機器翻譯技術,其在維漢翻譯中良好的性能已經(jīng)得到了廣泛的認可。維漢統(tǒng)計機器翻譯的最終結(jié)果同樣是受這幾方面的影響:翻譯模型、語言模型、語料質(zhì)量和規(guī)模等。旨在通過對維漢雙語訓練語料的篩選來提高最終的機器翻譯性能。在相關學者的研究基礎上,提出了改進的IBM1模型評價句對齊質(zhì)量、雙語語言模型困惑度進行語料篩選和多種篩選指標綜合求交集的方法。這些方法沒有語言特性的依賴,支持維漢雙語語料的篩選。通過實驗可證明,使用筆者提出的方法可以得到更優(yōu)的維漢機器翻譯結(jié)果。
【作者單位】: 中國科學院新疆理化技術研究所;新疆民族語音語言信息處理重點實驗室;中國科學院大學;烏魯木齊市公安局電子數(shù)據(jù)鑒定實驗中心;中國科學院聲學研究所;
【基金】:中國科學院西部之光項目(XBBS201216,LHXZ201301);中國科學院先導科技專項項目(XDA06030400) 新疆維吾爾自治區(qū)青年自然科學基金資助項目(2015211B034) 新疆維吾爾自治區(qū)重點實驗室開放課題項目(2015KL031)
【分類號】:TP391.2
【正文快照】: 0引言維吾爾語是維吾爾族的母語,在我國的使用人數(shù)已經(jīng)超過了一千萬。隨著國家一帶一路政策的深入,維吾爾語和漢語之間的機器翻譯近年來也逐漸成為了一個熱點問題。在眾多研究者們的共同努力下,維漢統(tǒng)計機器翻譯的準確率一直在不斷攀升。值得注意的是,作為目前主流的機器翻譯,
本文編號:1335023
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/1335023.html
最近更新
教材專著