天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

稀疏資源條件下的藏漢機(jī)器翻譯研究

發(fā)布時(shí)間:2021-11-20 11:16
  機(jī)器翻譯是指運(yùn)用特定的計(jì)算機(jī)程序?qū)⒁环N自然語言轉(zhuǎn)換為另一種自然語言的過程。自上世紀(jì)50年代提出機(jī)器翻譯的思想以來,機(jī)器翻譯領(lǐng)域的研究經(jīng)歷了從規(guī)則到統(tǒng)計(jì)再到深度學(xué)習(xí)的理論和技術(shù)的多次迭代,是整個(gè)人工智能領(lǐng)域中最為活躍的研究方向,取得了巨大的進(jìn)展,并且在未來有廣闊的發(fā)展前景。藏漢機(jī)器翻譯研究作為藏語自然語言處理領(lǐng)域中主要的課題之一,一直是我國少數(shù)民族語言信息化研究的重要工作。本文著眼于藏漢機(jī)器翻譯研究中的數(shù)據(jù)稀疏問題,在Transformer神經(jīng)網(wǎng)絡(luò)翻譯模型基礎(chǔ)上,運(yùn)用百萬句子單語數(shù)據(jù)大規(guī)模迭代式回譯策略和譯文自動(dòng)篩選機(jī)制,使最終的模型比基準(zhǔn)模型有4個(gè)BLEU值的提升,證實(shí)了回譯方法的有效性。除此之外,論文還實(shí)現(xiàn)了基于短語的統(tǒng)計(jì)翻譯模型和三類基于主流神經(jīng)網(wǎng)絡(luò)構(gòu)架的藏漢機(jī)器翻譯基準(zhǔn)模型,并對(duì)面向神經(jīng)網(wǎng)絡(luò)藏漢機(jī)器翻譯的分詞方法進(jìn)行了研究分析。本篇論文的主要內(nèi)容包括:·研究和分析了面向神經(jīng)網(wǎng)絡(luò)的藏漢機(jī)器翻譯的分詞方法,以實(shí)驗(yàn)方式證實(shí)了基于字節(jié)對(duì)編碼的子詞分詞模型有最好的表現(xiàn);·實(shí)現(xiàn)了用于辨別藏漢句對(duì)翻譯等效性的端對(duì)端分類器;·結(jié)合翻譯等效性的分類器和大規(guī)模對(duì)偶迭代式的回譯策略,實(shí)現(xiàn)了藏漢翻譯在稀... 

【文章來源】:青海師范大學(xué)青海省

【文章頁數(shù)】:78 頁

【學(xué)位級(jí)別】:碩士

【部分圖文】:

稀疏資源條件下的藏漢機(jī)器翻譯研究


016-2024年機(jī)器翻譯的市場規(guī)模估值

“中國”,統(tǒng)計(jì)機(jī)器翻譯,雙語對(duì)齊,翻譯方法


圖 2.6 Ngram-viewer 中 “中國”、“經(jīng)濟(jì)” 和 “發(fā)展” 三個(gè)詞的頻度走勢上所有的統(tǒng)計(jì)機(jī)器翻譯方法都有詞對(duì)齊的概念[90],是跨語言的簡單映射[85], 旨在將源語言的句子 中第 位置的詞 對(duì)應(yīng)到中第 詞 ,即設(shè)法獲得一個(gè)函數(shù) : → ,如圖 2.7 。但是實(shí)例的翻譯方法,這一映射的獲取并不需要利用任何先驗(yàn)的語計(jì)算機(jī)算法在一定規(guī)模的雙語平行文本數(shù)據(jù)中以概率推演方式基本思想即是在雙語對(duì)齊文本中經(jīng)常成對(duì)出現(xiàn)的兩個(gè)詞或者其常出現(xiàn)的更有可能是語義上對(duì)等的。Och 于 2001 發(fā)布的 GIZ,實(shí)現(xiàn)了 IMB 統(tǒng)計(jì)模型系列[5,85]中的所有詞對(duì)齊算法,成為絕統(tǒng)實(shí)現(xiàn)的軟件基礎(chǔ)[92]。! +

二維圖,注意力,二維


,其注意力權(quán)重 的是通過公式 (2-13) 計(jì)算 =exp( )∑ =1( )用于估計(jì)輸入端的 位置周圍的信息與輸出端的絡(luò)的原始論文[9]中使用了一個(gè)簡單的前饋網(wǎng)絡(luò)對(duì)輸入為 1 時(shí)刻的解碼器端的隱藏狀態(tài)表示 , 即: = ( 1, ) 饋網(wǎng)絡(luò)所擬合的函數(shù)?梢酝ㄟ^注意力矩陣[9]或者詞向量的二維投射[

【參考文獻(xiàn)】:
期刊論文
[1]神經(jīng)網(wǎng)絡(luò)藏文分詞方法研究[J]. 桑杰端珠,才讓加.  青?萍. 2018(06)
[2]《中國人工智能發(fā)展報(bào)告2018》英文版發(fā)布[J].   中國科技獎(jiǎng)勵(lì). 2018(10)
[3]藏漢神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯研究[J]. 李亞超,熊德意,張民,江靜,馬寧,殷建民.  中文信息學(xué)報(bào). 2017(06)
[4]基于藏語語義分析的機(jī)器翻譯技術(shù)研究[J]. 何向真,萬福成,于洪志,吳璽宏.  計(jì)算機(jī)工程與應(yīng)用. 2015(15)
[5]藏文數(shù)詞識(shí)別與翻譯[J]. 孫萌,華卻才讓,劉凱,呂雅娟,劉群.  北京大學(xué)學(xué)報(bào)(自然科學(xué)版). 2013(01)
[6]機(jī)器翻譯的歷史和現(xiàn)狀[J]. 馮志偉.  國外自動(dòng)化. 1984(04)

博士論文
[1]基于樹到串藏語機(jī)器翻譯若干關(guān)鍵技術(shù)研究[D]. 華卻才讓.陜西師范大學(xué) 2014

碩士論文
[1]藏漢雙語平行語料庫構(gòu)建方法及關(guān)鍵技術(shù)研究[D]. 巴桑卓瑪.西藏大學(xué) 2018
[2]面向機(jī)器翻譯的藏語功能組塊識(shí)別研究[D]. 王天航.北京理工大學(xué) 2016
[3]面向藏英機(jī)器翻譯的藏英句法結(jié)構(gòu)對(duì)比研究[D]. 吉毛才讓.青海師范大學(xué) 2014



本文編號(hào):3507209

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3507209.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶9536e***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com