天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于谷歌神經(jīng)機器翻譯的英漢翻譯研究

發(fā)布時間:2022-02-12 14:08
  近年來,隨著深度學習的再度興起,神經(jīng)機器翻譯NMT逐漸取代了傳統(tǒng)的基于短語的統(tǒng)計機器翻譯方法,特別是基于Seq2Seq的神經(jīng)機器翻譯模型比較契合端對端的語言翻譯模式,獲得了業(yè)界研究人員的重點關(guān)注。然而與傳統(tǒng)的統(tǒng)計機器翻譯相比,神經(jīng)機器翻譯,特別是基于大規(guī)模數(shù)據(jù)集的神經(jīng)機器翻譯模型仍然存在缺陷,其訓練和推理速度緩慢、存在翻譯不完全的問題被暴露出來。同時受詞匯表規(guī)模的限制,神經(jīng)機器翻譯在未登錄詞和罕見詞上同樣出現(xiàn)了OOV(out-of-vocabulary)問題。針對以上提到的模型翻譯不完全和詞匯表OOV問題,本文分別提出了以下解決方案:(1)為了解決神經(jīng)機器翻譯在未登錄詞和罕見詞上的OOV問題,我們將英文文本預處理中常見的詞干提取技術(shù)和數(shù)據(jù)壓縮算法bpe(Byte pair encoding)相結(jié)合,提出了一種不同的基于subword(子詞)的詞序列分割方法。利用該方法我們將英文文本分割為由子詞單元組成的詞序列,同時利用unigram將中文文本分割為由漢字組成的字符序列。(2)為了防止解碼器出現(xiàn)翻譯不完全的現(xiàn)象,本文采用了一種可以提高解碼器獲取上下文信息能力的改進Attention機制—... 

【文章來源】:武漢大學湖北省211工程院校985工程院校教育部直屬院校

【文章頁數(shù)】:66 頁

【學位級別】:碩士

【部分圖文】:

基于谷歌神經(jīng)機器翻譯的英漢翻譯研究


MP神經(jīng)元結(jié)構(gòu)

基于谷歌神經(jīng)機器翻譯的英漢翻譯研究


損失函數(shù)曲面圖

基于谷歌神經(jīng)機器翻譯的英漢翻譯研究


一種簡單的循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)

【參考文獻】:
期刊論文
[1]機器翻譯方法研究與發(fā)展綜述[J]. 侯強,侯瑞麗.  計算機工程與應(yīng)用. 2019(10)
[2]知識圖譜技術(shù)研究綜述[J]. 歐艷鵬.  電子世界. 2018(13)
[3]中國翻譯服務(wù)業(yè)研究現(xiàn)狀分析[J]. 司顯柱,郭小潔.  北京第二外國語學院學報. 2018(03)
[4]結(jié)合LSTM和CNN混合架構(gòu)的深度神經(jīng)網(wǎng)絡(luò)語言模型[J]. 王毅,謝娟,成穎.  情報學報. 2018(02)
[5]機器翻譯的歷史和現(xiàn)狀[J]. 馮志偉.  國外自動化. 1984(04)

碩士論文
[1]基于實例的蒙漢機器翻譯的研究[D]. 李慧旻.內(nèi)蒙古工業(yè)大學 2016



本文編號:3621861

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3621861.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶5334d***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com