天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

面向神經(jīng)機(jī)器翻譯的領(lǐng)域適應(yīng)方法研究

發(fā)布時(shí)間:2024-06-02 13:43
  數(shù)據(jù)驅(qū)動(dòng)的機(jī)器翻譯技術(shù)的性能在很大程度上取決于訓(xùn)練和測(cè)試數(shù)據(jù)之間的領(lǐng)域匹配程度。由于不同領(lǐng)域訓(xùn)練數(shù)據(jù)差異大導(dǎo)致跨領(lǐng)域翻譯性能下降,研究者通常通過使翻譯系統(tǒng)適應(yīng)到目標(biāo)領(lǐng)域的方法來提高特定領(lǐng)域的翻譯性能。神經(jīng)機(jī)器翻譯(NMT)領(lǐng)域適應(yīng)研究的主要策略大致可以分為兩類:一類是將領(lǐng)域外的知識(shí)遷移和適應(yīng)到領(lǐng)域內(nèi)的翻譯中;另外一類是使用混合領(lǐng)域語料構(gòu)建翻譯模型來翻譯多領(lǐng)域文本。本文分別針對(duì)這兩類情景,開展了面向神經(jīng)機(jī)器翻譯的領(lǐng)域適應(yīng)方法研究。本文主要工作包括:(1)基于句子權(quán)重的神經(jīng)機(jī)器翻譯的領(lǐng)域適應(yīng)方法。在機(jī)器翻譯中,與目標(biāo)領(lǐng)域相關(guān)的那些領(lǐng)域外的實(shí)例對(duì)于模型的訓(xùn)練通常是有益的,而那些與目標(biāo)領(lǐng)域不相關(guān)的領(lǐng)域外數(shù)據(jù)可能會(huì)降低翻譯質(zhì)量。在本文中,我們提出一種基于句子權(quán)重的領(lǐng)域適應(yīng)方法,根據(jù)句子與目標(biāo)領(lǐng)域的相關(guān)程度來評(píng)估句子的權(quán)重,并將權(quán)重融入NMT影響參數(shù)更新。我們將該方法應(yīng)用在標(biāo)準(zhǔn)的領(lǐng)域適應(yīng)和低資源領(lǐng)域偽語料訓(xùn)練的兩個(gè)場(chǎng)景中,在中英IWSLT領(lǐng)域適應(yīng)任務(wù)和低資源的電商領(lǐng)域翻譯任務(wù)中,該方法均取得了特定領(lǐng)域翻譯性能的顯著提升。(2)基于自注意力機(jī)制的神經(jīng)機(jī)器翻譯的多領(lǐng)域適應(yīng)方法。在通用平行語料庫上訓(xùn)練的...

【文章頁數(shù)】:72 頁

【學(xué)位級(jí)別】:碩士

【部分圖文】:

圖2-1基于注意力的神經(jīng)機(jī)器翻譯流程框架圖??2-1,[3-4i立經(jīng)礎(chǔ)??

圖2-1基于注意力的神經(jīng)機(jī)器翻譯流程框架圖??2-1,[3-4i立經(jīng)礎(chǔ)??

面向神經(jīng)機(jī)器翻譯的領(lǐng)域適應(yīng)方法研宄?第二草相關(guān)知識(shí)介紹??第二章相關(guān)知識(shí)介紹??本章主要對(duì)本文研究涉及到的一些相關(guān)知識(shí)進(jìn)行介紹,分為五個(gè)部分:第-部分??介紹基于注意力的循環(huán)神經(jīng)網(wǎng)絡(luò)的神經(jīng)機(jī)器翻譯模型;第二部分介紹基于自注意??(self-attention)的神經(jīng)機(jī)器翻譯Tra....


圖2-2基于自注意力(self-attention)的神經(jīng)機(jī)器翻譯Transformer模型流程框架

圖2-2基于自注意力(self-attention)的神經(jīng)機(jī)器翻譯Transformer模型流程框架

der??Feed?Forward?Attention?M??^???>?A?WX??Encoder??|?^?^A???Nx?Add&Norm?Add&Norm??1?Masked??Multi-Head?Multi-Head??Attention?Attention??V?/....


圖1??Transformer16】一-

圖1??Transformer16】一-

Encoder??|?^?^A???Nx?Add&Norm?Add&Norm??1?Masked??Multi-Head?Multi-Head??Attention?Attention??V?/?v?J??Input?Output??Embeddng?Embedding??1?I....


圖3-1用t-SNE將領(lǐng)域內(nèi)和領(lǐng)域外句子表示可視化

圖3-1用t-SNE將領(lǐng)域內(nèi)和領(lǐng)域外句子表示可視化

第二章基于句子權(quán)重的神經(jīng)機(jī)器翻譯的領(lǐng)域適應(yīng)方法?面向神經(jīng)機(jī)器翻譯的領(lǐng)域適應(yīng)方法研究??3.4.6句子表示的可視化分析??本章提出的相似度測(cè)量方法的有效性可以由可視化論證。相似的句子具有相似的??向量表示在圖3-1中,每個(gè)點(diǎn)代表著一個(gè)句子向量表示的二維投射,句子向量是??由經(jīng)過so....



本文編號(hào):3987332

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3987332.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶e8313***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com