低資源語(yǔ)言神經(jīng)機(jī)器翻譯關(guān)鍵技術(shù)研究
發(fā)布時(shí)間:2021-01-29 04:29
機(jī)器翻譯,研究如何利用計(jì)算機(jī)自動(dòng)地實(shí)現(xiàn)不同語(yǔ)言之間的相互轉(zhuǎn)化,是自然語(yǔ)言處理的重要研究方向之一。近年來(lái),隨著深度神經(jīng)網(wǎng)絡(luò)技術(shù)的飛速發(fā)展,學(xué)術(shù)界和工業(yè)界的機(jī)器翻譯研究也逐漸從傳統(tǒng)的統(tǒng)計(jì)機(jī)器翻譯向神經(jīng)機(jī)器翻譯轉(zhuǎn)化。經(jīng)過(guò)大規(guī)模、高質(zhì)量的平行語(yǔ)料訓(xùn)練,神經(jīng)機(jī)器翻譯的性能在多個(gè)翻譯任務(wù)中都達(dá)到了媲美人類手工翻譯的水平。但除英語(yǔ)、漢語(yǔ)等少數(shù)語(yǔ)言外,世界上大多數(shù)語(yǔ)言對(duì)之間都不存在大規(guī)模的平行語(yǔ)料,屬低資源語(yǔ)言,這給神經(jīng)機(jī)器翻譯和應(yīng)用研究帶來(lái)了新的課題。本文旨在探索神經(jīng)機(jī)器翻譯技術(shù)在低資源語(yǔ)言場(chǎng)景下的應(yīng)用,為此分別研究了三種情況下漢語(yǔ)與“一帶一路”部分國(guó)家語(yǔ)言和我國(guó)少數(shù)民族語(yǔ)言之間的機(jī)器翻譯技術(shù)。本文的主要貢獻(xiàn)包括:☆針對(duì)低資源語(yǔ)言神經(jīng)機(jī)器翻譯中的數(shù)據(jù)匱乏問(wèn)題,本文在擁有少數(shù)平行語(yǔ)料的前提下,結(jié)合語(yǔ)料對(duì)齊和語(yǔ)法糾錯(cuò)等技術(shù),提出了一種基于語(yǔ)義相關(guān)詞替換策略的數(shù)據(jù)增強(qiáng)方法,通過(guò)自動(dòng)增加平行語(yǔ)料的數(shù)量以達(dá)到提升神經(jīng)機(jī)器翻譯性能的目標(biāo)。實(shí)驗(yàn)結(jié)果表明,該方法在蒙古語(yǔ)、藏語(yǔ)、維吾爾語(yǔ)和阿拉伯語(yǔ)與漢語(yǔ)之間的翻譯任務(wù)中取得了很好的性能,最高有3.06個(gè)BLEU點(diǎn)的提升!钺槍(duì)一些語(yǔ)言對(duì)之間不存在平行語(yǔ)料的問(wèn)題,本文分...
【文章來(lái)源】:中央民族大學(xué)北京市 211工程院校 985工程院校
【文章頁(yè)數(shù)】:87 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2-1?Transformer神經(jīng)機(jī)器翻譯模型整體架構(gòu)??(1)?Transformer?模型框架??與先前的神經(jīng)機(jī)器翻譯模型類似,Vaswani等人提出的Transformer模型也??是由編碼器(Encoder)和解碼器(Decoder)兩部分組成,最大的不同是,??
低資源機(jī)器翻譯????*??y??<r一^一^接使用源語(yǔ)言??言平行語(yǔ)料^??臟用?間麵??有監(jiān)4方法I?|無(wú)監(jiān)督方法|?|半監(jiān)督方法??I反向翻譯;?1? ̄無(wú)監(jiān)督 ̄:?!樞軸語(yǔ)言??:數(shù)據(jù)增強(qiáng)i?!預(yù)訓(xùn)練!?;雙語(yǔ)挖掘!??!遷移學(xué)習(xí)?:......:?!?......?!??!?元學(xué)習(xí)?丨?1?'?1?1??;???????!??I?1??圖2-2低資源語(yǔ)言機(jī)器翻譯分類??2.2.1有監(jiān)督低資源語(yǔ)言神經(jīng)機(jī)器翻譯方法??低資源語(yǔ)言神經(jīng)機(jī)器翻譯方法中的監(jiān)督方法,指的是在整個(gè)模型訓(xùn)練過(guò)程中,??需要直接提供源語(yǔ)言和目標(biāo)語(yǔ)言之間的雙語(yǔ)平行語(yǔ)料。監(jiān)督方法又可以進(jìn)一步可??以分為以下四種方法:反向翻譯(Back?Translation?)、數(shù)據(jù)增強(qiáng)(Data?Augmentation?)、??遷移學(xué)習(xí)(Transfer?Learning)和元學(xué)習(xí)(Meta-Learning)方法。??反向翻譯:反向翻譯[34]的思想是利用現(xiàn)有大規(guī)模的雙語(yǔ)平行語(yǔ)料并結(jié)合大??規(guī)模目標(biāo)語(yǔ)言單語(yǔ)數(shù)據(jù)提升神經(jīng)機(jī)器翻譯性能的一種方法。其主要步驟為;首先,??通過(guò)大規(guī)模的雙語(yǔ)平行語(yǔ)料訓(xùn)練一個(gè)目標(biāo)語(yǔ)言-源語(yǔ)言(記作T-S)的機(jī)器翻譯模型;??其次,利用大規(guī)模的目標(biāo)語(yǔ)言單語(yǔ)數(shù)據(jù)經(jīng)過(guò)T-S翻譯模型翻譯成源語(yǔ)言,生成大??規(guī)模的源語(yǔ)言與目標(biāo)語(yǔ)言的偽平行句對(duì)(質(zhì)量取決于T-S翻譯模型的性能)。最后,??將原始平行語(yǔ)料和偽平行語(yǔ)料進(jìn)行合并共同訓(xùn)練源語(yǔ)言-目標(biāo)語(yǔ)言機(jī)器翻譯模型??(記作S-T)。值得一提的是,反向翻譯方法在國(guó)內(nèi)外機(jī)器翻譯評(píng)測(cè)比賽??(WMT,CCMT)中己經(jīng)被認(rèn)為是提升機(jī)器翻譯性能必不可少的步驟印1
二--y?--二--??j?/?蠔**?^?*—?我?。(我有-個(gè)妹妹)=。88?i?I?y?一)??;//?我有;弟^i?語(yǔ)法約播??!?^-<:?!???ZZ?[??、、U??<s>?y7?I?!源句子我H?一個(gè)弟弟他!?K據(jù)增強(qiáng)??!???^?1?1?目標(biāo)句子?I?have?a?brother,he?<s>?i?/??1?I諏新增)我有—個(gè)妹妹.他<S>?:??/??L??'?i.?_?f.*1L?l^yi!5。担保蓿?Ir.?V'T?\??圖3-1數(shù)據(jù)增強(qiáng)神經(jīng)機(jī)器翻譯技術(shù)模型框架圖??3.2.1語(yǔ)義相關(guān)集生成??假如a,?b表示為兩個(gè)單詞,是它們?cè)冢木S向量空間中的對(duì)應(yīng)單詞??向量,則可以通過(guò)計(jì)算整個(gè)向量空間中單詞之間的余弦相似度來(lái)獲得與語(yǔ)義相關(guān)??詞:??a*b??cos(a^b)?=??(3.1)??Ikllll^li??其中,||fl||是向量a的L2范數(shù),是兩個(gè)向量的點(diǎn)乘。??語(yǔ)義相關(guān)集的生成步驟為:首先,我們通過(guò)大規(guī)模的單語(yǔ)種數(shù)據(jù)訓(xùn)練了一個(gè)??詞向量模型,并選擇余弦相似度值大于閾值的語(yǔ)義相關(guān)詞(實(shí)驗(yàn)中??分別使用的閾值為0.6,?0.8,?0.9,?0.95),并生成了語(yǔ)義相關(guān)集多。??3.2.2語(yǔ)義相關(guān)詞替換??給定一個(gè)句子對(duì)(S,T)和某個(gè)單詞\在3中的位置i,首先,我們通過(guò)遍歷??語(yǔ)義相關(guān)集0,分別將S中的單詞&替換成語(yǔ)義相關(guān)集中的單詞然后,通過(guò)??23??
【參考文獻(xiàn)】:
期刊論文
[1]基于多編碼器多解碼器的大規(guī)模維漢神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯模型[J]. 張金超,艾山·吾買(mǎi)爾,買(mǎi)合木提·買(mǎi)買(mǎi)提,劉群. 中文信息學(xué)報(bào). 2018(09)
[2]基于RNN和CNN的蒙漢神經(jīng)機(jī)器翻譯研究[J]. 包烏格德勒,趙小兵. 中文信息學(xué)報(bào). 2018(08)
[3]融合先驗(yàn)信息的蒙漢神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯模型[J]. 樊文婷,侯宏旭,王洪彬,武靜,李金廷. 中文信息學(xué)報(bào). 2018(06)
[4]基于CNN詞根形態(tài)選擇模型的改進(jìn)蒙漢機(jī)器翻譯研究[J]. 烏尼爾,蘇依拉,劉婉婉,仁慶道爾吉. 中文信息學(xué)報(bào). 2018(05)
[5]藏漢神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯研究[J]. 李亞超,熊德意,張民,江靜,馬寧,殷建民. 中文信息學(xué)報(bào). 2017(06)
[6]神經(jīng)機(jī)器翻譯系統(tǒng)在維吾爾語(yǔ)-漢語(yǔ)翻譯中的性能對(duì)比[J]. 哈里旦木·阿布都克里木,劉洋,孫茂松. 清華大學(xué)學(xué)報(bào)(自然科學(xué)版). 2017(08)
[7]神經(jīng)機(jī)器翻譯前沿進(jìn)展[J]. 劉洋. 計(jì)算機(jī)研究與發(fā)展. 2017(06)
[8]基于藏語(yǔ)字性標(biāo)注的詞性預(yù)測(cè)研究[J]. 龍從軍,劉匯丹,諾明花,吳健. 中文信息學(xué)報(bào). 2015(05)
[9]基于短語(yǔ)的漢維/維漢統(tǒng)計(jì)機(jī)器翻譯[J]. 董興華,周俊林,郭樹(shù)盛,吐?tīng)柡椤の崴韭? 計(jì)算機(jī)工程. 2011(09)
[10]基于短語(yǔ)的蒙漢統(tǒng)計(jì)機(jī)器翻譯系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J]. 銀花,王斯日古楞,艷紅. 內(nèi)蒙古師范大學(xué)學(xué)報(bào)(自然科學(xué)漢文版). 2011(01)
碩士論文
[1]基于Web的藏漢雙語(yǔ)可比語(yǔ)料庫(kù)構(gòu)建技術(shù)研究[D]. 龐偉.中央民族大學(xué) 2015
本文編號(hào):3006273
【文章來(lái)源】:中央民族大學(xué)北京市 211工程院校 985工程院校
【文章頁(yè)數(shù)】:87 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2-1?Transformer神經(jīng)機(jī)器翻譯模型整體架構(gòu)??(1)?Transformer?模型框架??與先前的神經(jīng)機(jī)器翻譯模型類似,Vaswani等人提出的Transformer模型也??是由編碼器(Encoder)和解碼器(Decoder)兩部分組成,最大的不同是,??
低資源機(jī)器翻譯????*??y??<r一^一^接使用源語(yǔ)言??言平行語(yǔ)料^??臟用?間麵??有監(jiān)4方法I?|無(wú)監(jiān)督方法|?|半監(jiān)督方法??I反向翻譯;?1? ̄無(wú)監(jiān)督 ̄:?!樞軸語(yǔ)言??:數(shù)據(jù)增強(qiáng)i?!預(yù)訓(xùn)練!?;雙語(yǔ)挖掘!??!遷移學(xué)習(xí)?:......:?!?......?!??!?元學(xué)習(xí)?丨?1?'?1?1??;???????!??I?1??圖2-2低資源語(yǔ)言機(jī)器翻譯分類??2.2.1有監(jiān)督低資源語(yǔ)言神經(jīng)機(jī)器翻譯方法??低資源語(yǔ)言神經(jīng)機(jī)器翻譯方法中的監(jiān)督方法,指的是在整個(gè)模型訓(xùn)練過(guò)程中,??需要直接提供源語(yǔ)言和目標(biāo)語(yǔ)言之間的雙語(yǔ)平行語(yǔ)料。監(jiān)督方法又可以進(jìn)一步可??以分為以下四種方法:反向翻譯(Back?Translation?)、數(shù)據(jù)增強(qiáng)(Data?Augmentation?)、??遷移學(xué)習(xí)(Transfer?Learning)和元學(xué)習(xí)(Meta-Learning)方法。??反向翻譯:反向翻譯[34]的思想是利用現(xiàn)有大規(guī)模的雙語(yǔ)平行語(yǔ)料并結(jié)合大??規(guī)模目標(biāo)語(yǔ)言單語(yǔ)數(shù)據(jù)提升神經(jīng)機(jī)器翻譯性能的一種方法。其主要步驟為;首先,??通過(guò)大規(guī)模的雙語(yǔ)平行語(yǔ)料訓(xùn)練一個(gè)目標(biāo)語(yǔ)言-源語(yǔ)言(記作T-S)的機(jī)器翻譯模型;??其次,利用大規(guī)模的目標(biāo)語(yǔ)言單語(yǔ)數(shù)據(jù)經(jīng)過(guò)T-S翻譯模型翻譯成源語(yǔ)言,生成大??規(guī)模的源語(yǔ)言與目標(biāo)語(yǔ)言的偽平行句對(duì)(質(zhì)量取決于T-S翻譯模型的性能)。最后,??將原始平行語(yǔ)料和偽平行語(yǔ)料進(jìn)行合并共同訓(xùn)練源語(yǔ)言-目標(biāo)語(yǔ)言機(jī)器翻譯模型??(記作S-T)。值得一提的是,反向翻譯方法在國(guó)內(nèi)外機(jī)器翻譯評(píng)測(cè)比賽??(WMT,CCMT)中己經(jīng)被認(rèn)為是提升機(jī)器翻譯性能必不可少的步驟印1
二--y?--二--??j?/?蠔**?^?*—?我?。(我有-個(gè)妹妹)=。88?i?I?y?一)??;//?我有;弟^i?語(yǔ)法約播??!?^-<:?!???ZZ?[??、、U??<s>?y7?I?!源句子我H?一個(gè)弟弟他!?K據(jù)增強(qiáng)??!???^?1?1?目標(biāo)句子?I?have?a?brother,he?<s>?i?/??1?I諏新增)我有—個(gè)妹妹.他<S>?:??/??L??'?i.?_?f.*1L?l^yi!5。担保蓿?Ir.?V'T?\??圖3-1數(shù)據(jù)增強(qiáng)神經(jīng)機(jī)器翻譯技術(shù)模型框架圖??3.2.1語(yǔ)義相關(guān)集生成??假如a,?b表示為兩個(gè)單詞,是它們?cè)冢木S向量空間中的對(duì)應(yīng)單詞??向量,則可以通過(guò)計(jì)算整個(gè)向量空間中單詞之間的余弦相似度來(lái)獲得與語(yǔ)義相關(guān)??詞:??a*b??cos(a^b)?=??(3.1)??Ikllll^li??其中,||fl||是向量a的L2范數(shù),是兩個(gè)向量的點(diǎn)乘。??語(yǔ)義相關(guān)集的生成步驟為:首先,我們通過(guò)大規(guī)模的單語(yǔ)種數(shù)據(jù)訓(xùn)練了一個(gè)??詞向量模型,并選擇余弦相似度值大于閾值的語(yǔ)義相關(guān)詞(實(shí)驗(yàn)中??分別使用的閾值為0.6,?0.8,?0.9,?0.95),并生成了語(yǔ)義相關(guān)集多。??3.2.2語(yǔ)義相關(guān)詞替換??給定一個(gè)句子對(duì)(S,T)和某個(gè)單詞\在3中的位置i,首先,我們通過(guò)遍歷??語(yǔ)義相關(guān)集0,分別將S中的單詞&替換成語(yǔ)義相關(guān)集中的單詞然后,通過(guò)??23??
【參考文獻(xiàn)】:
期刊論文
[1]基于多編碼器多解碼器的大規(guī)模維漢神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯模型[J]. 張金超,艾山·吾買(mǎi)爾,買(mǎi)合木提·買(mǎi)買(mǎi)提,劉群. 中文信息學(xué)報(bào). 2018(09)
[2]基于RNN和CNN的蒙漢神經(jīng)機(jī)器翻譯研究[J]. 包烏格德勒,趙小兵. 中文信息學(xué)報(bào). 2018(08)
[3]融合先驗(yàn)信息的蒙漢神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯模型[J]. 樊文婷,侯宏旭,王洪彬,武靜,李金廷. 中文信息學(xué)報(bào). 2018(06)
[4]基于CNN詞根形態(tài)選擇模型的改進(jìn)蒙漢機(jī)器翻譯研究[J]. 烏尼爾,蘇依拉,劉婉婉,仁慶道爾吉. 中文信息學(xué)報(bào). 2018(05)
[5]藏漢神經(jīng)網(wǎng)絡(luò)機(jī)器翻譯研究[J]. 李亞超,熊德意,張民,江靜,馬寧,殷建民. 中文信息學(xué)報(bào). 2017(06)
[6]神經(jīng)機(jī)器翻譯系統(tǒng)在維吾爾語(yǔ)-漢語(yǔ)翻譯中的性能對(duì)比[J]. 哈里旦木·阿布都克里木,劉洋,孫茂松. 清華大學(xué)學(xué)報(bào)(自然科學(xué)版). 2017(08)
[7]神經(jīng)機(jī)器翻譯前沿進(jìn)展[J]. 劉洋. 計(jì)算機(jī)研究與發(fā)展. 2017(06)
[8]基于藏語(yǔ)字性標(biāo)注的詞性預(yù)測(cè)研究[J]. 龍從軍,劉匯丹,諾明花,吳健. 中文信息學(xué)報(bào). 2015(05)
[9]基于短語(yǔ)的漢維/維漢統(tǒng)計(jì)機(jī)器翻譯[J]. 董興華,周俊林,郭樹(shù)盛,吐?tīng)柡椤の崴韭? 計(jì)算機(jī)工程. 2011(09)
[10]基于短語(yǔ)的蒙漢統(tǒng)計(jì)機(jī)器翻譯系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J]. 銀花,王斯日古楞,艷紅. 內(nèi)蒙古師范大學(xué)學(xué)報(bào)(自然科學(xué)漢文版). 2011(01)
碩士論文
[1]基于Web的藏漢雙語(yǔ)可比語(yǔ)料庫(kù)構(gòu)建技術(shù)研究[D]. 龐偉.中央民族大學(xué) 2015
本文編號(hào):3006273
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3006273.html
最近更新
教材專著