基于神經(jīng)網(wǎng)絡的彝漢翻譯研究與實現(xiàn)
發(fā)布時間:2020-12-26 22:14
溝通是人類社會生活的潤滑劑,良好的溝通可以提高工作效率,促進社會和諧發(fā)展。而我們能良好溝通的前提是我們懂得對方的語言。中國是一個多民族多語言的國家。很多時候,兩個語言不同、又沒學過對方語言的人很難直接溝通。為了促進各民族之間的相互了解,我們有必要研究各民族語言間的翻譯。同時還能保護和發(fā)揚少數(shù)民族傳統(tǒng)文化,助力早日實現(xiàn)偉大復興的中國夢。彝族是分布在我國西南地區(qū)的一個少數(shù)民族,彝文也是我國的古老文字之一。為了解決彝族地區(qū)民族融合過程中存在的交流溝通困難問題,促進彝族地區(qū)的經(jīng)濟文化發(fā)展。同時為了更好地發(fā)揚優(yōu)秀的彝族傳統(tǒng)文化。借助近幾年發(fā)展迅速的深度學習技術,本文開展了彝文相關的神經(jīng)機器翻譯研究工作,實現(xiàn)了從彝語到漢語的神經(jīng)機器翻譯。本文的主要工作分為以下三個部分:(1)為了完成彝漢神經(jīng)機器翻譯任務,本文系統(tǒng)學習了神經(jīng)機器翻譯相關技術。鑒于沒有相關的彝文語料庫。本文收集整理彝文資料做成20萬的彝語單語語料,基于詞和彝文古詩的7萬對彝漢互譯語料庫。然后用收集的彝文詞匯在彝文單語語料上統(tǒng)計詞頻制作詞頻表,根據(jù)頻數(shù)權重抽取彝文詞匯構造帶標簽的偽彝文句子,訓練雙向LSTM模型用來預測句子標簽,最后結合...
【文章來源】:電子科技大學四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:79 頁
【學位級別】:碩士
【部分圖文】:
用戶界面展示
電子科技大學碩士學位論文58圖5-7用戶界面展示5.5.2翻譯效果展示為了展示本系統(tǒng)的翻譯效果,本文選用《漢彝翻譯技巧探微》中的兩個漢彝翻譯示例,通過系統(tǒng)譯文和參考譯文對比的方式來展現(xiàn)。翻譯示例一(如圖5-8所示):輸入彝文:,,,。系統(tǒng)譯文:兔子喜歡吃綠色食物,像青草,蔬菜,蘿卜。參考譯文:兔子喜吃綠色植物,如青草、蔬菜、蘿卜等。圖5-8彝語翻譯示例(一)翻譯示例二(如圖5-9所示):
第五章機器翻譯系統(tǒng)設計與實現(xiàn)59輸入彝文:40℃,,,,,。系統(tǒng)譯文:小孩皮膚熱40℃以上,抽筋容易,這樣在醫(yī)生話指引下,馬上應該找皮膚熱壓的方法,像旁邊冷毛巾貼上,皮膚熱打針這樣。參考譯文:嬰幼兒發(fā)熱到40℃左右,容易引起抽筋,應在醫(yī)生指導下及早采取有效的退熱方法,如頭上敷冷毛巾、打退熱針等。圖5-9彝語翻譯示例(二)從兩個翻譯示例可以看出,本系統(tǒng)對簡短語句的翻譯具有一定的可靠性。對于長語句,雖然能夠提供一定的源語信息,但由于彝漢語的語法結構等方面存在較大差異,翻譯結果不盡如人意。當對彝漢翻譯準確性要求不是很高的時候,可以運用本系統(tǒng)來獲取彝文信息。本章小結本章利用第三章提出的結合復值詞嵌入法、基于TransformerXL的雙編碼器雙解碼器翻譯模型,根據(jù)第四章翻譯對比試驗,采取翻譯效果最好的弱監(jiān)督學習方式訓練的模型實現(xiàn)彝語到漢語的翻譯。詳細描述了彝漢神經(jīng)機器翻譯系統(tǒng)的實現(xiàn)過程。從系統(tǒng)總體架構各層次的劃分及功能定義,各層次包含的功能模塊以及模塊之間的邏輯關系。到系統(tǒng)開發(fā)所用的功能軟件以及翻譯系統(tǒng)的部署、翻譯高效性和魯棒性測試,最后對翻譯系統(tǒng)的翻譯界面進行展示。
【參考文獻】:
期刊論文
[1]基于Bi-LSTM-6Tags的智能中文分詞方法[J]. 王瑋. 計算機應用. 2018(S2)
[2]彝文信息處理自動分詞技術的研究現(xiàn)狀與難點分析[J]. 王成平. 電腦知識與技術. 2012(04)
[3]統(tǒng)計機器翻譯綜述[J]. 劉群. 中文信息學報. 2003(04)
[4]機器翻譯的歷史和現(xiàn)狀[J]. 馮志偉. 國外自動化. 1984(04)
碩士論文
[1]基于神經(jīng)網(wǎng)絡的維漢翻譯研究與實現(xiàn)[D]. 楊洋.電子科技大學 2019
[2]基于句法規(guī)則的彝漢雙語調序模型研究[D]. 王正麗.貴州大學 2016
[3]基于機器學習的少數(shù)民族語言翻譯關鍵技術研究與實現(xiàn)[D]. 文佳勝.電子科技大學 2016
[4]基于最大熵的機器翻譯研究與實現(xiàn)[D]. 應志野.電子科技大學 2016
本文編號:2940542
【文章來源】:電子科技大學四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:79 頁
【學位級別】:碩士
【部分圖文】:
用戶界面展示
電子科技大學碩士學位論文58圖5-7用戶界面展示5.5.2翻譯效果展示為了展示本系統(tǒng)的翻譯效果,本文選用《漢彝翻譯技巧探微》中的兩個漢彝翻譯示例,通過系統(tǒng)譯文和參考譯文對比的方式來展現(xiàn)。翻譯示例一(如圖5-8所示):輸入彝文:,,,。系統(tǒng)譯文:兔子喜歡吃綠色食物,像青草,蔬菜,蘿卜。參考譯文:兔子喜吃綠色植物,如青草、蔬菜、蘿卜等。圖5-8彝語翻譯示例(一)翻譯示例二(如圖5-9所示):
第五章機器翻譯系統(tǒng)設計與實現(xiàn)59輸入彝文:40℃,,,,,。系統(tǒng)譯文:小孩皮膚熱40℃以上,抽筋容易,這樣在醫(yī)生話指引下,馬上應該找皮膚熱壓的方法,像旁邊冷毛巾貼上,皮膚熱打針這樣。參考譯文:嬰幼兒發(fā)熱到40℃左右,容易引起抽筋,應在醫(yī)生指導下及早采取有效的退熱方法,如頭上敷冷毛巾、打退熱針等。圖5-9彝語翻譯示例(二)從兩個翻譯示例可以看出,本系統(tǒng)對簡短語句的翻譯具有一定的可靠性。對于長語句,雖然能夠提供一定的源語信息,但由于彝漢語的語法結構等方面存在較大差異,翻譯結果不盡如人意。當對彝漢翻譯準確性要求不是很高的時候,可以運用本系統(tǒng)來獲取彝文信息。本章小結本章利用第三章提出的結合復值詞嵌入法、基于TransformerXL的雙編碼器雙解碼器翻譯模型,根據(jù)第四章翻譯對比試驗,采取翻譯效果最好的弱監(jiān)督學習方式訓練的模型實現(xiàn)彝語到漢語的翻譯。詳細描述了彝漢神經(jīng)機器翻譯系統(tǒng)的實現(xiàn)過程。從系統(tǒng)總體架構各層次的劃分及功能定義,各層次包含的功能模塊以及模塊之間的邏輯關系。到系統(tǒng)開發(fā)所用的功能軟件以及翻譯系統(tǒng)的部署、翻譯高效性和魯棒性測試,最后對翻譯系統(tǒng)的翻譯界面進行展示。
【參考文獻】:
期刊論文
[1]基于Bi-LSTM-6Tags的智能中文分詞方法[J]. 王瑋. 計算機應用. 2018(S2)
[2]彝文信息處理自動分詞技術的研究現(xiàn)狀與難點分析[J]. 王成平. 電腦知識與技術. 2012(04)
[3]統(tǒng)計機器翻譯綜述[J]. 劉群. 中文信息學報. 2003(04)
[4]機器翻譯的歷史和現(xiàn)狀[J]. 馮志偉. 國外自動化. 1984(04)
碩士論文
[1]基于神經(jīng)網(wǎng)絡的維漢翻譯研究與實現(xiàn)[D]. 楊洋.電子科技大學 2019
[2]基于句法規(guī)則的彝漢雙語調序模型研究[D]. 王正麗.貴州大學 2016
[3]基于機器學習的少數(shù)民族語言翻譯關鍵技術研究與實現(xiàn)[D]. 文佳勝.電子科技大學 2016
[4]基于最大熵的機器翻譯研究與實現(xiàn)[D]. 應志野.電子科技大學 2016
本文編號:2940542
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/2940542.html
最近更新
教材專著