基于深度學習的漢英時態(tài)翻譯研究
發(fā)布時間:2022-02-16 21:48
在日益全球化的今天,機器翻譯成為了日常生活中不可或缺的工具。中美兩國作為兩個世界大國,文化交流甚是頻繁,漢英機器翻譯的需求因此變得越來越大。隨著近幾年深度學習的急速發(fā)展,神經(jīng)網(wǎng)絡機器翻譯相比于傳統(tǒng)的機器翻譯而言取得了巨大的突破。然而,機器翻譯的效果盡管有了極大的提升,能夠滿足人的基本需求,但對于高要求的翻譯任務來說,就目前的機器翻譯來說還是遠遠不夠的。其中,機器翻譯的時態(tài)問題正是目前還未得到完全解決的問題。本文旨在解決漢英機器翻譯過程中的時態(tài)處理問題。通過結(jié)合前人所做的工作,本文提出基于深度學習的樹形時態(tài)標注算法。時態(tài)標注算法建立在馬爾科夫樹標注模型上。馬爾科夫樹標注模型是一種可以解決層次性問題的通用機器學習方法。語言具有層次性,從層次角度探索語言本身的含義可以獲得更多的信息。本文使用深度信念網(wǎng)絡做特征提取器,利用事先構(gòu)造好的自動標注算法從平行語料庫中獲得標注數(shù)據(jù)。標注數(shù)據(jù)為樹形結(jié)構(gòu),為了得到可供網(wǎng)絡使用的數(shù)據(jù),本文采用人工規(guī)則對標注數(shù)據(jù)進行編碼。網(wǎng)絡訓練完成后,通過馬爾科夫樹標注模型對中文句子轉(zhuǎn)換而成的不完全時態(tài)樹進行時態(tài)標注。實驗表明,基于深度信念網(wǎng)絡的樹形時態(tài)標注算法較前人的研究...
【文章來源】:廈門大學福建省211工程院校985工程院校教育部直屬院校
【文章頁數(shù)】:80 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景和意義
1.2 機器翻譯國內(nèi)外研究現(xiàn)狀及發(fā)展歷程
1.2.1 基于規(guī)則的機器翻譯
1.2.2 基于實例的機器翻譯
1.2.3 統(tǒng)計機器翻譯
1.2.4 神經(jīng)網(wǎng)絡機器翻譯
1.3 漢英時態(tài)機器翻譯研究現(xiàn)狀
1.3.1 時態(tài)標注
1.3.2 時態(tài)機器翻譯
1.4 研究內(nèi)容
1.5 組織結(jié)構(gòu)
第二章 相關研究內(nèi)容
2.1 詞向量
2.2 深度信念網(wǎng)絡
2.3 Transformer模型
2.3.1 多頭注意力機制
2.3.2 位置編碼
2.4 本章小結(jié)
第三章 基于馬爾科夫樹標注模型的漢英時態(tài)標注算法
3.1 馬爾科夫樹標注模型
3.1.1 待標注樹的預處理
3.1.2 樹標注模型
3.1.3 分解完全標注樹
3.1.4 求解最佳標注
3.2 時態(tài)樹的定義與構(gòu)造
3.2.1 時態(tài)樹的定義
3.2.2 時態(tài)樹的構(gòu)造
3.3 實驗數(shù)據(jù)準備
3.3.1 自動標注算法
3.3.2 時態(tài)樹編碼
3.4 實驗與分析
3.4.1 實驗數(shù)據(jù)
3.4.2 實驗描述
3.4.3 實驗評估指標
3.4.4 實驗結(jié)果分析
3.5 本章小結(jié)
第四章 基于深度學習的漢英時態(tài)翻譯系統(tǒng)
4.1 整體思路
4.2 時態(tài)的刪除與恢復
4.2.1 Stanford依存關系
4.2.2 去時態(tài)算法
4.2.3 時態(tài)恢復算法
4.3 中英文對齊關系
4.4 數(shù)據(jù)預處理
4.5 實驗與分析
4.5.1 實驗描述
4.5.2 實驗結(jié)果分析
4.6 本章小結(jié)
第五章 總結(jié)與展望
5.1 本文工作總結(jié)
5.2 未來改進方向
5.2.1 特征自動提取
5.2.2 語篇信息
參考文獻
致謝
【參考文獻】:
期刊論文
[1]基于樹形條件隨機場的跨語言時態(tài)標注[J]. 陳怡疆,徐海波,史曉東,蘇暢. 軟件學報. 2015(12)
[2]論漢語、英語、法語中時態(tài)表達手法的異同[J]. 許興星. 法制與社會. 2007(01)
[3]一種基于實例的漢英機器翻譯策略[J]. 胡國全,陳家駿,戴新宇,尹存燕. 計算機工程與設計. 2005(04)
[4]漢語的時態(tài)和時態(tài)成分[J]. 陳立民. 語言研究. 2002(03)
[5]基于實例的漢英機器翻譯系統(tǒng)研究與實現(xiàn)[J]. 王長勝,劉群. 計算機工程與應用. 2002(08)
本文編號:3628720
【文章來源】:廈門大學福建省211工程院校985工程院校教育部直屬院校
【文章頁數(shù)】:80 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景和意義
1.2 機器翻譯國內(nèi)外研究現(xiàn)狀及發(fā)展歷程
1.2.1 基于規(guī)則的機器翻譯
1.2.2 基于實例的機器翻譯
1.2.3 統(tǒng)計機器翻譯
1.2.4 神經(jīng)網(wǎng)絡機器翻譯
1.3 漢英時態(tài)機器翻譯研究現(xiàn)狀
1.3.1 時態(tài)標注
1.3.2 時態(tài)機器翻譯
1.4 研究內(nèi)容
1.5 組織結(jié)構(gòu)
第二章 相關研究內(nèi)容
2.1 詞向量
2.2 深度信念網(wǎng)絡
2.3 Transformer模型
2.3.1 多頭注意力機制
2.3.2 位置編碼
2.4 本章小結(jié)
第三章 基于馬爾科夫樹標注模型的漢英時態(tài)標注算法
3.1 馬爾科夫樹標注模型
3.1.1 待標注樹的預處理
3.1.2 樹標注模型
3.1.3 分解完全標注樹
3.1.4 求解最佳標注
3.2 時態(tài)樹的定義與構(gòu)造
3.2.1 時態(tài)樹的定義
3.2.2 時態(tài)樹的構(gòu)造
3.3 實驗數(shù)據(jù)準備
3.3.1 自動標注算法
3.3.2 時態(tài)樹編碼
3.4 實驗與分析
3.4.1 實驗數(shù)據(jù)
3.4.2 實驗描述
3.4.3 實驗評估指標
3.4.4 實驗結(jié)果分析
3.5 本章小結(jié)
第四章 基于深度學習的漢英時態(tài)翻譯系統(tǒng)
4.1 整體思路
4.2 時態(tài)的刪除與恢復
4.2.1 Stanford依存關系
4.2.2 去時態(tài)算法
4.2.3 時態(tài)恢復算法
4.3 中英文對齊關系
4.4 數(shù)據(jù)預處理
4.5 實驗與分析
4.5.1 實驗描述
4.5.2 實驗結(jié)果分析
4.6 本章小結(jié)
第五章 總結(jié)與展望
5.1 本文工作總結(jié)
5.2 未來改進方向
5.2.1 特征自動提取
5.2.2 語篇信息
參考文獻
致謝
【參考文獻】:
期刊論文
[1]基于樹形條件隨機場的跨語言時態(tài)標注[J]. 陳怡疆,徐海波,史曉東,蘇暢. 軟件學報. 2015(12)
[2]論漢語、英語、法語中時態(tài)表達手法的異同[J]. 許興星. 法制與社會. 2007(01)
[3]一種基于實例的漢英機器翻譯策略[J]. 胡國全,陳家駿,戴新宇,尹存燕. 計算機工程與設計. 2005(04)
[4]漢語的時態(tài)和時態(tài)成分[J]. 陳立民. 語言研究. 2002(03)
[5]基于實例的漢英機器翻譯系統(tǒng)研究與實現(xiàn)[J]. 王長勝,劉群. 計算機工程與應用. 2002(08)
本文編號:3628720
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/3628720.html
最近更新
教材專著