基于詞對和詞典的句子對齊研究
發(fā)布時間:2022-10-10 16:39
句子對齊是將源語言文本中的句子映射到目標(biāo)語言文本中對應(yīng)翻譯的過程,作為構(gòu)建和擴(kuò)充平行語料庫的核心技術(shù),其性能的優(yōu)劣影響著平行語料庫的質(zhì)量。本文集中于通過神經(jīng)網(wǎng)絡(luò)建模句對間的詞對關(guān)系、詞對重要性以及融入詞典知識來改進(jìn)句子對齊性能的研究,主要內(nèi)容如下:(1)基于詞對建模的句子對齊?紤]到相互對齊的兩個句子中通常含有大量相互對齊的詞對這一事實(shí),本文探索源語言句子和目標(biāo)語言句子之間的詞對關(guān)系,并提出了基于詞對建模的句子對齊方法。該方法首先利用雙向循環(huán)神經(jīng)網(wǎng)絡(luò)來編碼輸入的句對,然后使用門關(guān)聯(lián)網(wǎng)絡(luò)來計(jì)算句對中詞對的語義關(guān)系,并通過多層感知器進(jìn)一步融合語義關(guān)系來判斷該句對是否對齊。(2)帶多視角注意力的基于詞對驅(qū)動句子對齊。考慮到對齊的句對中包含多個對齊的詞對,而這些詞對在句對語義關(guān)系中又扮演著不同重要程度的角色,本文探討了建模詞對重要性及其關(guān)系的句子對齊方法。首先通過融合三種相似性度量方法的詞對關(guān)聯(lián)網(wǎng)絡(luò)從三種角度獲取詞對間語義關(guān)系,然后利用多視角注意力網(wǎng)絡(luò)同樣地從三種角度對詞對重要性進(jìn)行建模,最后通過二者結(jié)合來確定句對是否對齊。(3)融入詞典知識的基于詞對驅(qū)動句子對齊。受大部分借助外部詞典的句子對...
【文章頁數(shù)】:81 頁
【學(xué)位級別】:碩士
【文章目錄】:
中文摘要
Abstract
第1章 緒論
1.1 研究背景及意義
1.1.1 研究背景
1.1.2 研究意義
1.2 研究現(xiàn)狀
1.3 研究內(nèi)容
1.4 論文組織結(jié)構(gòu)
第2章 相關(guān)知識
2.1 句子對齊任務(wù)簡介
2.2 句子對齊算法
2.3 雙向循環(huán)神經(jīng)網(wǎng)絡(luò)
2.3.1 門控循環(huán)單元
2.3.2 雙向循環(huán)神經(jīng)網(wǎng)絡(luò)
2.4 語料資源和性能評測指標(biāo)
2.4.1 語料資源
2.4.2 性能評測指標(biāo)
2.5 本章小結(jié)
第3章 基于詞對建模的句子對齊
3.1 引言
3.2 問題描述
3.3 基于詞對建模的神經(jīng)網(wǎng)絡(luò)模型
3.3.1 詞向量層
3.3.2 雙向循環(huán)神經(jīng)網(wǎng)絡(luò)層
3.3.3 門關(guān)聯(lián)網(wǎng)絡(luò)層
3.3.4 最大池化層
3.3.5 多層感知器層
3.4 實(shí)驗(yàn)結(jié)果與分析
3.4.1 實(shí)驗(yàn)設(shè)置
3.4.2 實(shí)驗(yàn)結(jié)果
3.4.3 實(shí)驗(yàn)分析
3.5 本章小結(jié)
第4章 帶多視角注意力的基于詞對驅(qū)動句子對齊
4.1 引言
4.2 多視角注意力的詞對關(guān)聯(lián)網(wǎng)絡(luò)模型
4.2.1 雙向循環(huán)神經(jīng)網(wǎng)絡(luò)
4.2.2 詞對關(guān)聯(lián)網(wǎng)絡(luò)
4.2.3 多視角注意力網(wǎng)絡(luò)
4.2.4 最大池化和多層感知器
4.2.5 模型訓(xùn)練
4.3 實(shí)驗(yàn)結(jié)果與分析
4.3.1 實(shí)驗(yàn)設(shè)置
4.3.2 實(shí)驗(yàn)結(jié)果
4.3.3 實(shí)驗(yàn)分析
4.4 本章小結(jié)
第5章 融入詞典知識的基于詞對驅(qū)動句子對齊
5.1 引言
5.2 融入詞典知識的詞對關(guān)聯(lián)網(wǎng)絡(luò)模型
5.2.1 基于詞典建模的神經(jīng)網(wǎng)絡(luò)模型
5.2.2 混合編碼器
5.2.3 特征編碼器
5.2.4 門控編碼器
5.3 構(gòu)建雙語詞典
5.4 實(shí)驗(yàn)結(jié)果與分析
5.4.1 實(shí)驗(yàn)設(shè)置
5.4.2 實(shí)驗(yàn)結(jié)果
5.4.3 實(shí)驗(yàn)分析
5.5 本章小結(jié)
第6章 總結(jié)與展望
6.1 總結(jié)
6.2 展望
參考文獻(xiàn)
攻讀學(xué)位期間取得的科研成果
攻讀學(xué)位期間參與的科研項(xiàng)目
致謝
【參考文獻(xiàn)】:
期刊論文
[1]基于詞對關(guān)聯(lián)網(wǎng)絡(luò)的句子對齊研究[J]. 丁穎,李軍輝,周國棟. 中文信息學(xué)報. 2019(07)
[2]漢英句子對齊長度計(jì)算方法的研究[J]. 張霞,昝紅英,張恩展. 計(jì)算機(jī)工程與設(shè)計(jì). 2009(18)
[3]基于長度和位置信息的雙語句子對齊方法[J]. 李維剛,劉挺,張宇,李生. 哈爾濱工業(yè)大學(xué)學(xué)報. 2006(05)
[4]漢英雙語庫自動分段對齊研究[J]. 王斌,劉群,張祥. 軟件學(xué)報. 2000(11)
本文編號:3689986
【文章頁數(shù)】:81 頁
【學(xué)位級別】:碩士
【文章目錄】:
中文摘要
Abstract
第1章 緒論
1.1 研究背景及意義
1.1.1 研究背景
1.1.2 研究意義
1.2 研究現(xiàn)狀
1.3 研究內(nèi)容
1.4 論文組織結(jié)構(gòu)
第2章 相關(guān)知識
2.1 句子對齊任務(wù)簡介
2.2 句子對齊算法
2.3 雙向循環(huán)神經(jīng)網(wǎng)絡(luò)
2.3.1 門控循環(huán)單元
2.3.2 雙向循環(huán)神經(jīng)網(wǎng)絡(luò)
2.4 語料資源和性能評測指標(biāo)
2.4.1 語料資源
2.4.2 性能評測指標(biāo)
2.5 本章小結(jié)
第3章 基于詞對建模的句子對齊
3.1 引言
3.2 問題描述
3.3 基于詞對建模的神經(jīng)網(wǎng)絡(luò)模型
3.3.1 詞向量層
3.3.2 雙向循環(huán)神經(jīng)網(wǎng)絡(luò)層
3.3.3 門關(guān)聯(lián)網(wǎng)絡(luò)層
3.3.4 最大池化層
3.3.5 多層感知器層
3.4 實(shí)驗(yàn)結(jié)果與分析
3.4.1 實(shí)驗(yàn)設(shè)置
3.4.2 實(shí)驗(yàn)結(jié)果
3.4.3 實(shí)驗(yàn)分析
3.5 本章小結(jié)
第4章 帶多視角注意力的基于詞對驅(qū)動句子對齊
4.1 引言
4.2 多視角注意力的詞對關(guān)聯(lián)網(wǎng)絡(luò)模型
4.2.1 雙向循環(huán)神經(jīng)網(wǎng)絡(luò)
4.2.2 詞對關(guān)聯(lián)網(wǎng)絡(luò)
4.2.3 多視角注意力網(wǎng)絡(luò)
4.2.4 最大池化和多層感知器
4.2.5 模型訓(xùn)練
4.3 實(shí)驗(yàn)結(jié)果與分析
4.3.1 實(shí)驗(yàn)設(shè)置
4.3.2 實(shí)驗(yàn)結(jié)果
4.3.3 實(shí)驗(yàn)分析
4.4 本章小結(jié)
第5章 融入詞典知識的基于詞對驅(qū)動句子對齊
5.1 引言
5.2 融入詞典知識的詞對關(guān)聯(lián)網(wǎng)絡(luò)模型
5.2.1 基于詞典建模的神經(jīng)網(wǎng)絡(luò)模型
5.2.2 混合編碼器
5.2.3 特征編碼器
5.2.4 門控編碼器
5.3 構(gòu)建雙語詞典
5.4 實(shí)驗(yàn)結(jié)果與分析
5.4.1 實(shí)驗(yàn)設(shè)置
5.4.2 實(shí)驗(yàn)結(jié)果
5.4.3 實(shí)驗(yàn)分析
5.5 本章小結(jié)
第6章 總結(jié)與展望
6.1 總結(jié)
6.2 展望
參考文獻(xiàn)
攻讀學(xué)位期間取得的科研成果
攻讀學(xué)位期間參與的科研項(xiàng)目
致謝
【參考文獻(xiàn)】:
期刊論文
[1]基于詞對關(guān)聯(lián)網(wǎng)絡(luò)的句子對齊研究[J]. 丁穎,李軍輝,周國棟. 中文信息學(xué)報. 2019(07)
[2]漢英句子對齊長度計(jì)算方法的研究[J]. 張霞,昝紅英,張恩展. 計(jì)算機(jī)工程與設(shè)計(jì). 2009(18)
[3]基于長度和位置信息的雙語句子對齊方法[J]. 李維剛,劉挺,張宇,李生. 哈爾濱工業(yè)大學(xué)學(xué)報. 2006(05)
[4]漢英雙語庫自動分段對齊研究[J]. 王斌,劉群,張祥. 軟件學(xué)報. 2000(11)
本文編號:3689986
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/3689986.html
最近更新
教材專著