英漢雙語術(shù)語自動抽取工具效率對比實驗報告
發(fā)布時間:2023-11-11 13:52
高效的計算機輔助翻譯在很大程度上取決于高質(zhì)量的翻譯記憶庫和術(shù)語庫。雙語術(shù)語自動抽取是構(gòu)建大規(guī)模雙語術(shù)語庫的關(guān)鍵步驟。探討雙語術(shù)語的自動抽取方法、完善現(xiàn)有雙語術(shù)語自動抽取工具成為計算機輔助翻譯研究的重要內(nèi)容。本研究以“海上安全英漢平行語料庫”為實驗語料,通過雙語術(shù)語抽取實驗的方法,對目前計算機輔助翻譯領(lǐng)域常用的三種英漢雙語術(shù)語抽取工具SDL Multi Term Extract 2019、Sketch Engine One Click Terms和Synchro Term抽取結(jié)果的準確率、召回率和F值進行對比分析。在此基礎(chǔ)上,進一步探討了所抽取術(shù)語的翻譯方向、術(shù)語的長度以及術(shù)語在語料庫中出現(xiàn)的頻率三種因素對每一種工具抽取效率的影響。實驗結(jié)果表明,三種工具抽取英-漢雙語術(shù)語的綜合效率高于漢-英雙語術(shù)語。就具體的工具而言,Synchro Term的綜合抽取效率最高,SDL Multi Term Extract2019次之,Sketch Engine One Click Terms最低。抽取不同長度和不同頻率的雙語術(shù)語時,Synchro Term整體抽取效果最好,SDL Multi Term ...
【文章頁數(shù)】:101 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 實驗任務(wù)介紹
1.1 實驗背景及意義
1.2 實驗任務(wù)介紹
第2章 術(shù)語及術(shù)語抽取研究綜述
2.1 術(shù)語及特征
2.1.1 術(shù)語的定義
2.1.2 術(shù)語的基本屬性
2.1.3 術(shù)語的結(jié)構(gòu)特征
2.2 雙語術(shù)語自動抽取方法
2.2.1 單語術(shù)語抽取
2.2.2 雙語術(shù)語對齊
2.3 術(shù)語抽取工具效率對比研究現(xiàn)狀
第3章 實驗設(shè)計
3.1 實驗語料
3.2 實驗工具
3.2.1 SDL MultiTerm Extract2019
3.2.2 Sketch Engine OneClick Terms
3.2.3 SynchroTerm
3.3 實驗步驟
3.3.1 構(gòu)建術(shù)語標(biāo)注語料庫及雙語黃金標(biāo)準術(shù)語表
3.3.2 基于三種雙語術(shù)語自動抽取
3.3.3 實驗數(shù)據(jù)導(dǎo)出
3.4 實驗結(jié)果統(tǒng)計
3.4.1 術(shù)語抽取效率評價指標(biāo)
3.4.2 實驗數(shù)據(jù)統(tǒng)計
第4章 實驗結(jié)果與分析
4.1 雙語術(shù)語自動抽取總體效率對比
4.1.1 漢英雙語術(shù)語自動抽取總體效率對比
4.1.2 英漢雙語術(shù)語自動抽取總體效率對比
4.2 不同長度雙語術(shù)語自動抽取效率對比
4.2.1 漢英不同長度雙語術(shù)語自動抽取效率
4.2.2 英漢不同長度雙語術(shù)語自動抽取效率
4.3 不同頻率雙語術(shù)語自動抽取效率對比
4.3.1 不同頻率的漢英雙語術(shù)語抽取效率對比
4.3.2 不同頻率的英漢雙語術(shù)語抽取效率對比
4.4 自動抽取中雙語術(shù)語遺漏情況分析
4.4.1 遺漏術(shù)語統(tǒng)計
4.4.2 遺漏原因分析
第5章 實驗總結(jié)及反思
參考文獻
附錄1 SDL MultiTerm Extract2019 雙語術(shù)語抽取情況
附錄2 SynchroTerm雙語術(shù)語抽取情況
附錄3 Sketch Engine OneClick Terms雙語術(shù)語抽取情況
致謝
本文編號:3862667
【文章頁數(shù)】:101 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 實驗任務(wù)介紹
1.1 實驗背景及意義
1.2 實驗任務(wù)介紹
第2章 術(shù)語及術(shù)語抽取研究綜述
2.1 術(shù)語及特征
2.1.1 術(shù)語的定義
2.1.2 術(shù)語的基本屬性
2.1.3 術(shù)語的結(jié)構(gòu)特征
2.2 雙語術(shù)語自動抽取方法
2.2.1 單語術(shù)語抽取
2.2.2 雙語術(shù)語對齊
2.3 術(shù)語抽取工具效率對比研究現(xiàn)狀
第3章 實驗設(shè)計
3.1 實驗語料
3.2 實驗工具
3.2.1 SDL MultiTerm Extract2019
3.2.2 Sketch Engine OneClick Terms
3.2.3 SynchroTerm
3.3 實驗步驟
3.3.1 構(gòu)建術(shù)語標(biāo)注語料庫及雙語黃金標(biāo)準術(shù)語表
3.3.2 基于三種雙語術(shù)語自動抽取
3.3.3 實驗數(shù)據(jù)導(dǎo)出
3.4 實驗結(jié)果統(tǒng)計
3.4.1 術(shù)語抽取效率評價指標(biāo)
3.4.2 實驗數(shù)據(jù)統(tǒng)計
第4章 實驗結(jié)果與分析
4.1 雙語術(shù)語自動抽取總體效率對比
4.1.1 漢英雙語術(shù)語自動抽取總體效率對比
4.1.2 英漢雙語術(shù)語自動抽取總體效率對比
4.2 不同長度雙語術(shù)語自動抽取效率對比
4.2.1 漢英不同長度雙語術(shù)語自動抽取效率
4.2.2 英漢不同長度雙語術(shù)語自動抽取效率
4.3 不同頻率雙語術(shù)語自動抽取效率對比
4.3.1 不同頻率的漢英雙語術(shù)語抽取效率對比
4.3.2 不同頻率的英漢雙語術(shù)語抽取效率對比
4.4 自動抽取中雙語術(shù)語遺漏情況分析
4.4.1 遺漏術(shù)語統(tǒng)計
4.4.2 遺漏原因分析
第5章 實驗總結(jié)及反思
參考文獻
附錄1 SDL MultiTerm Extract2019 雙語術(shù)語抽取情況
附錄2 SynchroTerm雙語術(shù)語抽取情況
附錄3 Sketch Engine OneClick Terms雙語術(shù)語抽取情況
致謝
本文編號:3862667
本文鏈接:http://www.sikaile.net/waiyulunwen/yingyulunwen/3862667.html
最近更新
教材專著