基于成分共享的英漢小句對齊語料庫標(biāo)注體系研究
發(fā)布時間:2021-03-08 21:07
英漢小句對齊語料庫服務(wù)于英語和漢語小句的語法結(jié)構(gòu)對應(yīng)關(guān)系研究和應(yīng)用,對于語言理論和語言翻譯(包括人的翻譯和機器翻譯)有重要意義。前人的語法理論和相關(guān)語料庫的工作對于小句復(fù)合體和小句的界定缺乏充分研究,在理論上有缺陷,難以支持自然語言處理的應(yīng)用。該文首先為英漢小句對齊語料庫的建設(shè)做理論準(zhǔn)備。從近年提出的漢語小句復(fù)合體的理論出發(fā),該文界定了成分共享的概念,基于話頭共享和引語共享來界定英語的小句和小句復(fù)合體,使小句和小句復(fù)合體具有功能的完整性和單一性。在此基礎(chǔ)上,該文設(shè)計了英漢小句對齊的標(biāo)注體系,包括英語NT小句標(biāo)注和漢語譯文生成及組合。語料庫的標(biāo)注表明,在小句復(fù)合體層面上英漢翻譯涉及到的結(jié)構(gòu)變換,其部件可以限制為英語小句和話頭、話體,無須涉及話頭和話體內(nèi)部的結(jié)構(gòu);谶@些工作的英漢小句對齊語料庫為語言本體研究和英漢語言對比、英漢機器翻譯等應(yīng)用提供了結(jié)構(gòu)化的標(biāo)注樣本。
【文章來源】:中文信息學(xué)報. 2020,34(06)北大核心
【文章頁數(shù)】:9 頁
【部分圖文】:
例4的另一種整句譯文
第1行中主語it是話頭,其謂語did not distinguish fundamentally between the private and the public sector是話體。這個主謂結(jié)構(gòu)合成一個NT小句,也是合規(guī)的小句。第2行是一個定語從句,其先行語是第1行的末尾的名詞短語the private and the public sector,它與這個定語從句是一對話頭和話體,或者說定語從句共享第1個小句中的這個名詞短語用作話頭。這對話頭話體組合成一個NT小句:
例3小句復(fù)合體的話頭共享結(jié)構(gòu)
【參考文獻】:
期刊論文
[1]基于醫(yī)學(xué)領(lǐng)域的漢英子句對齊語料庫檢索系統(tǒng)的設(shè)計與實現(xiàn)[J]. 王全蕊,李艷翠. 河南科技學(xué)院學(xué)報(自然科學(xué)版). 2016(06)
本文編號:3071674
【文章來源】:中文信息學(xué)報. 2020,34(06)北大核心
【文章頁數(shù)】:9 頁
【部分圖文】:
例4的另一種整句譯文
第1行中主語it是話頭,其謂語did not distinguish fundamentally between the private and the public sector是話體。這個主謂結(jié)構(gòu)合成一個NT小句,也是合規(guī)的小句。第2行是一個定語從句,其先行語是第1行的末尾的名詞短語the private and the public sector,它與這個定語從句是一對話頭和話體,或者說定語從句共享第1個小句中的這個名詞短語用作話頭。這對話頭話體組合成一個NT小句:
例3小句復(fù)合體的話頭共享結(jié)構(gòu)
【參考文獻】:
期刊論文
[1]基于醫(yī)學(xué)領(lǐng)域的漢英子句對齊語料庫檢索系統(tǒng)的設(shè)計與實現(xiàn)[J]. 王全蕊,李艷翠. 河南科技學(xué)院學(xué)報(自然科學(xué)版). 2016(06)
本文編號:3071674
本文鏈接:http://www.sikaile.net/waiyulunwen/yingyulunwen/3071674.html
最近更新
教材專著