CRFs融合語義信息的英語功能名詞短語識別
本文關(guān)鍵詞:CRFs融合語義信息的英語功能名詞短語識別
更多相關(guān)文章: 功能名詞短語 名詞短語識別 條件隨機域模型 語義信息
【摘要】:名詞短語識別在句法分析中有著重要的作用,而英漢機器翻譯的瓶頸之一就是名詞短語的歧義消解問題。研究英語功能名詞短語的自動識別,則將名詞短語的結(jié)構(gòu)消歧問題轉(zhuǎn)化成名詞短語的識別問題。基于名詞短語在小句中的語法功能來確定名詞短語的邊界,選擇商務(wù)領(lǐng)域語料,采用了細化詞性標注集和條件隨機域模型結(jié)合語義信息的方法,識別了名詞短語的邊界和句法功能。在預(yù)處理基于賓州樹庫細化了詞性標注集,條件隨機域模型中加入語義特征主要用來識別狀語類的名詞短語。實驗結(jié)果表明,結(jié)合金標準詞性實驗的F值達到了89.04%,改進詞性標注集有助于提高名詞短語的識別,比使用賓州樹庫標注集提高了2.21%。將功能名詞短語識別信息應(yīng)用到NiuTrans統(tǒng)計機器翻譯系統(tǒng),英漢翻譯質(zhì)量略有提高。
【作者單位】: 大連理工大學外國語學院;大連理工大學計算機科學與技術(shù)學院;
【關(guān)鍵詞】: 功能名詞短語 名詞短語識別 條件隨機域模型 語義信息
【基金】:教育部人文社會科學研究規(guī)劃基金(13YJAZH062)
【分類號】:TP391.1
【正文快照】: 1引言名詞短語識別在句法分析中有著重要的作用,名詞短語的識別可以降低句法分析的復(fù)雜性,提高機器翻譯的性能和效率。英漢機器翻譯的瓶頸之一就是名詞短語的歧義消解問題,真實文本中存在的大量名詞短語結(jié)構(gòu)歧義是導(dǎo)致整句英漢機器翻譯正確率較低的主要因素之一。人工翻譯中看
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 王萌;黃居仁;俞士汶;李斌;;基于動詞的漢語復(fù)合名詞短語釋義研究[J];中文信息學報;2010年06期
2 劉飛;周俏麗;張桂平;;基于輔助短語標記的名詞短語識別[J];沈陽航空航天大學學報;2014年01期
3 馬建軍;黃德根;;英語功能名詞短語研究及其應(yīng)用[J];大連理工大學學報;2012年01期
4 韋麗紅;;中文指代消解名詞短語的識別[J];計算機光盤軟件與應(yīng)用;2013年21期
5 劉冬明,趙軍,楊爾弘;漢英雙語語料庫中名詞短語的自動對應(yīng)[J];中文信息學報;2003年05期
6 諾明花;劉匯丹;馬龍龍;吳健;丁治明;;基于中心語塊擴展的漢藏基本名詞短語對的識別[J];中文信息學報;2013年04期
7 趙軍,黃昌寧;基于轉(zhuǎn)換的漢語基本名詞短語識別模型[J];中文信息學報;1999年02期
8 錢小飛;;最長名詞短語識別研究[J];現(xiàn)代語文(語言研究版);2009年07期
9 安帥飛;畢玉德;;韓國語名詞短語結(jié)構(gòu)特征分析及自動提取[J];中文信息學報;2013年05期
10 梁穎紅,趙鐵軍,姚建民,于浩,徐冰;基于混合策略的英語基本名詞短語識別——邊界統(tǒng)計和詞性串規(guī)則校正相結(jié)合的策略[J];計算機工程與應(yīng)用;2004年35期
中國重要會議論文全文數(shù)據(jù)庫 前10條
1 馬艷軍;劉穎;;漢英準等價名詞短語[A];第二屆全國信息檢索與內(nèi)容安全學術(shù)會議(NCIRCS-2005)論文集[C];2005年
2 梁穎紅;趙鐵軍;翟舒;;規(guī)則和邊界統(tǒng)計相結(jié)合的英語基本名詞短語識別[A];語言計算與基于內(nèi)容的文本處理——全國第七屆計算語言學聯(lián)合學術(shù)會議論文集[C];2003年
3 郎君;劉挺;秦兵;;基于決策樹的中文名詞短語指代消解[A];第二屆全國學生計算語言學研討會論文集[C];2004年
4 錢小飛;陳小荷;;含“的”字偏正結(jié)構(gòu)的最長名詞短語的自動識別[A];內(nèi)容計算的研究與應(yīng)用前沿——第九屆全國計算語言學學術(shù)會議論文集[C];2007年
5 萬菁;姬東鴻;任函;馮文賀;;漢語復(fù)合名詞短語特征結(jié)構(gòu)的標注研究[A];中國計算語言學研究前沿進展(2009-2011)[C];2011年
6 代翠;周俏麗;蔡東風;;統(tǒng)計和規(guī)則相結(jié)合的漢語最長名詞短語自動識別[A];第四屆全國學生計算語言學研討會會議論文集[C];2008年
7 張衛(wèi)國;梁社會;;名詞短語:槽類型與定語類型和中心詞語義類型對應(yīng)關(guān)系[A];全國第八屆計算語言學聯(lián)合學術(shù)會議(JSCL-2005)論文集[C];2005年
8 胡鳳國;傅愛平;;漢語粘合式名詞短語語義結(jié)構(gòu)信息數(shù)據(jù)庫[A];語言計算與基于內(nèi)容的文本處理——全國第七屆計算語言學聯(lián)合學術(shù)會議論文集[C];2003年
9 牟小峰;荀恩東;;基于規(guī)則的名詞短語預(yù)調(diào)序[A];第五屆全國青年計算語言學研討會論文集[C];2010年
10 周強;;漢語部分分析研究[A];語言計算與基于內(nèi)容的文本處理——全國第七屆計算語言學聯(lián)合學術(shù)會議論文集[C];2003年
中國博士學位論文全文數(shù)據(jù)庫 前4條
1 李業(yè)剛;雙語最大名詞短語分析及應(yīng)用研究[D];北京理工大學;2015年
2 王廣成;漢語無定名詞短語的語義特征:指稱和量化[D];北京語言大學;2007年
3 馬建軍;面向機器翻譯的英語功能名詞短語識別研究[D];大連理工大學;2012年
4 楊春雷;HPSG理論中“自己”和量化名詞短語的語用解釋的約束條件體系[D];上海外國語大學;2008年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 孔露;中文名詞短語識別研究[D];合肥工業(yè)大學;2015年
2 馮遠;非英語專業(yè)大學生英語議論文寫作中名詞短語使用的錯誤研究[D];太原理工大學;2016年
3 康佳;英語名詞短語人稱指向句法語義研究[D];延邊大學;2016年
4 張汝瑩;系統(tǒng)功能語法視角下基于語料庫的現(xiàn)代漢語長名詞短語研究[D];北京外國語大學;2016年
5 韓悅;關(guān)于領(lǐng)屬性名詞短語分裂移位的初探[D];東北師范大學;2011年
6 韓秋霞;關(guān)于英漢兩種語言中名詞短語語跡的研究[D];鄭州大學;2006年
7 邱強;新聞?wù)Z料中名詞短語識別的研究[D];北京郵電大學;2011年
8 顧蕓;名詞短語移位的句法分析[D];南京師范大學;2006年
9 張芳芳;英語句首名詞短語的主題性[D];安徽大學;2006年
10 熊建國;對英漢名詞短語的統(tǒng)一解釋[D];中國人民解放軍外國語學院;2003年
,本文編號:988744
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/988744.html