天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 搜索引擎論文 >

用于雙語術(shù)語抽取的專業(yè)領域中英文可比語料庫構(gòu)建

發(fā)布時間:2018-02-17 04:54

  本文關(guān)鍵詞: 可比語料庫 語料庫構(gòu)建 雙語術(shù)語抽取 出處:《現(xiàn)代圖書情報技術(shù)》2012年02期  論文類型:期刊論文


【摘要】:面向雙語術(shù)語抽取這一應用目標,提出專業(yè)領域可比語料庫的構(gòu)建方案并進行實驗論證。針對給定的主題領域分別進行中英文專業(yè)語料的采集,從中分別獲取中英文關(guān)鍵詞,根據(jù)詞語共現(xiàn)統(tǒng)計獲取該主題領域的其他相關(guān)關(guān)鍵詞;以這些關(guān)鍵詞作為查詢?nèi)肟?通過學術(shù)搜索引擎從網(wǎng)絡獲取候選可比語料;對可比語料進行定量評估,以剔除不符合要求的語料,最終得到特定主題領域的可比語料庫。
[Abstract]:For the purpose of bilingual terminology extraction, this paper puts forward the construction scheme of comparable corpus of professional domain and carries on the experimental demonstration, and carries on the collection of the Chinese and English professional corpus for the given subject field, and obtains the Chinese and English key words separately from the given subject field. According to cooccurrence statistics, other relevant keywords in the subject area are obtained; those keywords are used as query entry to obtain candidate comparable corpus from the network through academic search engine; the comparative corpus is evaluated quantitatively. Finally, a comparable corpus of a specific subject area can be obtained by eliminating the nonconforming data.
【作者單位】: 南昌大學圖書館;南京理工大學信息管理系;
【基金】:國家自然科學基金項目“基于可比語料的多語言文本聚類研究”(項目編號:70903032) 南京理工大學自主科研專項計劃項目“多語言標簽聚類研究”(項目編號:2011ZDJH15)的研究成果之一
【分類號】:TP391.1

【參考文獻】

相關(guān)期刊論文 前2條

1 孫廣范;宋金平;袁琦;肖健;單玉秋;;中英可比語料庫中翻譯等價對抽取方法研究[J];計算機工程與應用;2007年32期

2 祝清松;王惠臨;;中英文句法分析系統(tǒng)及驗證平臺的設計與實現(xiàn)[J];現(xiàn)代圖書情報技術(shù);2010年02期

【共引文獻】

相關(guān)期刊論文 前2條

1 章成志;王惠臨;;多語言文本聚類研究綜述[J];現(xiàn)代圖書情報技術(shù);2009年06期

2 康小麗;章成志;王惠臨;;基于可比語料庫的雙語術(shù)語抽取研究述評[J];現(xiàn)代圖書情報技術(shù);2009年10期

相關(guān)碩士學位論文 前2條

1 房璐;英漢可比較語料庫的構(gòu)建與應用研究[D];蘇州大學;2011年

2 劉颯;專業(yè)領域可比語料的構(gòu)建與評價研究[D];南京理工大學;2012年

【二級參考文獻】

相關(guān)期刊論文 前2條

1 陳道達;曹冬林;李紹滋;;基于JGraph的變電站綜合自動化圖形組態(tài)系統(tǒng)[J];計算機工程;2009年07期

2 劉海濤;趙懌怡;;基于樹庫的漢語依存句法分析[J];模式識別與人工智能;2009年01期

【相似文獻】

相關(guān)期刊論文 前10條

1 馮冠軍;禹龍;田生偉;;基于CRFs自動構(gòu)建維吾爾語情感詞語料庫[J];現(xiàn)代圖書情報技術(shù);2011年03期

2 孫廣范;宋金平;袁琦;肖健;單玉秋;;中英可比語料庫中翻譯等價對抽取方法研究[J];計算機工程與應用;2007年32期

3 韓先培;趙軍;;基于Wikipedia的語義元數(shù)據(jù)生成[J];中文信息學報;2009年02期

4 章成志;王惠臨;;面向數(shù)字圖書館應用的多語言領域本體學習研究[J];圖書情報工作;2011年02期

5 張秀梅;;論跨語言信息檢索[J];情報資料工作;2006年02期

6 ;[J];;年期

7 ;[J];;年期

8 ;[J];;年期

9 ;[J];;年期

10 ;[J];;年期

相關(guān)會議論文 前1條

1 韓先培;趙軍;;基于Wikipedia的語義元數(shù)據(jù)生成[A];第四屆全國信息檢索與內(nèi)容安全學術(shù)會議論文集(上)[C];2008年

相關(guān)碩士學位論文 前2條

1 林聲;可比語料中命名實體翻譯等價對抽取方法研究[D];大連理工大學;2009年

2 高菲;漢語翻譯小說語言整齊化特征[D];西南交通大學;2011年

,

本文編號:1517263

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/1517263.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶45176***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com