天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 軟件論文 >

實體詞語義信息對中文實體關(guān)系抽取的作用研究

發(fā)布時間:2018-11-10 10:14
【摘要】:為了探索從外部詞典提取的實體詞語義信息在中文實體關(guān)系抽取上的作用,提出了知網(wǎng)語義樹和《同義詞詞林》編碼樹兩種新特征,并連同已有的最短路徑依存樹、知網(wǎng)第一基本義原、《同義詞詞林》編碼、實體大類和實體小類特征一起探究了其對抽取性能的影響。實驗數(shù)據(jù)表明,作為單一特征時,提出的兩種新特征性能雖然不如實體大類和實體小類特征,但是比最短路徑依存樹、知網(wǎng)第一基本義原、《同義詞詞林》編碼好;作為組合特征時,最短路徑依存樹和兩種新特征的組合特征取得了最好的性能。由此可以得出結(jié)論,從非語料中獲取的最短路徑依存樹、知網(wǎng)語義樹和《同義詞詞林》編碼樹特征可以代替從語料中獲取的實體大類和實體小類特征,可以用于下一步開放域的關(guān)系抽取。
[Abstract]:In order to explore the role of the semantic information of entity words extracted from external dictionaries in the extraction of Chinese entity relations, two new features, the semantic tree of knowledge web and the coding tree of synonym forest, are proposed, together with the existing shortest path dependency tree. The first basic semantic source, synonym forest coding, entity large class and entity subclass feature are studied together to study its influence on extraction performance. Experimental data show that, as a single feature, the performance of the proposed two new features is not as good as that of the entity class and the entity subclass, but it is better than the shortest path dependency tree, the first basic semantic element of the network, and the encoding of the synonym forest. As a combination feature, the shortest path dependency tree and the combined features of two new features achieve the best performance. It can be concluded that the features of the shortest path dependency tree, the semantic tree of the known web and the coding tree of the synonym forest obtained from the non-corpus can replace the features of the large and small classes of entities obtained from the corpus. It can be used for the next open domain relational extraction.
【作者單位】: 太原理工大學計算機科學與技術(shù)學院;武漢大學軟件工程國家重點實驗室;
【基金】:武漢大學軟件工程國家重點實驗室開放課題(SKLSE2012-09-30) 山西省自然科學基金資助項目(2013011015-2)
【分類號】:TP391.1

【相似文獻】

相關(guān)期刊論文 前10條

1 鄧擘;鄭彥寧;傅繼彬;;漢語實體關(guān)系模式的自動獲取研究[J];計算機科學;2010年02期

2 牟晉娟;包宏;;中文實體關(guān)系抽取研究[J];計算機工程與設(shè)計;2009年15期

3 朱姍;;基于規(guī)則和本體的實體關(guān)系抽取系統(tǒng)研究[J];情報雜志;2010年S2期

4 車萬翔,劉挺,李生;實體關(guān)系自動抽取[J];中文信息學報;2005年02期

5 朱鴻宇;劉瑰;陳左寧;唐福華;;實體關(guān)系識別中長距離依賴問題的研究[J];小型微型計算機系統(tǒng);2008年02期

6 周利娟;林鴻飛;羅文華;;基于實體關(guān)系的犯罪網(wǎng)絡(luò)識別機制[J];計算機應(yīng)用研究;2011年03期

7 徐健;張智雄;吳振新;;實體關(guān)系抽取的技術(shù)方法綜述[J];現(xiàn)代圖書情報技術(shù);2008年08期

8 李小紅;錢龍華;;基于自舉的弱指導中文實體關(guān)系抽取研究[J];高科技與產(chǎn)業(yè)化;2010年09期

9 董靜;孫樂;馮元勇;黃瑞紅;;中文實體關(guān)系抽取中的特征選擇研究[J];中文信息學報;2007年04期

10 黃晨;錢龍華;周國棟;朱巧明;;基于卷積樹核的無指導中文實體關(guān)系抽取研究[J];中文信息學報;2010年04期

相關(guān)會議論文 前3條

1 車萬翔;劉挺;李生;;實體關(guān)系自動抽取[A];NCIRCS2004第一屆全國信息檢索與內(nèi)容安全學術(shù)會議論文集[C];2004年

2 莊成龍;錢龍華;周國棟;;基于樹核函數(shù)的實體關(guān)系抽取方法研究[A];第四屆全國學生計算語言學研討會會議論文集[C];2008年

3 徐芬;王挺;陳火旺;;基于SVM方法的中文實體關(guān)系抽取[A];內(nèi)容計算的研究與應(yīng)用前沿——第九屆全國計算語言學學術(shù)會議論文集[C];2007年

相關(guān)博士學位論文 前5條

1 陳忱;面向Web的實體關(guān)系查詢與分析關(guān)鍵技術(shù)研究[D];東北大學;2013年

2 郭喜躍;面向開放領(lǐng)域文本的實體關(guān)系抽取[D];華中師范大學;2016年

3 張奇;信息抽取中實體關(guān)系識別研究[D];中國科學技術(shù)大學;2010年

4 張宏濤;面向生物文本的實體關(guān)系自動抽取問題研究[D];清華大學;2012年

5 張素香;信息抽取中關(guān)鍵技術(shù)的研究[D];北京郵電大學;2007年

相關(guān)碩士學位論文 前10條

1 施琦;無監(jiān)督中文實體關(guān)系抽取研究[D];中國地質(zhì)大學(北京);2015年

2 林家欣;基于多源知識的地理選擇題答題方法研究[D];哈爾濱工業(yè)大學;2015年

3 劉紹毓;實體關(guān)系抽取關(guān)鍵技術(shù)研究[D];解放軍信息工程大學;2015年

4 胡春艷;中文開放式實體關(guān)系抽取技術(shù)研究[D];東北大學;2014年

5 程文亮;中文企業(yè)知識圖譜構(gòu)建與分析[D];華東師范大學;2016年

6 徐力;面向Web2.0的二元人物關(guān)系抽取研究[D];華東交通大學;2016年

7 韓海丹;面向智能服務(wù)機器人的家庭環(huán)境關(guān)系知識庫構(gòu)建[D];燕山大學;2016年

8 孔兵;中文文本實體關(guān)系抽取方法研究[D];哈爾濱工業(yè)大學;2016年

9 劉q,

本文編號:2322170


資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/2322170.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶d1709***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com