基于雙模型投票的人物關(guān)系抽取研究
本文關(guān)鍵詞:基于雙模型投票的人物關(guān)系抽取研究 出處:《計(jì)算機(jī)應(yīng)用研究》2017年03期 論文類型:期刊論文
更多相關(guān)文章: 關(guān)系抽取 最大熵模型 支持向量機(jī) 投票
【摘要】:網(wǎng)頁(yè)標(biāo)題具有簡(jiǎn)潔、信息量大的特點(diǎn),而且其中蘊(yùn)涵了豐富、動(dòng)態(tài)、復(fù)雜的人物關(guān)系。主要針對(duì)網(wǎng)頁(yè)標(biāo)題文本中的人物關(guān)系抽取進(jìn)行研究,提出一種雙模型投票的機(jī)器學(xué)習(xí)方法。針對(duì)19種關(guān)系類型分別進(jìn)行特征抽取和選擇;使用兩種統(tǒng)計(jì)模型——最大熵和支持向量機(jī)分別進(jìn)行模型訓(xùn)練;對(duì)于每種關(guān)系類型利用模型投票的方法,即選擇訓(xùn)練集中得到性能較好的模型作為該類的模型,最后使用訓(xùn)練好的模型對(duì)測(cè)試集進(jìn)行測(cè)試。結(jié)果顯示,該方法對(duì)于人物關(guān)系抽取任務(wù)取得了總體F1值為67.64%的性能。
[Abstract]:The title of a web page has the characteristics of simplicity and large amount of information, and it contains rich, dynamic and complex character relationships. This paper mainly focuses on the extraction of the relationship between people in the text of the title of the page. A two-model voting machine learning method is proposed, in which the feature extraction and selection are carried out for 19 relation types. Two statistical models, maximum entropy and support vector machine, are used for model training. For each relationship type, the model voting method is used, that is, the model with better performance is selected as the model of the training set. Finally, the trained model is used to test the test set. The result shows. This method achieves a total F1 value of 67.64% for the human relationship extraction task.
【作者單位】: 內(nèi)蒙古師范大學(xué)計(jì)算機(jī)與信息工程學(xué)院;
【基金】:國(guó)家自然科學(xué)基金資助項(xiàng)目(61562068) 內(nèi)蒙古師范大學(xué)“十百千”人才培養(yǎng)工程資助項(xiàng)目;內(nèi)蒙古師范大學(xué)引進(jìn)人才科研啟動(dòng)經(jīng)費(fèi)資助項(xiàng)目(2014YJRC036);內(nèi)蒙古師范大學(xué)校級(jí)基金資助項(xiàng)目(2015YBXM002) 內(nèi)蒙古民委蒙古文信息化專項(xiàng)扶持子項(xiàng)目(MW-2014-MGYWXXH-01) 內(nèi)蒙古自然科學(xué)基金資助項(xiàng)目(2013MS0912,2013MS0913,2014MS0617,2015MS0629) 內(nèi)蒙古自治區(qū)高等學(xué)?茖W(xué)研究資助項(xiàng)目(NJZY028)
【分類號(hào)】:TP391.1;TP181
【正文快照】: 0引言伴隨著互聯(lián)網(wǎng)大數(shù)據(jù)的日益增長(zhǎng),如何從大數(shù)據(jù)中挖掘人們需要的有用信息成為科研人員關(guān)注的主要問(wèn)題。而分散在海量數(shù)據(jù)中的人物與人物之間的關(guān)系(也稱為實(shí)體關(guān)系)是其中一類非常有用的信息,它在機(jī)器翻譯、信息檢索、自動(dòng)問(wèn)答等領(lǐng)域具有重要的價(jià)值。實(shí)體關(guān)系抽取是從自由
【相似文獻(xiàn)】
相關(guān)期刊論文 前3條
1 傅宛菊;陳木蘭;;中國(guó)新魔幻電影的類型化初探[J];東南傳播;2014年08期
2 丁海峰;;論電影《海洋天堂》中細(xì)節(jié)的運(yùn)用[J];西部廣播電視;2013年05期
3 ;[J];;年期
相關(guān)會(huì)議論文 前3條
1 白勁鵬;;可怕的對(duì)稱——論《了不起的蓋茨比》中的主次人物關(guān)系[A];外語(yǔ)語(yǔ)言教學(xué)研究——黑龍江省外國(guó)語(yǔ)學(xué)會(huì)第十一次學(xué)術(shù)年會(huì)論文集[C];1997年
2 黃素影;;《天倫》創(chuàng)作小結(jié)[A];我的角色與我們的劇團(tuán)——第六屆電影表演藝術(shù)學(xué)會(huì)獎(jiǎng)文集[C];1997年
3 吳士余;;重視人物關(guān)系的典型化[A];《毛澤東文藝思想研究》第三輯暨全國(guó)毛澤東文藝思想研究會(huì)第三次年會(huì)論文集[C];1983年
相關(guān)重要報(bào)紙文章 前6條
1 本報(bào)記者 張悅;音樂(lè)劇《蝶》推出修排版[N];中國(guó)藝術(shù)報(bào);2008年
2 記者 金朝力;網(wǎng)絡(luò)視頻業(yè)首推人臉識(shí)別功能[N];北京商報(bào);2010年
3 本文實(shí)習(xí)記者 張柳青;紀(jì)念汶川地震一周年[N];中國(guó)電影報(bào);2009年
4 許柏林;小成本拍出大境界[N];人民日?qǐng)?bào);2012年
5 張克丹 綜合整理;青春·理想·奮斗·奉獻(xiàn)[N];中國(guó)電影報(bào);2009年
6 上海戲劇學(xué)院副教授 石俊;問(wèn)號(hào)的力量[N];文匯報(bào);2012年
相關(guān)碩士學(xué)位論文 前10條
1 潘云;基于中文在線資源的人物關(guān)系抽取研究[D];華東師范大學(xué);2015年
2 史軍;初析舞劇《奶奶的信》的立意與結(jié)構(gòu)[D];北京舞蹈學(xué)院;2015年
3 唐丞博;談《追夢(mèng)時(shí)刻》中人物關(guān)系的發(fā)展和變化[D];云南藝術(shù)學(xué)院;2016年
4 劉博佳;基于維基百科的人物關(guān)系抽取研究[D];北京交通大學(xué);2016年
5 陳靜;關(guān)于《哥兒》的中譯本中粗話的翻譯研究[D];北京外國(guó)語(yǔ)大學(xué);2016年
6 馮元為;基于知識(shí)圖譜構(gòu)建人物關(guān)系的設(shè)計(jì)與實(shí)現(xiàn)[D];重慶大學(xué);2016年
7 徐珊;孫昌涉初期小說(shuō)的人物關(guān)系和作家意識(shí)研究[D];山東大學(xué);2009年
8 顧靜航;基于信息抽取的人物關(guān)系網(wǎng)絡(luò)構(gòu)建研究[D];蘇州大學(xué);2014年
9 許婷;基于話單挖掘的可視化人物關(guān)系分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];哈爾濱工業(yè)大學(xué);2014年
10 范少帥;基于特征向量的人物關(guān)系抽取方法研究[D];華東交通大學(xué);2015年
,本文編號(hào):1392967
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/1392967.html