天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 軟件論文 >

面向科研人員的多數(shù)據(jù)源命名實體消歧方法研究

發(fā)布時間:2021-02-25 22:13
  在網(wǎng)絡信息呈爆炸式增長的今天,通過搜索引擎查詢信息已成為人們信息檢索的主要方式,而實體重名現(xiàn)象的普遍性導致了檢索結(jié)果存在極大歧義性。如何高效地消除歧義,成為了搜索引擎亟待解決的問題,而實體消歧就是解決這一核心問題的關鍵技術。本文結(jié)合多數(shù)據(jù)源,提出了基于多主屬性分類化和結(jié)構(gòu)化語義關系的命名實體消歧算法。該算法面向科研人員信息展開消歧研究,融合其在中國知網(wǎng)、百度百科等多個數(shù)據(jù)源的分散信息,提取實體多主屬性,先后計算實體間的結(jié)構(gòu)化語義關系和分類化語義關系,得到實體間的相似度,并運用聚類算法實現(xiàn)實體消歧。結(jié)構(gòu)化語義關系算法通過構(gòu)建語義關系圖來挖掘?qū)嶓w間的顯式和隱式語義關系,而基于多主屬性的分類化語義關系算法則通過提取實體的多主屬性與非主屬性先后進行計算得到實體間的分類化語義關系;谠撍惴,本文最后實現(xiàn)了一個面向科研人員的多數(shù)據(jù)源命名實體消歧系統(tǒng),該系統(tǒng)接收用戶關于科研人員檢索信息的輸入,將檢索信息與采集到的科研人員實體數(shù)據(jù)集進行消歧計算并返回消歧結(jié)果。實驗表明,將基于多主屬性分類化和結(jié)構(gòu)化語義關系的命名實體消歧算法運用于科研人員實體消歧,極大提高了科研人員信息檢索系統(tǒng)的準確率和召回率。 

【文章來源】:北京林業(yè)大學北京市 211工程院校 教育部直屬院校

【文章頁數(shù)】:59 頁

【學位級別】:碩士

【部分圖文】:

面向科研人員的多數(shù)據(jù)源命名實體消歧方法研究


圖3.2百度學術搜索學者示例??Figure?3.2?The?example?of?Baidu?Academic?search?with?the?researchers'?name??

架構(gòu)圖,系統(tǒng)整體,架構(gòu),消歧


?面向科研人員的多數(shù)據(jù)源命名實體消歧方法研究???5面向科研人員的多數(shù)據(jù)源命名實體消歧系統(tǒng)設計與實現(xiàn)??為了檢驗本文數(shù)據(jù)采集、預處理及改進的人名消歧算法在實際應用的有效性,??本文設計并實現(xiàn)了一個面向科研人員的多數(shù)據(jù)源命名實體消歧系統(tǒng)。該系統(tǒng)將接??收用戶的科研人員信息檢索,然后經(jīng)過數(shù)據(jù)預處理與分詞處理,并應用本文改進的??基于多主屬性分類化和結(jié)構(gòu)化語義關系的命名實體消歧算法與已經(jīng)采集下來的科??研人員實體信息進行相似度計算,最終將消歧結(jié)果以網(wǎng)頁的形式展示給用戶。??5.1系統(tǒng)框架??系統(tǒng)的整體架構(gòu)由數(shù)據(jù)數(shù)據(jù)源層、數(shù)據(jù)采集層、DB數(shù)據(jù)庫層、數(shù)據(jù)分析層及??數(shù)據(jù)展示層五個部分構(gòu)成,系統(tǒng)整體架構(gòu)圖如圖5.1所示。??

模型圖,索引名,姓名,科研人員


數(shù)據(jù)庫間的概念結(jié)構(gòu)設計能充分反映事物間的潛在聯(lián)系,具有易于理解、易于??更改、易于向其他數(shù)據(jù)模型轉(zhuǎn)換的優(yōu)點。概念結(jié)構(gòu)設計中描述概念模型的工具則是??E-R模型,圖5.3給出了本文的E-R模型圖。??人號八..人j'.'?發(fā)明??爽\?d??養(yǎng)上一哎??專利??(零? ̄ ̄0£)??(5^\?@?T??圖5.3?E-R模型??Figure?5.3?E-R?model??5.3.2基本信息表??基本信息表用于存儲科研人員索引名單中的學者的個人基本信息,包括姓名、??所屬機構(gòu)、性別、出生年月、研究領域等。具體如表5.1所示。??31??

【參考文獻】:
期刊論文
[1]Named Entity Disambiguation Based on Classified and Structural Semantic Relatedness[J]. CHAI Mingke,LI Dongmei,ZHUANG Tingting,YANG Shuyi.  Chinese Journal of Electronics. 2018(06)
[2]人名消歧研究綜述[J]. 陽怡林,陳剛,周杰,李弼程.  信息工程大學學報. 2016(04)
[3]基于圖的中文集成實體鏈接算法[J]. 劉嶠,鐘云,李楊,劉瑤,秦志光.  計算機研究與發(fā)展. 2016(02)
[4]基于層次聚類的跨文本中文人名消歧研究[J]. 張菲菲,李宗海,周曉輝,李曉戈.  計算機工程與應用. 2014(06)
[5]基于人物相關社區(qū)的重名消解研究[J]. 李琦,馬軍.  山東大學學報(理學版). 2012(03)
[6]開放式文本信息抽取[J]. 趙軍,劉康,周光有,蔡黎.  中文信息學報. 2011(06)
[7]基于改進的正向最大匹配中文分詞算法研究[J]. 王惠仙,龍華.  貴州大學學報(自然科學版). 2011(05)
[8]基于社會網(wǎng)絡的人名檢索結(jié)果重名消解[J]. 郎君,秦兵,宋巍,劉龍,劉挺,李生.  計算機學報. 2009(07)
[9]命名實體識別、排歧和跨語言關聯(lián)[J]. 趙軍.  中文信息學報. 2009(02)
[10]數(shù)據(jù)挖掘中的數(shù)據(jù)預處理方法[J]. 彭高輝,王志良.  華北水利水電學院學報. 2008(06)

碩士論文
[1]面向科研人員的多源異構(gòu)信息消歧系統(tǒng)的研究與實現(xiàn)[D]. 池翔.北京郵電大學 2018



本文編號:3051657

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/3051657.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶6487a***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com