基于海量文本的企業(yè)行為識別及行為關系發(fā)現
發(fā)布時間:2022-01-04 03:17
實體在自然語言處理中表示語言描述的對象,例如商業(yè)新聞中的企業(yè)和旅行游記中的景點等。隱藏在文本中的實體關系具有極大的價值,例如企業(yè)關系可以輔助決策,景點關系可以幫助推薦等。因此從文本中發(fā)現實體關系成為了一項極具管理意義的工作。在傳統的實體關系抽取研究中,研究者們主要是依據實體之間的共現關系進行。這樣抽取出的關系是異質的,即抽取出的關系不一定是同一類關系,然而更緊密的同質關系更能體現實體間的聯系。假設我們建立企業(yè)的關系是因為他們的某種具體行為,而不是僅僅因為他們出現在同一篇新聞稿中。那么在構建出的網絡中,實體的關系將更加緊密,從而使得后續(xù)分類或預測工作的準確度更高。抽取同質關系主要面臨三個挑戰(zhàn):首先,同質關系在網絡文本中的存在很稀疏。其次,文檔包含的實體未知。最后,語料包含的關系集合和文檔對應的標簽也未知。針對以上挑戰(zhàn),本文著手在互聯網的海量文本中進行企業(yè)關系的預測。我們需要分別解決實體識別和行為抽取兩個問題,并以此來對實體的同質關系進行建模。本文關注的第一個問題是實體名識別——需要去探究文檔中字(詞)元素組成實體名的可能性。本文將該問題轉化為一個復合詞識別問題。本文提出了一種度量候選樣本...
【文章來源】:電子科技大學四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁數】:93 頁
【學位級別】:碩士
【部分圖文】:
馬蜂窩網站的游記部分截圖
蝦米音樂歌曲“憨人”評論展示
微博信息舉例
本文編號:3567548
【文章來源】:電子科技大學四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁數】:93 頁
【學位級別】:碩士
【部分圖文】:
馬蜂窩網站的游記部分截圖
蝦米音樂歌曲“憨人”評論展示
微博信息舉例
本文編號:3567548
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3567548.html
最近更新
教材專著