天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

新聞評論的評價對象抽取研究

發(fā)布時間:2021-09-23 15:15
  新聞評論評價對象抽取是挖掘網(wǎng)民觀點的一種重要技術,該任務旨在對新聞評論文本進行分析,抽取出其中包含的評價對象。新聞評論可以方便的獲取到對應的正文內(nèi)容,新聞正文內(nèi)容和評論具有很高的相關性。基于上述特點,本文充分利用新聞正文內(nèi)容,提出融合新聞正文的評價對象抽取模型。針對現(xiàn)有評價對象抽取模型需要大量訓練樣本而數(shù)據(jù)集樣本較少的問題,本文提出基于外部知識輔助數(shù)據(jù)集擴充的評價對象抽取方法。具體研究工作包含以下內(nèi)容:1.融合正文信息的評價對象抽取。本研究結合新聞評論的特點,首先將新聞正文通過中心命名實體識別獲取候選評價對象,然后利用獲取的候選評價對象構造對應的特征向量,接著將候選評價對象對應的特征向量和評論文本的向量融合輸入循環(huán)神經(jīng)網(wǎng)絡學習到文本和候選評價對象的特征,最后輸入到條件隨機場進行序列標注抽取出評論中的評價對象。實驗結果表明,融合新聞正文信息后抽取效果有顯著提升,表明該方法在融合正文信息后可以更好的抽取新聞評論中的評價對象。2.外部知識輔助數(shù)據(jù)集擴充的評價對象抽取。針對現(xiàn)有深度學習模型需要大量訓練樣本才能充分訓練而數(shù)據(jù)集樣本少的問題。本文提出一種基于外部知識輔助數(shù)據(jù)集擴充的評價對象抽取方法... 

【文章來源】:中國科學院大學(中國科學院大學人工智能學院)北京市

【文章頁數(shù)】:76 頁

【學位級別】:碩士

【部分圖文】:

新聞評論的評價對象抽取研究


圖1.2新聞評論示例??Figure?1.2?Example?of?news?comment??2??

注意力,網(wǎng)絡模型,實體,工具


0?Q?0.1?[:??:eVi?—_1….―….,?……一……ept+i?:??jB±ll?B±3|?gj±ll?&5±l|?;??:El?E?S?feffe?S?3?i??:l?0.3?OS?0?0?0?0.2?0?0?0?11?0?0?0?0?f?0?0?0?0?];??ea{'?-?^?:?’?a?^;??Layer?t?;?1?El?B]?1??Fish?buroer?is?the?best?dish?it?tastes?fresh?:??圖1.4多層注意力網(wǎng)絡模型圖??Figure?1.4?Multilayer?attention?network?model??——如果兩個實體在知識庫中存在某種對應關系,那么就認為所有包含這兩個??實體的句子的實體的關系都是該種關系。作者基于此假設在構建的知識庫的指??導下進行實體關系的抽齲但是這個假設非常的泛化,很多的實體都沒有什么??關系,僅僅是出現(xiàn)在同一個句子中。而且很多的實體之間不止一種關系,可能??有很多種關系,例如奧巴馬和美國的關系,可能是born?in,也就是奧巴馬出生在??美國,可能是isthepresidentof關系,奧巴馬是美國的總統(tǒng);谶@個假設條件下??的關系抽取存在兩個明顯的問題,第一個問題是訓練數(shù)據(jù)集會產(chǎn)生大量的錯誤??的標注,又如兩個實體存在多種關系或者根本就不存在任務關系,這樣作為訓??練數(shù)據(jù)就會對關系抽取器產(chǎn)生影響。第二個問題是在數(shù)據(jù)預處理時,由于自然??語言處理工具帶來的誤差,例如命名實體識別工具、分詞工具和詞性標注工具??等。使用越多的工具進行預處理就會引入越多的誤差,在整個任務的pipeline上?

示意圖,函數(shù),運算符,評價對象


?新聞評論的評價對象抽取研究???--1????”0.8?,??T??j-?-0.4??/?--0.2??-10?-8?-6?-2?丨丨?2?4?6?8?10???|?|??>?—*-* ̄*T"*^?j?fill?II??圖2.1?sigmoid函數(shù)不意圖??Figure?2.1?Diagram?of?sigmoid?function??記憶』-f——k5)?-0?c,??輸出門:??,?-(?)?°,??遺忘門:輸入門:候選記憶t?f??1?1?a?細胞:tanh?:<r??隱藏狀態(tài):?)?f?C'?)?)??H-'?vZ?j??輸入:'??g?I全連接層和激活函數(shù)?(3按元素運算符?i?r復制?連結??圖2.2長短期記憶網(wǎng)絡示意圖??Figure?2.2?Diagram?of?long?short-term?memory?network??12??

【參考文獻】:
期刊論文
[1]使用深度長短時記憶模型對于評價詞和評價對象的聯(lián)合抽取[J]. 沈亞田,黃萱菁,曹均闊.  中文信息學報. 2018(02)
[2]評價對象抽取研究綜述[J]. 蔣盛益,郭林東,王連喜,符斯慧.  自動化學報. 2018(07)
[3]深度學習中漢語字向量和詞向量結合方式探究[J]. 李偉康,李煒,吳云芳.  中文信息學報. 2017(06)
[4]基于CRFs和領域本體的中文微博評價對象抽取研究[J]. 丁晟春,吳婧嬋媛,李霄.  中文信息學報. 2016(04)
[5]基于淺層句法特征的評價對象抽取研究[J]. 徐冰,趙鐵軍,王山雨,鄭德權.  自動化學報. 2011(10)
[6]評價對象抽取及其傾向性分析[J]. 劉鴻宇,趙妍妍,秦兵,劉挺.  中文信息學報. 2010(01)



本文編號:3405939

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3405939.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶e08b7***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com