細粒度文本情感分析問題研究
發(fā)布時間:2021-08-28 09:43
隨著在線社交網絡的興起,大量的用戶在互聯(lián)網上發(fā)表文字表達自己的情感,其中既包含對生活、事件的情緒抒發(fā),又包含對產品各個方面的使用體驗和評價。這些情感表達為文本情感分析研究提供了數(shù)據(jù)基礎。文本情感分析研究人們在文本中表達的情感、態(tài)度、觀點、情緒。細粒度情感分析是其中一個細分領域,研究細粒度的情感。細粒度情感分析在任務定義上、數(shù)據(jù)準備上、方法有效性上,依然面臨著很多困難和挑戰(zhàn)。首先,針對細粒度情感極性的文本情緒分類研究,可用于抽取文本中的情緒,相關研究在輿情監(jiān)控中有較大的應用價值。此前的情緒分類研究假設了文本中只有一種情緒,本文發(fā)現(xiàn)了社交網絡文本中包含多種情緒的現(xiàn)象。如何識別文本包含的所有情緒種類,尤其針對短文本的場景,是具有挑戰(zhàn)的。其次,如何將多種情感和方面對應起來,此為方面級情感分析問題,這是針對細粒度情感對象的研究,它可進一步分為兩類:針對方面詞和針對方面類別的情感分析。如何設計統(tǒng)一的方法,同時解決兩種方面級情感分析問題具有挑戰(zhàn)性。此外,方面級情感分析研究假設了文本中僅包含一種實體,然而社交網絡中,存在對多個實體、多個方面表達出多種情感的現(xiàn)象,如何有效建模、如何設計方法解決該問題也存...
【文章來源】:南京大學江蘇省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:129 頁
【學位級別】:博士
【部分圖文】:
圖1.1:情感分析常見研宄問題??
圖1.3:論文主要工作與組織結構關系圖??期記憶網絡建模上下文表示,利用多輪更新優(yōu)化實體和方面表示,并最終預測??情感。實驗表明該方法的效果顯著優(yōu)于基線方法。進一步研宄表明,本文的方??法在訓練數(shù)據(jù)匱乏的(實體,方面)組合上表現(xiàn)出出色的結果,意味著實際應??用中,數(shù)據(jù)標注工作可以大幅簡化。??第六章進一步研宂實體方面級情感分析。相關研宄表明,多種端到端的深??度學習模型在復雜文本上效果表現(xiàn)均不理想。本文針對這一挑戰(zhàn),提出把依??存句法分析技術和端到端的深度學習相結合,構建了?DT-CEA算法。DT-CEA??算法的主要思想是引入了基于依存樹的距離,使得基于位置的注意力層可以??有效解決長插入語、長定語造成的注意力分配偏差;同時,借鑒了依存橋的思??想,構建了依存門,控制依存信息的保留程度,通過對依存連接關系、依存方??向、依存類型的建模,修改了?LSTM算法中的隱藏層節(jié)點計算機制。實驗表明,??DT-CEA將依存句法信息融入模型,可以有效地提升效果。尤其是在復雜文本??上和長文本上,DT-CEA的優(yōu)勢格外明顯。??
Ut?=?WhyK?+?by?(2.15)??其中丨V和b是參數(shù),//是隱藏層的計算函數(shù)。圖2.3是循環(huán)神經網絡結構示意??圖。??循環(huán)神經網絡存在梯度消失和梯度爆炸問題,研究者們設計了很多變體,??例如門控循環(huán)單元(GRU)?[89]、長短期記憶網絡(LSTM)丨90]等,以及他們??的多層、雙向變體。??2.2.2門控循環(huán)單元??門控循環(huán)單兀(Gated?Recurrent?Unit,GRU)是循環(huán)神經網絡的一種變體,??21??
【參考文獻】:
期刊論文
[1]基于表情符注意力機制的微博情感分析模型[J]. 譚皓,鄧樹文,錢濤,姬東鴻. 計算機應用研究. 2019(09)
[2]融合Bi-LSTM和位置關系的對象級情感分析[J]. 鮑豪,李少童. 信息系統(tǒng)工程. 2018(03)
[3]一種用于基于方面情感分析的深度分層網絡模型[J]. 劉全,梁斌,徐進,周倩. 計算機學報. 2018(12)
[4]面向變異短文本的快速聚類算法[J]. 黃永光,劉挺,車萬翔,胡曉光. 中文信息學報. 2007(02)
本文編號:3368278
【文章來源】:南京大學江蘇省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:129 頁
【學位級別】:博士
【部分圖文】:
圖1.1:情感分析常見研宄問題??
圖1.3:論文主要工作與組織結構關系圖??期記憶網絡建模上下文表示,利用多輪更新優(yōu)化實體和方面表示,并最終預測??情感。實驗表明該方法的效果顯著優(yōu)于基線方法。進一步研宄表明,本文的方??法在訓練數(shù)據(jù)匱乏的(實體,方面)組合上表現(xiàn)出出色的結果,意味著實際應??用中,數(shù)據(jù)標注工作可以大幅簡化。??第六章進一步研宂實體方面級情感分析。相關研宄表明,多種端到端的深??度學習模型在復雜文本上效果表現(xiàn)均不理想。本文針對這一挑戰(zhàn),提出把依??存句法分析技術和端到端的深度學習相結合,構建了?DT-CEA算法。DT-CEA??算法的主要思想是引入了基于依存樹的距離,使得基于位置的注意力層可以??有效解決長插入語、長定語造成的注意力分配偏差;同時,借鑒了依存橋的思??想,構建了依存門,控制依存信息的保留程度,通過對依存連接關系、依存方??向、依存類型的建模,修改了?LSTM算法中的隱藏層節(jié)點計算機制。實驗表明,??DT-CEA將依存句法信息融入模型,可以有效地提升效果。尤其是在復雜文本??上和長文本上,DT-CEA的優(yōu)勢格外明顯。??
Ut?=?WhyK?+?by?(2.15)??其中丨V和b是參數(shù),//是隱藏層的計算函數(shù)。圖2.3是循環(huán)神經網絡結構示意??圖。??循環(huán)神經網絡存在梯度消失和梯度爆炸問題,研究者們設計了很多變體,??例如門控循環(huán)單元(GRU)?[89]、長短期記憶網絡(LSTM)丨90]等,以及他們??的多層、雙向變體。??2.2.2門控循環(huán)單元??門控循環(huán)單兀(Gated?Recurrent?Unit,GRU)是循環(huán)神經網絡的一種變體,??21??
【參考文獻】:
期刊論文
[1]基于表情符注意力機制的微博情感分析模型[J]. 譚皓,鄧樹文,錢濤,姬東鴻. 計算機應用研究. 2019(09)
[2]融合Bi-LSTM和位置關系的對象級情感分析[J]. 鮑豪,李少童. 信息系統(tǒng)工程. 2018(03)
[3]一種用于基于方面情感分析的深度分層網絡模型[J]. 劉全,梁斌,徐進,周倩. 計算機學報. 2018(12)
[4]面向變異短文本的快速聚類算法[J]. 黃永光,劉挺,車萬翔,胡曉光. 中文信息學報. 2007(02)
本文編號:3368278
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3368278.html
最近更新
教材專著