基于深度學習的對象級文本情感分析方法研究
發(fā)布時間:2021-07-09 09:23
隨著網(wǎng)民參與度的不斷增高,互聯(lián)網(wǎng)成為網(wǎng)民發(fā)表觀點的集中平臺,其聚集了大量表達網(wǎng)民觀點的文本,成為寶貴的研究資源。研究網(wǎng)民對公眾實體、產(chǎn)品、服務等方面的情感不僅有利于政府機構(gòu)把握輿情態(tài)勢并進一步輔助決策,而且具有極高的商業(yè)價值。近年來,深度學習在文本挖掘各項任務中均取得一定進展,對于文本情感分析這個文本挖掘中的熱點與難點任務,研究如何使用深度學習的基本理論對文本表達的情感進行表示和提取,具有很高的理論意義和應用價值。本文圍繞對象級文本情感分析的主要任務,根據(jù)不同數(shù)據(jù)特點,重點從針對微博熱點話題數(shù)據(jù)的實體級文本情感分析和針對評論類數(shù)據(jù)的方面級文本情感分析兩個方面展開研究,主要研究內(nèi)容與創(chuàng)新點如下:1.提出了面向微博公眾實體情感民調(diào)的實體級文本情感分析方法。針對微博熱點話題數(shù)據(jù),定義了面向公眾實體情感民調(diào)的實體級微博文本情感分析任務,提出了基于序列標記的實體級文本情感分析方法,然后采用循環(huán)神經(jīng)網(wǎng)絡及其改進的循環(huán)單元進行序列標記,構(gòu)建了用于實體級文本情感分析的中文微博熱點話題數(shù)據(jù)集。數(shù)據(jù)統(tǒng)計結(jié)果表明采用序列標記的方式將文本中實體與情感聯(lián)合表示的方法較傳統(tǒng)串行方法具有明顯優(yōu)勢,實驗結(jié)果進一步表明...
【文章來源】:國防科技大學湖南省 211工程院校 985工程院校
【文章頁數(shù)】:123 頁
【學位級別】:博士
【部分圖文】:
產(chǎn)品評論示例
圖 3.5 標記數(shù)據(jù)統(tǒng)計結(jié)果3.6.2 評價指標實體級微博文本情感分析的目的是提取<實體 E,情感 S>元組,因此本文采用F-Score 作為評價指標,令 RE 為正確提取的觀點元組量,AE 是提取的所有觀點元組量,AL 是所有標記的觀點元組量,則 F-Score 的計算方法為:,REprecisionAE (3.33),RErecallAL (3.34)2* precision *recallF Scoreprecision recall 。 (3.35)3.6.3 實驗設定[122][123]
圖 3.6 不同模型的實體級微博文本情感分析結(jié)果模型在深度增加后期的效果下降可能是由過擬合引起的,因為訓練標記數(shù)據(jù)量較少,當深度增加時,模型參數(shù)隨之增加,到達一定程度后會引起過擬合現(xiàn)象,使模型難以訓練,效果也隨之降低。4) 不同模型設定下最好結(jié)果。如表 3.4 所示,大多數(shù)最好結(jié)果的基本模型為GRU,并且不同循環(huán)單元模型的最好結(jié)果在模型變?yōu)殡p向和深層模型時均有較大提升。雙向 GRU 在深度為 3 時取得了最好效果 0.736。最后,大多數(shù)的 RNN 模型取得了較基于情感打分的基本方法更好的效果,說明將觀點中的實體和情感進行聯(lián)合標記的方法對實體級微博文本情感分析更有效。表 3.4 不同模型設定下的最好結(jié)果最高 F-Score 基本模型 深度單層單向模型 0.675 GRU -單層雙向模型 0.701 MGRU1 -多層單向模型 0.689 GRU 2多層雙向模型 0.736 GRU 3
【參考文獻】:
期刊論文
[1]面向產(chǎn)品特征的中文在線評論情感分類:以本體建模為方法[J]. 尹裴,王洪偉. 系統(tǒng)管理學報. 2016(01)
[2]使用機器學習對漢語評論進行情感分類[J]. 白鴿,左萬利,趙乾坤,曲仁鏡. 吉林大學學報(理學版). 2009(06)
本文編號:3273482
【文章來源】:國防科技大學湖南省 211工程院校 985工程院校
【文章頁數(shù)】:123 頁
【學位級別】:博士
【部分圖文】:
產(chǎn)品評論示例
圖 3.5 標記數(shù)據(jù)統(tǒng)計結(jié)果3.6.2 評價指標實體級微博文本情感分析的目的是提取<實體 E,情感 S>元組,因此本文采用F-Score 作為評價指標,令 RE 為正確提取的觀點元組量,AE 是提取的所有觀點元組量,AL 是所有標記的觀點元組量,則 F-Score 的計算方法為:,REprecisionAE (3.33),RErecallAL (3.34)2* precision *recallF Scoreprecision recall 。 (3.35)3.6.3 實驗設定[122][123]
圖 3.6 不同模型的實體級微博文本情感分析結(jié)果模型在深度增加后期的效果下降可能是由過擬合引起的,因為訓練標記數(shù)據(jù)量較少,當深度增加時,模型參數(shù)隨之增加,到達一定程度后會引起過擬合現(xiàn)象,使模型難以訓練,效果也隨之降低。4) 不同模型設定下最好結(jié)果。如表 3.4 所示,大多數(shù)最好結(jié)果的基本模型為GRU,并且不同循環(huán)單元模型的最好結(jié)果在模型變?yōu)殡p向和深層模型時均有較大提升。雙向 GRU 在深度為 3 時取得了最好效果 0.736。最后,大多數(shù)的 RNN 模型取得了較基于情感打分的基本方法更好的效果,說明將觀點中的實體和情感進行聯(lián)合標記的方法對實體級微博文本情感分析更有效。表 3.4 不同模型設定下的最好結(jié)果最高 F-Score 基本模型 深度單層單向模型 0.675 GRU -單層雙向模型 0.701 MGRU1 -多層單向模型 0.689 GRU 2多層雙向模型 0.736 GRU 3
【參考文獻】:
期刊論文
[1]面向產(chǎn)品特征的中文在線評論情感分類:以本體建模為方法[J]. 尹裴,王洪偉. 系統(tǒng)管理學報. 2016(01)
[2]使用機器學習對漢語評論進行情感分類[J]. 白鴿,左萬利,趙乾坤,曲仁鏡. 吉林大學學報(理學版). 2009(06)
本文編號:3273482
本文鏈接:http://www.sikaile.net/shekelunwen/shgj/3273482.html
最近更新
教材專著