天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

融合知識的情感分析研究

發(fā)布時間:2017-10-16 10:27

  本文關鍵詞:融合知識的情感分析研究


  更多相關文章: 情感分析 觀點挖掘 知識 弱監(jiān)督學習


【摘要】:情感分析是自然語言處理領域重要的研究方向之一,主要挖掘互聯網用戶對于事件、產品或者服務等所表達的情感傾向,其在輿情監(jiān)控、市場決策等方面具有重要的應用價值。對情感分析的問題來說,人或多或少有一些常識性的知識。例如,我們知道“口味-不錯”在餐館的評論中頻繁出現;“價格”和“性價比”在語義上都和價格相關等。如何在情感分析中引入這些顯然的、易于獲取的知識,從而促進和提高情感分析的性能至關重要。引入知識能夠簡化模型構建,一定程度上減少對標注數據的依賴,從而使得模型的泛化能力更強。因此,本文從融合知識的角度,對情感分析的若干問題深入分析研究,論文研究的主要內容有:?情感抽取,主要指評價詞和評價對象的抽取。本文基于大量的評論數據,通過少量的“評價詞-評價對象”搭配引入語法知識來實現情感抽取。其中,語法知識為有效的“評價詞-評價對象”間頻率較高的語法關系,這些語法關系是在大量數據中的統(tǒng)計得來,而不需要人工定義或標注數據。本文提出的方法充分利用了海量評論數據中豐富的語法關系,相比于現有的情感抽取方法具有明顯的優(yōu)勢。?情感和維度分類,主要指評論篇章的情感傾向分類和評論中句子的維度分類。本文將句子級別維度的分類和篇章級別的情感分類形式化成一個有結構學習的問題,并且在模型的結構中引入少量的維度指示詞。正是因為引入維度詞匯知識,使得句子的維度分類不需要人工標注數據。而且,通過對句子維度和篇章情感同時建模,使得情感和維度分類的性能得到顯著提高。?針對單篇評論的情感摘要,本文研究了單篇評論中句子內容重要性排序問題。由于評論中的每句話并不具有相同的重要性,本文提出從句子的文本內容和情感傾向兩個方面對其重要性進行排序。其中,句子文本內容排序通過引入若干人工準則作為知識訓練排序模型,不需要對句子重要性進行標注。?針對多篇評論的情感摘要,本文從用戶需求和興趣角度,研究個性化、定制化的評論摘要生成。本文提出在話題模型中引入情感和維度等語義知識,使得在不增加模型復雜度的同時對評論的情感和維度建模。本文的方法簡單有效,并且在評論摘要生成時考慮用戶的需求和興趣,具有一定的應用前景。
【關鍵詞】:情感分析 觀點挖掘 知識 弱監(jiān)督學習
【學位授予單位】:清華大學
【學位級別】:博士
【學位授予年份】:2015
【分類號】:TP391.1
【目錄】:
  • 摘要3-4
  • Abstract4-9
  • 第1章 引言9-25
  • 1.1 研究背景9-10
  • 1.2 研究現狀10-22
  • 1.2.1 情感抽取10-15
  • 1.2.2 情感和維度分類15-19
  • 1.2.3 情感摘要19-22
  • 1.3 知識22-23
  • 1.4 本文的研究重點23-25
  • 第2章 融合語法知識的情感抽取25-43
  • 2.1 概述25-26
  • 2.2 情感抽取的框架26-27
  • 2.3 符號表示27-28
  • 2.4 評價對象-評價詞表示28-29
  • 2.5 弱監(jiān)督學習29-34
  • 2.5.1 廣義期望準則29-30
  • 2.5.2 正面標注特征(語法知識)30-31
  • 2.5.3 類別稀疏正則項(Label Sparsity Regularization)31
  • 2.5.4 訓練二分類器31-33
  • 2.5.5 Bootstrapping抽取框架33-34
  • 2.6 實驗34-42
  • 2.6.1 數據集34-36
  • 2.6.2 知識的引入36
  • 2.6.3 評價方式36-37
  • 2.6.4 參數設置37
  • 2.6.5 評價對象評價詞抽取案例研究37-38
  • 2.6.6 評價詞評價對象抽取的性能對比38-39
  • 2.6.7 語法知識的敏感性評價39-40
  • 2.6.8 參考分布的敏感性評價40
  • 2.6.9 對最低可信分數閾值的敏感性評價40-41
  • 2.6.10 實驗小結41-42
  • 2.7 本章小結42
  • 附件42-43
  • 第3章 融合詞匯知識的情感和維度分類43-64
  • 3.1 概述43-46
  • 3.2 維度和情感解釋的定義46
  • 3.3 優(yōu)化問題形式化定義46-47
  • 3.4 通過損失函數引入維度詞匯知識47-48
  • 3.4.1 句子級別的損失函數(Sentence-level loss ,SL)47
  • 3.4.2 篇章級別的損失函數(Document-level loss ,,DL)47-48
  • 3.5 維度分類和篇章情感分類的聯合建模48-49
  • 3.5.1 評論篇章的情感傾向預測49
  • 3.5.2 情感解釋的維度劃分49
  • 3.6 模型訓練49-51
  • 3.6.1 優(yōu)化問題49-51
  • 3.6.2 模型和隱變量的初始化51
  • 3.7 實驗51-63
  • 3.7.1 數據集51-53
  • 3.7.2 評論篇章的情感傾向預測53-56
  • 3.7.3 維度分析的案例研究56-57
  • 3.7.4 量化分析57-63
  • 3.8 本章小結63
  • 附件63-64
  • 第4章 融合規(guī)則知識的評論內容重要性分析64-77
  • 4.1 概述64-65
  • 4.2 排序與情感分析聯合建模65-68
  • 4.2.1 句子信息含量排序65-67
  • 4.2.2 句子的情感分析67-68
  • 4.3 聯合優(yōu)化68-71
  • 4.3.1 對偶分解簡介69-70
  • 4.3.2 對偶分解求解聯合優(yōu)化問題70-71
  • 4.3.3 句子重要程度排序71
  • 4.4 實驗71-76
  • 4.4.1 數據71-72
  • 4.4.2 評價指標72
  • 4.4.3 對比方法72-73
  • 4.4.4 總體排序對比73
  • 4.4.5 重要句子排序性能評價73-76
  • 4.5 本章小結76
  • 附件76-77
  • 第5章 融合語義知識的評論分析和摘要77-94
  • 5.1 概述77-78
  • 5.2 話題模型簡介78-80
  • 5.2.1 符號表示78-79
  • 5.2.2 LDA訓練與參數估計79-80
  • 5.3 基于話題模型的評論建模80-84
  • 5.3.1 融合語義知識的LDA模型81-82
  • 5.3.2 引入維度、情感等語義知識82-83
  • 5.3.3 引入評論的打分83-84
  • 5.4 基于話題模型的用戶興趣建模84
  • 5.5 基于話題模型的個性化摘要生成84-85
  • 5.5.1 摘要的個性化84-85
  • 5.5.2 摘要的結構化85
  • 5.6 實驗85-92
  • 5.6.1 數據集和參數設置85-87
  • 5.6.2 話題的解釋性分析87-88
  • 5.6.3 話題的質量分析88-89
  • 5.6.4 個性化摘要生成分析89-92
  • 5.7 本章小結92-94
  • 第6章 總結與展望94-96
  • 6.1 本文總結94-95
  • 6.2 工作展望95-96
  • 參考文獻96-104
  • 致謝104-106
  • 個人簡歷、在學期間發(fā)表的學術論文與研究成果106-107

【相似文獻】

中國期刊全文數據庫 前10條

1 呂國防;;注意新聞表述中的情感傾向[J];新聞實踐;2011年06期

2 傅向華;劉國;郭巖巖;郭武彪;;中文博客多方面話題情感分析研究[J];中文信息學報;2013年01期

3 魏晶晶;吳曉吟;;電子商務產品評論多級情感分析的研究與實現[J];軟件;2013年09期

4 于瀟;萬軍;何翔;左尾歡;;校園微博情感分析系統(tǒng)的設計與實現[J];河北工業(yè)大學學報;2013年06期

5 封二英;龐靈;;基于弱監(jiān)督迭代法的情感傾向分析[J];無線互聯科技;2014年03期

6 龐磊;李壽山;張慧;周國棟;;基于微博的股票投資者未來情感傾向識別研究[J];計算機科學;2012年S1期

7 徐鵬;;基于直覺模糊推理的網頁在線評論情感傾向分類[J];計算機應用與軟件;2013年06期

8 楊偉杰;馬博淵;劉雯;;基于意見目標句抽取的中文股評情感分析方法[J];計算機仿真;2014年03期

9 楊江;彭石玉;侯敏;;基于主題情感句的漢語評論文傾向性分析[J];計算機應用研究;2011年02期

10 張素智;樊得強;李寶燕;;基于網絡評論語言學結構的情感傾向識別模型[J];鄭州大學學報(理學版);2011年01期

中國重要會議論文全文數據庫 前4條

1 楊江;侯敏;王寧;;基于主題情感句的漢語評論文傾向性分析[A];第五屆全國青年計算語言學研討會論文集[C];2010年

2 林慧恩;林世平;;中文情感傾向分析中主觀句子抽取方法的研究[A];全國第20屆計算機技術與應用學術會議(CACIS·2009)暨全國第1屆安全關鍵技術與應用學術會議論文集(上冊)[C];2009年

3 王素格;楊安娜;;一種混合語言信息的詞語搭配傾向判別方法[A];第五屆全國信息檢索學術會議論文集[C];2009年

4 宋曉雷;王素格;李紅霞;;基于概率潛在語義分析的詞匯情感傾向判別[A];第五屆全國青年計算語言學研討會論文集[C];2010年

中國重要報紙全文數據庫 前3條

1 唐楠;新聞應避免情感傾向[N];中國新聞出版報;2005年

2 魯東;不盡鄉(xiāng)情入畫來[N];中國文化報;2001年

3 楊勇濤;讓攝影喚起心靈的本真[N];中國攝影報;2005年

中國博士學位論文全文數據庫 前6條

1 房磊;融合知識的情感分析研究[D];清華大學;2015年

2 張奇;細顆粒度情感傾向分析若干關鍵問題研究[D];復旦大學;2008年

3 王素格;基于Web的評論文本情感分類問題研究[D];上海大學;2008年

4 楊卉;Web文本觀點挖掘及隱含情感傾向的研究[D];吉林大學;2011年

5 李思;WEB觀點挖掘中關鍵問題的研究[D];北京郵電大學;2012年

6 李方濤;基于產品評論的情感分析研究[D];清華大學;2011年

中國碩士學位論文全文數據庫 前10條

1 王帥;情感分析的特征提取算法與觀點的聚類算法研究[D];昆明理工大學;2015年

2 馮金剛;網絡輿情中文信息情感傾向分析研究[D];華北電力大學;2015年

3 魏從源;網絡信息的情感傾向分類技術研究[D];國防科學技術大學;2013年

4 周冬衛(wèi);中文微博評論的情感傾向分析[D];華東交通大學;2015年

5 吳斐;跨領域條件下詞匯情感傾向判別方法研究[D];合肥工業(yè)大學;2015年

6 徐凱;基于產品特征的用戶評論情感傾向分析研究[D];合肥工業(yè)大學;2015年

7 王格;網絡評論的情感傾向分析[D];武漢工程大學;2015年

8 劉其;基于用戶評論的群體情緒識別與演化研究[D];東華大學;2015年

9 張佳明;微博話題的公眾情感分析技術研究[D];解放軍信息工程大學;2015年

10 楊國峰;基于支持向量機的篇章情感傾向分析系統(tǒng)研究與實現[D];中山大學;2011年



本文編號:1042184

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/shoufeilunwen/xxkjbs/1042184.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶0a426***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com