基于主題情感混合模型的無監(jiān)督微博情感分類
發(fā)布時間:2022-11-11 22:37
隨著互聯(lián)網的興起,帶動了以微博為主的社交網絡平臺的快速發(fā)展,微博評論文本呈指數型增長,從海量評論文本中挖掘的情感信息在商業(yè)策劃與社會應用中的價值越來越大,與此同時,依托計算機的無監(jiān)督微博情感分析技術應運而生。與傳統(tǒng)文本情感分析不同的是,微博評論文本在情感表達上有其獨特之處,微博評論有一定的字數限制,短文本評論居多且數量規(guī)模大,易出現文本語法不規(guī)范、頻現網絡新詞等現象。故本文針對微博文本以上特點開展研究,構建一個面向微博文本的領域情感詞典,提出一種基于BTM主題模型的無監(jiān)督微博情感分類模型(W-BSTM)。本文所構建的微博文本領域情感詞典包含基礎情感詞典、網絡用語情感詞典、表情符號情感詞典和領域擴建情感詞典四部分。在現有情感詞典基礎上構建了一個二分類基礎情感詞典;通過觀察與整理構建了針對文本中網絡詞語和表情符號的情感詞典;使用基于HowNet語義計算方法建立微博領域的擴展詞典,收集那些在傳統(tǒng)文本中無情感傾向在微博文本表述中含情感傾向的詞。W-BSTM模型是在BTM模型的基礎上增加情感層,融合權重模型,形成無監(jiān)督的“主題-情感-詞匯”三層貝葉斯主題情感混合模型,在保留BTM模型原有優(yōu)越性的...
【文章頁數】:61 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 課題背景與意義
1.2 國內外研究現狀
1.2.1 基于情感詞典的分析方法
1.2.2 基于機器學習的情感分析方法
1.3 論文的主要研究內容與組織結構
1.3.1 主要研究內容
1.3.2 本文組織結構
1.4 本章小結
第二章 相關關鍵理論與技術研究
2.1 微博文本情感分類流程
2.2 中文數據預處理技術
2.2.1 中文分詞
2.2.2 停用詞處理
2.3 主題模型
2.3.1 LDA模型
2.3.2 BTM模型
2.4 主題情感模型
2.5 本章小結
第三章 面向微博文本的情感詞典構建
3.1 情感詞典相關介紹
3.2 微博情感詞典的構建
3.2.1 基礎情感詞典
3.2.2 網絡用語情感詞典
3.2.3 表情符號情感詞典
3.3 微博情感領域詞典擴建
3.4 本章小結
第四章 改進的主題情感混合模型
4.1 權重模型
4.1.1 CV詞權重模型
4.1.2 SO-PMI詞權重模型
4.1.3 詞綜合權重模型
4.2 加權主題情感混合模型
4.3 文檔情感極性判定
4.4 本章小結
第五章 微博情感分析實驗
5.1 實驗數據
5.1.1 數據獲取
5.1.2 數據預處理
5.2 實驗參數及評價指標
5.3 模型對比實驗結果與分析
5.4 微博評論情感隨機測評
5.5 本章小結
第六章 總結與展望
6.1 總結
6.2 展望
參考文獻
學術論文與科研項目
致謝
本文編號:3705875
【文章頁數】:61 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 課題背景與意義
1.2 國內外研究現狀
1.2.1 基于情感詞典的分析方法
1.2.2 基于機器學習的情感分析方法
1.3 論文的主要研究內容與組織結構
1.3.1 主要研究內容
1.3.2 本文組織結構
1.4 本章小結
第二章 相關關鍵理論與技術研究
2.1 微博文本情感分類流程
2.2 中文數據預處理技術
2.2.1 中文分詞
2.2.2 停用詞處理
2.3 主題模型
2.3.1 LDA模型
2.3.2 BTM模型
2.4 主題情感模型
2.5 本章小結
第三章 面向微博文本的情感詞典構建
3.1 情感詞典相關介紹
3.2 微博情感詞典的構建
3.2.1 基礎情感詞典
3.2.2 網絡用語情感詞典
3.2.3 表情符號情感詞典
3.3 微博情感領域詞典擴建
3.4 本章小結
第四章 改進的主題情感混合模型
4.1 權重模型
4.1.1 CV詞權重模型
4.1.2 SO-PMI詞權重模型
4.1.3 詞綜合權重模型
4.2 加權主題情感混合模型
4.3 文檔情感極性判定
4.4 本章小結
第五章 微博情感分析實驗
5.1 實驗數據
5.1.1 數據獲取
5.1.2 數據預處理
5.2 實驗參數及評價指標
5.3 模型對比實驗結果與分析
5.4 微博評論情感隨機測評
5.5 本章小結
第六章 總結與展望
6.1 總結
6.2 展望
參考文獻
學術論文與科研項目
致謝
本文編號:3705875
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3705875.html
最近更新
教材專著