天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

微博文本情感分類研究

發(fā)布時間:2017-10-12 13:24

  本文關(guān)鍵詞:微博文本情感分類研究


  更多相關(guān)文章: 微博文本情感分類 情感詞典 深度學(xué)習(xí) LSTM PMI-IR


【摘要】:作為文本數(shù)據(jù)挖掘的重要分支—文本情感分類(輿情分析),近年來受到越來越多的關(guān)注,同時也被廣大學(xué)者所研究。伴隨著微博的發(fā)展,使得短文本情感分析研究越來越熱。微博文本中存在大量的新詞,這些詞具有明顯的情感正負(fù)極性,但是它們沒有加入到情感詞典中,這會大大減弱我們的分類效果,情感詞典的自動擴充是我們對微博情感分類研究一個重點。傳統(tǒng)的基于情感詞典的情感分類模型構(gòu)建起來比較簡單容易實現(xiàn)且分類速度較快,但是分類的準(zhǔn)確度較低,分類的好壞主要取決于情感詞典的好壞。但是構(gòu)建準(zhǔn)確的情感詞典需要我們具有一定的語言知識背景,這些背景知識的要求會阻礙我們對于微博情感分類的研究。現(xiàn)在研究中已存在不少擴充情感詞典的方法,也取得了不錯的效果,針對點互信息方法構(gòu)建詞典需要構(gòu)建完整語料庫的問題,我們提出了一種點互信息和信息檢索相結(jié)合的算法來自動擴充情感詞典。對于傳統(tǒng)模型分類精度較低且構(gòu)建傳統(tǒng)模型對語言背景知識要求等一些問題,構(gòu)建了一種基于深度學(xué)習(xí)的微博文本情感分類模型,針對構(gòu)建深度模型的訓(xùn)練語料庫的問題提出了結(jié)合傳統(tǒng)模型和深度學(xué)習(xí)模型的算法,具體工作如下:第一,新詞識別,微博情感詞典的自動擴充。為了解決傳統(tǒng)模型下情感詞典自動擴充的問題,提出了PMI-IR算法(點互信息與信息檢索相結(jié)合的方法)來對微博的未登錄詞、新詞進(jìn)行識別,然后再更新到情感詞典當(dāng)中。第二,構(gòu)建情感詞典,根據(jù)構(gòu)建的情感詞典制定相應(yīng)的判別規(guī)則來對文本進(jìn)行分類。將情感詞典分為了4個部分:基礎(chǔ)情感詞典(消極情感詞典、積極情感詞典)、程度副詞詞典、連詞詞典和否定詞典。本文收集了網(wǎng)絡(luò)上的幾個主流情感詞典:臺灣大學(xué)NTUSD-簡體中文情感極性詞典,知網(wǎng)hownet情感詞典,以及大連理工大學(xué)的中文情感詞匯本體庫。對這些情感詞典整合到了一起去除了那些重復(fù)的詞匯,還對其中相當(dāng)一部分詞匯進(jìn)行了校正優(yōu)化,依據(jù)我們構(gòu)建的微博情感詞典制定了相應(yīng)的判別規(guī)則來對微博文本進(jìn)行情感分類。第三,文本深度學(xué)習(xí)模型構(gòu)建,使用傳統(tǒng)模型來收集深度模型的訓(xùn)練語料庫。針對傳統(tǒng)模型分類準(zhǔn)確度較低的情況,構(gòu)建了微博文本情感分類的深度學(xué)習(xí)模型,構(gòu)建了基于LSTM(長短期記憶模型)的微博文本情感分類;由于這個模型是監(jiān)督訓(xùn)練的,需要收集大量已經(jīng)分好類的語料,因此我們提出使用傳統(tǒng)模型分類好的確定集來作為深度學(xué)習(xí)模型下的訓(xùn)練語料庫;結(jié)合二種模型來幫助我們提高分類的精準(zhǔn)度。
【關(guān)鍵詞】:微博文本情感分類 情感詞典 深度學(xué)習(xí) LSTM PMI-IR
【學(xué)位授予單位】:吉林大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP391.1
【目錄】:
  • 摘要4-6
  • Abstract6-10
  • 第1章 緒論10-15
  • 1.1 研究背景10-11
  • 1.2 研究意義及目的11-12
  • 1.3 研究現(xiàn)狀12-13
  • 1.4 本文工作13-15
  • 第2章 微博文本情感分類相關(guān)技術(shù)15-25
  • 2.1 文本預(yù)處理15-18
  • 2.2 文本表示模型18-20
  • 2.2.1 向量空間模型18-20
  • 2.2.2 布爾模型20
  • 2.2.3 概率主題模型簡介20
  • 2.3 深度學(xué)習(xí)常用的模型和方法20-24
  • 2.4 本章小結(jié)24-25
  • 第3章 基于情感詞典的微博文本情感分類25-35
  • 3.1 句子自動分詞25-26
  • 3.2 微博情感詞典構(gòu)建26-28
  • 3.2.1 程度副詞詞典26-27
  • 3.2.2 否定詞典27
  • 3.2.3 連詞詞表27-28
  • 3.2.4 基礎(chǔ)情感詞表28
  • 3.3 基于PMI-IR算法的微博情感詞典自動擴充28-31
  • 3.3.1 概述28-29
  • 3.3.2 基于PMI-IR算法的詞語情感極性判別29-31
  • 3.4 微博文本情感分類31-32
  • 3.5 實驗結(jié)果和分析32-34
  • 3.6 本章小結(jié)34-35
  • 第4章 基于深度學(xué)習(xí)的微博文本情感分類35-51
  • 4.1 文本深度表示35-38
  • 4.2 提取長短期記憶模型LSTM38-46
  • 4.2.1 Recurrent Neural Networks38-40
  • 4.2.2 長期依賴40-41
  • 4.2.3 LSTM網(wǎng)絡(luò)41-43
  • 4.2.4 LSTM核心思想43-46
  • 4.3 基于LSTM模型的文本情感分類46-48
  • 4.3.1 標(biāo)注語料庫收集46-47
  • 4.3.2 搭建LSTM模型47-48
  • 4.4 實驗結(jié)果和分析48-49
  • 4.5 本章小結(jié)49-51
  • 第5章 結(jié)論與展望51-53
  • 5.1 結(jié)論51
  • 5.2 展望51-53
  • 參考文獻(xiàn)53-56
  • 作者簡介及在學(xué)期間所取得的科研成果56-57
  • 致謝57

【參考文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前7條

1 孫建旺;呂學(xué)強;張雷瀚;;基于詞典與機器學(xué)習(xí)的中文微博情感分析研究[J];計算機應(yīng)用與軟件;2014年07期

2 侯敏;滕永林;李雪燕;陳毓麒;鄭雙美;侯明午;周紅照;;話題型微博語言特點及其情感分析策略研究[J];語言文字應(yīng)用;2013年02期

3 孫志軍;薛磊;許陽明;王正;;深度學(xué)習(xí)研究綜述[J];計算機應(yīng)用研究;2012年08期

4 趙妍妍;秦兵;車萬翔;劉挺;;基于句法路徑的情感評價單元識別[J];軟件學(xué)報;2011年05期

5 黨蕾;張蕾;;一種基于知網(wǎng)的中文句子情感傾向判別方法[J];計算機應(yīng)用研究;2010年04期

6 朱嫣嵐;閔錦;周雅倩;黃萱菁;吳立德;;基于HowNet的詞匯語義傾向計算[J];中文信息學(xué)報;2006年01期

7 徐琳宏;林鴻飛;潘宇;任惠;陳建美;;情感詞匯本體的構(gòu)造[J];情報學(xué)報;2008年02期

,

本文編號:1018958

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/1018958.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶84696***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com