天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于機器學習的中文微博情感分類技術研究

發(fā)布時間:2021-01-05 13:43
  進入21世紀,蓬勃發(fā)展的互聯(lián)網(wǎng)科學與技術,為社會的進步與發(fā)展掀開了新的改革篇章。其中一大批社交軟件映入大眾的視野中,包括博客、社區(qū)論壇、微博等知識交互型社交媒體、軟件,隨之而來的還有這些媒體平臺產生了巨大數(shù)量的文本數(shù)據(jù)。如何充分利用如此龐大的數(shù)據(jù)集并挖掘出其中的價值,已成為一項任重而道遠的研究課題。微博作為一種新型的社交網(wǎng)絡平臺,因其簡單、易操作的風格,受到越來越多致力于研究文本情感分類領域的學者們的厚愛。用戶可通過電腦端或者移動終端登錄微博,可以對事件、人物、物品發(fā)表帶有主觀性的情感文本,通過計算機識別出這些主觀性文本,并準確分類為正面或負面態(tài)度,在實際社會的許多應用領域中都有廣泛的研究前景。本文將新浪微博作為研究對象,通過網(wǎng)絡爬蟲采集到相關領域的數(shù)據(jù)集,首先討論了情感詞典方法下的中文文本情感分類,接著在此基礎上,采用基于機器學習方法對中文文本進行情感分類,并根據(jù)最終的實驗結果,驗證實驗過程中提出的改進算法的可行性。本文主要研究內容包括如下三個方面:(1)情感詞典的擴展自構建。構建情感詞典的過程中,將三種開源情感詞典去重標記后融合為基礎情感詞典,并就實際微博中存在的未登錄詞、新詞,給... 

【文章來源】:江蘇科技大學江蘇省

【文章頁數(shù)】:71 頁

【學位級別】:碩士

【文章目錄】:
摘要
Abstract
第1章 緒論
    1.1 研究背景和意義
        1.1.1 研究背景
        1.1.2 研究意義
    1.2 國內外研究現(xiàn)狀
        1.2.1 情感分析研究現(xiàn)狀
        1.2.2 基于情感知識的情感研究
        1.2.3 基于機器學習的情感研究
    1.3 論文研究內容與創(chuàng)新
    1.4 論文的結構安排
    1.5 本章小結
第2章 相關理論與技術
    2.1 微博的文本特征
    2.2 文本預處理
        2.2.1 中文分詞
        2.2.2 停用詞處理
        2.2.3 詞性標注
        2.2.4 句法分析
    2.3 文本表示
        2.3.1 向量空間模型
        2.3.2 特征選擇方法
        2.3.3 特征權重計算
    2.4 文本情感分類
        2.4.1 基于情感詞典的情感分類
        2.4.2 基于機器學習的情感分類
    2.5 本章小結
第3章 表情特征與規(guī)則下的情感計算研究
    3.1 情感詞典的構建
        3.1.1 基礎情感詞典介紹
        3.1.2 情感詞典擴展算法
        3.1.3 算法有效性驗證
    3.2 微博情感影響因子
        3.2.1 詞語級影響因子
        3.2.2 句子級影響因子
    3.3 語義規(guī)則
        3.3.1 句型規(guī)則
        3.3.2 句間關系規(guī)則
    3.4 表情特征加權
    3.5 微博情感計算公式
    3.6 實驗驗證
        3.6.1 數(shù)據(jù)來源
        3.6.2 評測指標
        3.6.3 實驗結果與分析
    3.7 本章小結
第4章 融合語義規(guī)則下基于機器學習的情感分析
    4.1 機器學習算法介紹
        4.1.1 樸素貝葉斯
        4.1.2 k近鄰
        4.1.3 支持向量機
    4.2 基于機器學習的情感分析流程
    4.3 基于支持向量機的情感分類
        4.3.1 文本表示格式
        4.3.2 文本縮放操作
        4.3.3 核函數(shù)選擇
        4.3.4 相關參數(shù)調整
    4.4 針對特征權重算法的改進
    4.5 實驗驗證
        4.5.1 數(shù)據(jù)準備
        4.5.2 實驗測評指標
        4.5.3 實驗結果與分析
    4.6 本章小結
第5章 總結與展望
    5.1 全文總結
    5.2 學習展望
參考文獻
攻讀碩士學位期間發(fā)表論文
致謝


【參考文獻】:
期刊論文
[1]基于句法路徑的中文評論細粒度情感分析[J]. 胡征,陳爾希,曾獻輝,蔡一.  信息技術. 2018(09)
[2]基于《知網(wǎng)》概念定義的情感詞典構建研究[J]. 張森,曹暉.  計算機工程與應用. 2015(17)
[3]基于主題模型和統(tǒng)計機器翻譯方法的中文格律詩自動生成[J]. 蔣銳瀅,崔磊,何晶,周明,潘志庚.  計算機學報. 2015(12)
[4]基于文本語義和表情傾向的微博情感分析方法[J]. 王文,王樹鋒,李洪華.  南京理工大學學報. 2014(06)
[5]基于詞典與機器學習的中文微博情感分析研究[J]. 孫建旺,呂學強,張雷瀚.  計算機應用與軟件. 2014(07)
[6]中文分詞算法綜述[J]. 張丹.  黑龍江科技信息. 2012(08)
[7]基于層次結構的多策略中文微博情感分析和特征抽取[J]. 謝麗星,周明,孫茂松.  中文信息學報. 2012(01)
[8]基于機器學習的中文微博情感分類實證研究[J]. 劉志明,劉魯.  計算機工程與應用. 2012(01)
[9]基于情感詞典擴展技術的網(wǎng)絡輿情傾向性分析[J]. 楊超,馮時,王大玲,楊楠,于戈.  小型微型計算機系統(tǒng). 2010(04)
[10]基于漢語情感詞表的句子情感傾向分類研究[J]. 王素格,楊安娜,李德玉.  計算機工程與應用. 2009(24)

博士論文
[1]文本傾向性分析中的情感詞典構建技術研究[D]. 杜偉夫.哈爾濱工業(yè)大學 2010

碩士論文
[1]基于微博的突發(fā)事件檢測方法研究[D]. 張玉.蘭州大學 2016
[2]中文微博情感分析[D]. 張俊.西北民族大學 2015
[3]基于MapReduce的分布式網(wǎng)絡輿情聚類方法的研究[D]. 趙陽陽.北京交通大學 2015
[4]基于向量空間的文本聚類方法與實現(xiàn)[D]. 鄔啟為.北京交通大學 2014
[5]基于PAD模型的中文微博情感分析研究[D]. 曹海濤.大連理工大學 2013
[6]基于語義情感空間模型的微博情感傾向性研究[D]. 游建平.暨南大學 2012
[7]KNN文本分類中基于遺傳算法的特征提取技術研究[D]. 劉亞南.中國石油大學 2011
[8]搜索引擎中文分詞技術研究[D]. 任麗蕓.重慶理工大學 2011
[9]基于用戶行為的面向領域搜索引擎研究[D]. 馬妍.東北大學 2009
[10]支持向量機中若干優(yōu)化算法研究[D]. 邵小健.山東科技大學 2005



本文編號:2958771

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/2958771.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶11056***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com