基于情感傾向性的網(wǎng)絡(luò)輿情分析及演化預(yù)測(cè)研究
本文關(guān)鍵詞:基于情感傾向性的網(wǎng)絡(luò)輿情分析及演化預(yù)測(cè)研究,,由筆耕文化傳播整理發(fā)布。
【摘要】:近年來,互聯(lián)網(wǎng)社交工具的快速普及對(duì)我國(guó)社會(huì)產(chǎn)生了巨大的影響,并成為人們了解世界、交換意見的重要平臺(tái)。在網(wǎng)絡(luò)技術(shù)發(fā)展的同時(shí),互聯(lián)網(wǎng)和社會(huì)輿情逐漸融合,于是便產(chǎn)生了網(wǎng)絡(luò)輿情的概念,網(wǎng)絡(luò)輿情能夠真實(shí)、快速的反映社會(huì)輿論,尤其是最近幾年社交平臺(tái)的迅速崛起,網(wǎng)絡(luò)輿情在很大程度上引導(dǎo)著認(rèn)識(shí)的基本認(rèn)識(shí),因此網(wǎng)絡(luò)輿情的情感傾向及演化變的尤為重要,對(duì)政府的行政方式和決策機(jī)制都產(chǎn)生了極大的影響。所以,網(wǎng)絡(luò)輿情分析技術(shù)便應(yīng)運(yùn)而生。本文在傳統(tǒng)文本分類算法支持向量機(jī)的基礎(chǔ)上,針對(duì)網(wǎng)絡(luò)社交媒介引入特定的情感詞典,并將其應(yīng)用在特征選擇方面,構(gòu)造文本傾向性分類器,使用該分類器判別微博的情感極性(正向或負(fù)向)。同時(shí),進(jìn)一步研究網(wǎng)絡(luò)輿情的演化規(guī)律情況,即輿情熱度的變化規(guī)律,綜合考慮影響輿情熱度的驅(qū)動(dòng)因素,最后通過實(shí)驗(yàn)驗(yàn)證論文中采用的方法的可行性與有效性。本文的主要研究?jī)?nèi)容可以概括為以下四個(gè)方面:1.對(duì)How Net中文詞典重新整理與補(bǔ)充,嘗試構(gòu)建網(wǎng)絡(luò)輿情分析的特定情感詞典,為下文網(wǎng)絡(luò)輿情情感分類器的構(gòu)建奠定了一定的實(shí)驗(yàn)基礎(chǔ);2.對(duì)原始實(shí)驗(yàn)數(shù)據(jù)進(jìn)行人工標(biāo)注,并進(jìn)行數(shù)據(jù)預(yù)處理;3.將情感詞典應(yīng)用到文本特征選擇上,提出將詞頻法和互信息法相結(jié)合的特征提取方法,選取滿足條件的特征并計(jì)算其權(quán)值,訓(xùn)練模型,并通過實(shí)驗(yàn)驗(yàn)證本文所提方法的有效性;4.利用訓(xùn)練得到的情感分類器對(duì)整體微博輿情進(jìn)行極性判斷,得到負(fù)向輿情信息集合,使用回歸模型分析負(fù)面網(wǎng)絡(luò)輿情的演化規(guī)律,并對(duì)網(wǎng)絡(luò)輿情熱度進(jìn)行研究,找出影響輿情熱度的因素,分析每種因素對(duì)輿情熱度影響的顯著性,建立多元線性回歸預(yù)測(cè)模型,最后分析預(yù)測(cè)負(fù)向輿情與整體輿情熱度的演化規(guī)律。實(shí)驗(yàn)表明,在網(wǎng)絡(luò)輿情情感分類方面,引入情感詞典之后,所選取的特征更加具有領(lǐng)域性和代表性,再將詞頻和互信息方法相結(jié)合更能很好的表征數(shù)據(jù),實(shí)驗(yàn)結(jié)果較單純使用詞頻和互信息的特征選擇方法更加有效。在網(wǎng)絡(luò)輿情演化分析方面,把影響輿情熱度的驅(qū)動(dòng)因素作為多元線性回歸模型的自變量,分析自變量的顯著性以及它們之間是否存在多重共線性,并對(duì)模型的預(yù)測(cè)值和實(shí)際值做差值分析,證明了模型應(yīng)用于預(yù)測(cè)的可行性。最后,使用回歸模型對(duì)負(fù)向輿情信息和整體輿情信息的熱度做對(duì)比,分析了時(shí)序網(wǎng)絡(luò)輿情的演化規(guī)律。
【關(guān)鍵詞】:傾向性分類 輿情分析 特征選擇 多元線性回歸
【學(xué)位授予單位】:吉林大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP391.1
【目錄】:
- 摘要4-6
- Abstract6-10
- 第1章 緒論10-17
- 1.1 研究背景和意義10-12
- 1.2 國(guó)內(nèi)外研究現(xiàn)狀12-15
- 1.3 本文研究工作15-16
- 1.4 本文組織結(jié)構(gòu)16-17
- 第2章 相關(guān)理論及關(guān)鍵技術(shù)17-27
- 2.1 網(wǎng)絡(luò)輿情分析介紹及相關(guān)理論17-21
- 2.1.1 網(wǎng)絡(luò)輿情技術(shù)17-18
- 2.1.2 網(wǎng)絡(luò)輿情的傳播18-21
- 2.1.3 有關(guān)網(wǎng)絡(luò)輿情的其他研究21
- 2.2 傾向性分析21-25
- 2.2.1 研究分類21-22
- 2.2.2 技術(shù)分類22-25
- 2.3 多元線性回歸分析25-27
- 第3章 基于情感詞典的網(wǎng)絡(luò)輿情傾向性分類研究27-48
- 3.1 基于How Net的情感詞典構(gòu)造27-32
- 3.1.1 How Net簡(jiǎn)介27-28
- 3.1.2 基于How Net的詞語(yǔ)相似度計(jì)算28-29
- 3.1.3 知網(wǎng)How Net詞典的擴(kuò)展29-32
- 3.2 基于情感詞典框架下的網(wǎng)絡(luò)輿情傾向性分類32-42
- 3.2.1 數(shù)據(jù)預(yù)處理33-35
- 3.2.2 文本特征提取35-36
- 3.2.3 線性組合特征選取算法36-40
- 3.2.4 特征權(quán)重計(jì)算40-42
- 3.3 實(shí)驗(yàn)測(cè)試及結(jié)果分析42-48
- 3.3.1 實(shí)驗(yàn)環(huán)境及參數(shù)選取42
- 3.3.2 分類器學(xué)習(xí)方法的選擇42-43
- 3.3.3 評(píng)估標(biāo)準(zhǔn)43-44
- 3.3.4 算法測(cè)試及對(duì)比分析44-48
- 第4章 時(shí)序信息的網(wǎng)絡(luò)輿情演化規(guī)律模型48-59
- 4.1 網(wǎng)絡(luò)輿情演化48-49
- 4.2 網(wǎng)絡(luò)輿情演化的驅(qū)動(dòng)因素49-52
- 4.2.1 網(wǎng)絡(luò)輿情驅(qū)動(dòng)因素介紹49-50
- 4.2.2 網(wǎng)絡(luò)輿情驅(qū)動(dòng)因素分析50-52
- 4.3 多元線性回歸預(yù)測(cè)52-53
- 4.4 實(shí)驗(yàn)結(jié)果及分析53-59
- 4.4.1 問題描述53
- 4.4.2 實(shí)驗(yàn)過程53-59
- 第5章 總結(jié)與展望59-60
- 參考文獻(xiàn)60-64
- 作者簡(jiǎn)介及在學(xué)期間科研成果64-65
- 致謝65
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 劉培玉;張艷輝;朱振方;荀靜;;融合表情符號(hào)的微博文本傾向性分析[J];山東大學(xué)學(xué)報(bào)(理學(xué)版);2014年11期
2 李劍萍;;基于鏈接網(wǎng)絡(luò)圖探討對(duì)互聯(lián)網(wǎng)輿情話題的跟蹤方法[J];信息與電腦(理論版);2012年10期
3 邱云飛;王威;劉大有;邵良杉;;基于方差的CHI特征選擇方法[J];計(jì)算機(jī)應(yīng)用研究;2012年04期
4 劉勘;李晶;劉萍;;基于馬爾可夫鏈的輿情熱度趨勢(shì)分析[J];計(jì)算機(jī)工程與應(yīng)用;2011年36期
5 崔薇;曾潤(rùn)喜;王國(guó)華;;中國(guó)網(wǎng)絡(luò)輿情研究文獻(xiàn)計(jì)量分析[J];情報(bào)科學(xué);2011年01期
6 劉怡君;牛文元;;輿論形成及其演化的機(jī)理建模分析[J];科學(xué)對(duì)社會(huì)的影響;2009年03期
7 周立柱;賀宇凱;王建勇;;情感分析研究綜述[J];計(jì)算機(jī)應(yīng)用;2008年11期
8 姚天f ;程希文;徐飛玉;漢思·烏思克爾特;王睿;;文本意見挖掘綜述[J];中文信息學(xué)報(bào);2008年03期
9 梅雪;程學(xué)旗;郭巖;張剛;丁國(guó)棟;;一種全自動(dòng)生成網(wǎng)頁(yè)信息抽取Wrapper的方法[J];中文信息學(xué)報(bào);2008年01期
10 王永恒;賈焰;楊樹強(qiáng);;大規(guī)模文本數(shù)據(jù)庫(kù)中的短文分類方法[J];計(jì)算機(jī)工程與應(yīng)用;2006年22期
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前2條
1 謝乾龍;微博輿情分析系統(tǒng)關(guān)鍵技術(shù)研究[D];北京郵電大學(xué);2013年
2 韓威;網(wǎng)絡(luò)輿情熱點(diǎn)發(fā)現(xiàn)與話題跟蹤技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2012年
本文關(guān)鍵詞:基于情感傾向性的網(wǎng)絡(luò)輿情分析及演化預(yù)測(cè)研究,由筆耕文化傳播整理發(fā)布。
本文編號(hào):364200
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/364200.html