基于語義統(tǒng)計分析的網(wǎng)絡(luò)輿情挖掘技術(shù)研究
發(fā)布時間:2021-03-26 05:38
隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展和網(wǎng)絡(luò)應(yīng)用的普及,互聯(lián)網(wǎng)成為民眾獲取信息的重要來源,同時也成為人們傳播信息和表達觀點的重要渠道。通過網(wǎng)絡(luò)了解社情民意,關(guān)注輿情動向,對于促進社會和諧穩(wěn)定、推動社會民主與法制建設(shè)具有重要的現(xiàn)實意義。網(wǎng)絡(luò)信息浩如煙海,魚龍混雜,人工識別和研判顯得力不從心。如何利用計算機網(wǎng)絡(luò)技術(shù)、人工智能技術(shù)和數(shù)據(jù)挖掘技術(shù),對網(wǎng)絡(luò)輿情信息有效地挖掘和分析成為了一個新的研究熱點。如何識別民眾所關(guān)注的熱點話題并有效地分類,如何判斷民眾對社會事件的態(tài)度是正向的還是反向的,如何分析和把握社會熱點事件的波動性等,是網(wǎng)絡(luò)輿情研究中的亟需解決的重點問題,對認(rèn)識和引導(dǎo)網(wǎng)絡(luò)輿情具有重要的科學(xué)意義。本文針對網(wǎng)絡(luò)輿情信息的挖掘和分析中存在的問題展開研究,將基于Web的文本分類技術(shù)、機器學(xué)習(xí)算法研究、波動性的統(tǒng)計分析等技術(shù)應(yīng)用到網(wǎng)絡(luò)突發(fā)事件的分類、網(wǎng)絡(luò)輿情信息的情感傾向性分析、輿情演變的波動性分析等研究中。主要的研究內(nèi)容和創(chuàng)新點包括:1.本文提出將Fisher判別準(zhǔn)則應(yīng)用到網(wǎng)絡(luò)輿情文本的分類問題中,并實現(xiàn)對突發(fā)事件的分類。由突發(fā)事件引發(fā)的網(wǎng)絡(luò)輿情信息,從內(nèi)容形式來看主要為文本,因此輿情信息的分類本質(zhì)上是文本分類...
【文章來源】:武漢理工大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁數(shù)】:122 頁
【學(xué)位級別】:博士
【文章目錄】:
中文摘要
Abstract
第1章 緒論
1.1 論文研究背景
1.1.1 輿情和網(wǎng)絡(luò)輿情
1.1.2 網(wǎng)絡(luò)輿情挖掘的研究意義
1.2 國內(nèi)外網(wǎng)絡(luò)輿情研究現(xiàn)狀
1.2.1 基于潛在語義分析的文本分類
1.2.2 情感傾向性分類
1.2.3 網(wǎng)絡(luò)輿情信息的演變分析
1.3 本文的主要研究內(nèi)容
1.4 本文的章節(jié)結(jié)構(gòu)
第2章 網(wǎng)絡(luò)輿情信息挖掘和分析方法概述
2.1 引言
2.2 網(wǎng)絡(luò)輿情信息的采集
2.2.1 輿情信息采集的來源
2.2.2 網(wǎng)絡(luò)輿情信息采集策略
2.3 基于WEB挖掘的網(wǎng)絡(luò)輿情信息分析
2.3.1 網(wǎng)絡(luò)輿情話題檢測與跟蹤
2.3.2 基于Web的文本挖掘和分類
2.3.3 文本的情感傾向性分析
2.3.4 輿情信息的演變和數(shù)據(jù)流挖掘
2.4 網(wǎng)絡(luò)輿情挖掘和分析的架構(gòu)體系
2.5 本章小結(jié)
第3章 網(wǎng)絡(luò)突發(fā)事件輿情信息的分類研究
3.1 研究背景
3.2 文本分類的相關(guān)方法介紹
3.2.1 文本表示模型
3.2.2 文本的特征選擇方法
3.2.3 文本的分類方法
3.2.4 文本分類效果的評價指標(biāo)
3.3 基于FISHER判別的特征提取方法
3.3.1 Fisher線性判別準(zhǔn)則
3.3.2 Fisher線性判別用于文本特征提取
3.3.3 實驗結(jié)果和分析
3.4 突發(fā)事件輿情信息的分類研究
3.4.1 網(wǎng)絡(luò)輿情關(guān)鍵詞的選擇
3.4.2 突發(fā)事件分類語料的獲取
3.4.3 分類性能的比較
3.5 本章小結(jié)
第4章 基于局部潛在語義分析的輿情文本分類
4.1 研究背景及相關(guān)研究
4.2 潛在語義分析
4.2.1 潛在語義分析的原理
4.2.2 奇異值分解
4.2.3 利用奇異值分解計算各種相似關(guān)系
4.3 基于局部潛在語義分析的WEB文本分類
4.3.1 特征詞的局部特性
4.3.2 局部潛在語義分析
4.3.3 局部區(qū)域的生成
4.4 實驗及結(jié)果分析
4.4.1 實驗數(shù)據(jù)及預(yù)處理
4.4.2 實驗結(jié)果及分析
4.5 本章小結(jié)
第5章 網(wǎng)絡(luò)輿情信息的情感傾向性分析
5.1 引言
5.2 情感傾向性分析的相關(guān)研究
5.2.1 不同粒度的情感傾向性分析研究
5.2.2 中文情感分析評測及語料庫
5.3 基于機器學(xué)習(xí)的情感傾向性分類方法
5.4 模式匹配和機器學(xué)習(xí)相結(jié)合的情感傾向性分類
5.4.1 PMML方法結(jié)構(gòu)流程
5.4.2 關(guān)鍵詞的提取
5.4.3 模式的提取和匹配
5.4.4 文本的情感傾向性計算
5.5 實驗結(jié)果及分析
5.5.1 實驗數(shù)據(jù)來源
5.5.2 數(shù)據(jù)的處理
5.5.3 實驗設(shè)置和結(jié)果
5.6 本章小結(jié)
第6章 網(wǎng)絡(luò)輿情信息演變的波動性分析
6.1 背景介紹
6.2 網(wǎng)絡(luò)輿情信息演化的統(tǒng)計計量研究
6.3 網(wǎng)絡(luò)輿情信息演化的波動性特征
6.4 GARCH類模型相關(guān)介紹
6.4.1 GARCH類模型概述
6.4.2 從ARCH到GARCH
6.4.3 GARCH模型的檢驗和參數(shù)估計
6.4.4 不對稱的GARCH類模型
6.5 基于GARCH類模型的輿情信息波動性分析
6.5.1 研究對象
6.5.2 數(shù)據(jù)收集和處理
6.5.3 GARCH模型的建立
6.5.4 不對稱性的模型的建立
6.6 本章小結(jié)
第7章 總結(jié)與展望
7.1 全文工作總結(jié)
7.2 進一步的展望
參考文獻
攻讀博士學(xué)位期間發(fā)表的論文
攻讀博士學(xué)位期間參加研究的項目
致謝
附錄
【參考文獻】:
期刊論文
[1]網(wǎng)絡(luò)輿情演化的階段分析[J]. 潘崇霞. 計算機與現(xiàn)代化. 2011(10)
[2]文本分類中特征選擇方法的比較與改進[J]. 單麗莉,劉秉權(quán),孫承杰. 哈爾濱工業(yè)大學(xué)學(xué)報. 2011(S1)
[3]重大公共危機網(wǎng)絡(luò)輿情擴散監(jiān)測和規(guī)律分析[J]. 孫佰清,董靖巍. 哈爾濱工業(yè)大學(xué)學(xué)報(社會科學(xué)版). 2011(01)
[4]基于Stacking組合分類方法的中文情感分類研究[J]. 李壽山,黃居仁. 中文信息學(xué)報. 2010(05)
[5]基于潛在語義分析和HS-SVM的文本分類模型研究[J]. 張玉峰,何超. 情報理論與實踐. 2010(07)
[6]一種基于知網(wǎng)的中文句子情感傾向判別方法[J]. 黨蕾,張蕾. 計算機應(yīng)用研究. 2010(04)
[7]基于機器學(xué)習(xí)的網(wǎng)絡(luò)新聞評論情感分類研究[J]. 周杰,林琛,李弼程. 計算機應(yīng)用. 2010(04)
[8]跨領(lǐng)域傾向性分析相關(guān)技術(shù)研究[J]. 吳瓊,譚松波,張剛,段洣毅,程學(xué)旗. 中文信息學(xué)報. 2010(01)
[9]使用機器學(xué)習(xí)對漢語評論進行情感分類[J]. 白鴿,左萬利,趙乾坤,曲仁鏡. 吉林大學(xué)學(xué)報(理學(xué)版). 2009(06)
[10]網(wǎng)絡(luò)輿情突發(fā)事件預(yù)警系統(tǒng)、指標(biāo)與機制[J]. 曾潤喜,徐曉林. 情報雜志. 2009(11)
博士論文
[1]基于內(nèi)容的互聯(lián)網(wǎng)輿情信息挖掘關(guān)鍵技術(shù)研究[D]. 劉玉國.山東大學(xué) 2011
[2]文本傾向性分析中的情感詞典構(gòu)建技術(shù)研究[D]. 杜偉夫.哈爾濱工業(yè)大學(xué) 2010
[3]基于Web的評論文本情感分類問題研究[D]. 王素格.上海大學(xué) 2008
[4]互聯(lián)網(wǎng)輿情信息挖掘方法研究[D]. 杜阿寧.哈爾濱工業(yè)大學(xué) 2007
[5]高性能文本分類算法研究[D]. 譚松波.中國科學(xué)院研究生院(計算技術(shù)研究所) 2006
碩士論文
[1]互聯(lián)網(wǎng)中危機信息傳播規(guī)律及應(yīng)對模式研究[D]. 陸題佳.中國科學(xué)技術(shù)大學(xué) 2010
[2]基于網(wǎng)絡(luò)語義挖掘的輿情監(jiān)測預(yù)警研究[D]. 劉恒文.武漢理工大學(xué) 2010
[3]網(wǎng)絡(luò)輿情數(shù)據(jù)獲取與話題分析技術(shù)研究[D]. 王允.解放軍信息工程大學(xué) 2010
本文編號:3101054
【文章來源】:武漢理工大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁數(shù)】:122 頁
【學(xué)位級別】:博士
【文章目錄】:
中文摘要
Abstract
第1章 緒論
1.1 論文研究背景
1.1.1 輿情和網(wǎng)絡(luò)輿情
1.1.2 網(wǎng)絡(luò)輿情挖掘的研究意義
1.2 國內(nèi)外網(wǎng)絡(luò)輿情研究現(xiàn)狀
1.2.1 基于潛在語義分析的文本分類
1.2.2 情感傾向性分類
1.2.3 網(wǎng)絡(luò)輿情信息的演變分析
1.3 本文的主要研究內(nèi)容
1.4 本文的章節(jié)結(jié)構(gòu)
第2章 網(wǎng)絡(luò)輿情信息挖掘和分析方法概述
2.1 引言
2.2 網(wǎng)絡(luò)輿情信息的采集
2.2.1 輿情信息采集的來源
2.2.2 網(wǎng)絡(luò)輿情信息采集策略
2.3 基于WEB挖掘的網(wǎng)絡(luò)輿情信息分析
2.3.1 網(wǎng)絡(luò)輿情話題檢測與跟蹤
2.3.2 基于Web的文本挖掘和分類
2.3.3 文本的情感傾向性分析
2.3.4 輿情信息的演變和數(shù)據(jù)流挖掘
2.4 網(wǎng)絡(luò)輿情挖掘和分析的架構(gòu)體系
2.5 本章小結(jié)
第3章 網(wǎng)絡(luò)突發(fā)事件輿情信息的分類研究
3.1 研究背景
3.2 文本分類的相關(guān)方法介紹
3.2.1 文本表示模型
3.2.2 文本的特征選擇方法
3.2.3 文本的分類方法
3.2.4 文本分類效果的評價指標(biāo)
3.3 基于FISHER判別的特征提取方法
3.3.1 Fisher線性判別準(zhǔn)則
3.3.2 Fisher線性判別用于文本特征提取
3.3.3 實驗結(jié)果和分析
3.4 突發(fā)事件輿情信息的分類研究
3.4.1 網(wǎng)絡(luò)輿情關(guān)鍵詞的選擇
3.4.2 突發(fā)事件分類語料的獲取
3.4.3 分類性能的比較
3.5 本章小結(jié)
第4章 基于局部潛在語義分析的輿情文本分類
4.1 研究背景及相關(guān)研究
4.2 潛在語義分析
4.2.1 潛在語義分析的原理
4.2.2 奇異值分解
4.2.3 利用奇異值分解計算各種相似關(guān)系
4.3 基于局部潛在語義分析的WEB文本分類
4.3.1 特征詞的局部特性
4.3.2 局部潛在語義分析
4.3.3 局部區(qū)域的生成
4.4 實驗及結(jié)果分析
4.4.1 實驗數(shù)據(jù)及預(yù)處理
4.4.2 實驗結(jié)果及分析
4.5 本章小結(jié)
第5章 網(wǎng)絡(luò)輿情信息的情感傾向性分析
5.1 引言
5.2 情感傾向性分析的相關(guān)研究
5.2.1 不同粒度的情感傾向性分析研究
5.2.2 中文情感分析評測及語料庫
5.3 基于機器學(xué)習(xí)的情感傾向性分類方法
5.4 模式匹配和機器學(xué)習(xí)相結(jié)合的情感傾向性分類
5.4.1 PMML方法結(jié)構(gòu)流程
5.4.2 關(guān)鍵詞的提取
5.4.3 模式的提取和匹配
5.4.4 文本的情感傾向性計算
5.5 實驗結(jié)果及分析
5.5.1 實驗數(shù)據(jù)來源
5.5.2 數(shù)據(jù)的處理
5.5.3 實驗設(shè)置和結(jié)果
5.6 本章小結(jié)
第6章 網(wǎng)絡(luò)輿情信息演變的波動性分析
6.1 背景介紹
6.2 網(wǎng)絡(luò)輿情信息演化的統(tǒng)計計量研究
6.3 網(wǎng)絡(luò)輿情信息演化的波動性特征
6.4 GARCH類模型相關(guān)介紹
6.4.1 GARCH類模型概述
6.4.2 從ARCH到GARCH
6.4.3 GARCH模型的檢驗和參數(shù)估計
6.4.4 不對稱的GARCH類模型
6.5 基于GARCH類模型的輿情信息波動性分析
6.5.1 研究對象
6.5.2 數(shù)據(jù)收集和處理
6.5.3 GARCH模型的建立
6.5.4 不對稱性的模型的建立
6.6 本章小結(jié)
第7章 總結(jié)與展望
7.1 全文工作總結(jié)
7.2 進一步的展望
參考文獻
攻讀博士學(xué)位期間發(fā)表的論文
攻讀博士學(xué)位期間參加研究的項目
致謝
附錄
【參考文獻】:
期刊論文
[1]網(wǎng)絡(luò)輿情演化的階段分析[J]. 潘崇霞. 計算機與現(xiàn)代化. 2011(10)
[2]文本分類中特征選擇方法的比較與改進[J]. 單麗莉,劉秉權(quán),孫承杰. 哈爾濱工業(yè)大學(xué)學(xué)報. 2011(S1)
[3]重大公共危機網(wǎng)絡(luò)輿情擴散監(jiān)測和規(guī)律分析[J]. 孫佰清,董靖巍. 哈爾濱工業(yè)大學(xué)學(xué)報(社會科學(xué)版). 2011(01)
[4]基于Stacking組合分類方法的中文情感分類研究[J]. 李壽山,黃居仁. 中文信息學(xué)報. 2010(05)
[5]基于潛在語義分析和HS-SVM的文本分類模型研究[J]. 張玉峰,何超. 情報理論與實踐. 2010(07)
[6]一種基于知網(wǎng)的中文句子情感傾向判別方法[J]. 黨蕾,張蕾. 計算機應(yīng)用研究. 2010(04)
[7]基于機器學(xué)習(xí)的網(wǎng)絡(luò)新聞評論情感分類研究[J]. 周杰,林琛,李弼程. 計算機應(yīng)用. 2010(04)
[8]跨領(lǐng)域傾向性分析相關(guān)技術(shù)研究[J]. 吳瓊,譚松波,張剛,段洣毅,程學(xué)旗. 中文信息學(xué)報. 2010(01)
[9]使用機器學(xué)習(xí)對漢語評論進行情感分類[J]. 白鴿,左萬利,趙乾坤,曲仁鏡. 吉林大學(xué)學(xué)報(理學(xué)版). 2009(06)
[10]網(wǎng)絡(luò)輿情突發(fā)事件預(yù)警系統(tǒng)、指標(biāo)與機制[J]. 曾潤喜,徐曉林. 情報雜志. 2009(11)
博士論文
[1]基于內(nèi)容的互聯(lián)網(wǎng)輿情信息挖掘關(guān)鍵技術(shù)研究[D]. 劉玉國.山東大學(xué) 2011
[2]文本傾向性分析中的情感詞典構(gòu)建技術(shù)研究[D]. 杜偉夫.哈爾濱工業(yè)大學(xué) 2010
[3]基于Web的評論文本情感分類問題研究[D]. 王素格.上海大學(xué) 2008
[4]互聯(lián)網(wǎng)輿情信息挖掘方法研究[D]. 杜阿寧.哈爾濱工業(yè)大學(xué) 2007
[5]高性能文本分類算法研究[D]. 譚松波.中國科學(xué)院研究生院(計算技術(shù)研究所) 2006
碩士論文
[1]互聯(lián)網(wǎng)中危機信息傳播規(guī)律及應(yīng)對模式研究[D]. 陸題佳.中國科學(xué)技術(shù)大學(xué) 2010
[2]基于網(wǎng)絡(luò)語義挖掘的輿情監(jiān)測預(yù)警研究[D]. 劉恒文.武漢理工大學(xué) 2010
[3]網(wǎng)絡(luò)輿情數(shù)據(jù)獲取與話題分析技術(shù)研究[D]. 王允.解放軍信息工程大學(xué) 2010
本文編號:3101054
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/3101054.html
最近更新
教材專著