基于情感識(shí)別的案件輿情統(tǒng)計(jì)分析
發(fā)布時(shí)間:2023-01-08 15:38
突發(fā)和爭(zhēng)議案件容易激發(fā)公眾的好奇心,引起社會(huì)公眾的關(guān)注.公眾關(guān)注的同時(shí)就會(huì)形成諸多的網(wǎng)絡(luò)輿情,公眾的憤慨、焦慮等負(fù)面情緒也容易隨之?dāng)U散、爆發(fā).隨著社交網(wǎng)絡(luò)的成熟,微博成為信息的載體.微博用戶發(fā)表的信息包含不同的情感特征,挖掘這些特征對(duì)于輿情預(yù)警、公眾情緒引導(dǎo)、案件網(wǎng)絡(luò)管控等有重要的意義.本文主要以李心草溺亡案件為例,基于微博數(shù)據(jù)進(jìn)行案件的情感分析和輿情分析.在案件的情感分析方面,首先采用爬蟲技術(shù)爬取微博上相關(guān)案件的新聞、用戶評(píng)論內(nèi)容及用戶信息等數(shù)據(jù).其次是對(duì)爬取的數(shù)據(jù)進(jìn)行預(yù)處理,將與本文研究?jī)?nèi)容無(wú)關(guān)的雜亂數(shù)據(jù)刪除.然后使用現(xiàn)有分詞工具進(jìn)行分詞,去停用詞等操作,在此基礎(chǔ)上進(jìn)行案件關(guān)鍵詞的提取,最后建立詞向量模型,采用支持向量機(jī)和長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(Long Short-Term Memory)算法對(duì)公眾的情感傾向進(jìn)行建模訓(xùn)練,通過(guò)查準(zhǔn)率、召回率、AUC(Area Under the Curve)等分類評(píng)價(jià)指標(biāo)進(jìn)行比較發(fā)現(xiàn),LSTM算法較支持向量機(jī)算法有較大的提升,能夠達(dá)到預(yù)測(cè)公眾情感傾向的目的;在案件的輿情分析方面,主要從輿情傳播途徑走勢(shì)、評(píng)論用戶信息、評(píng)論內(nèi)容等角度對(duì)案件進(jìn)行統(tǒng)計(jì)分析,總結(jié)...
【文章頁(yè)數(shù)】:55 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
中文摘要
Abstract
第1章 緒論
1.1 研究背景與研究意義
1.1.1 研究背景
1.1.2 研究意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀及發(fā)展趨勢(shì)
1.2.1 國(guó)外研究現(xiàn)狀
1.2.2 國(guó)內(nèi)研究現(xiàn)狀
1.3 論文結(jié)構(gòu)及研究方法
1.3.1 研究方法
1.3.2 論文結(jié)構(gòu)
第2章 相關(guān)理論與技術(shù)
2.1 網(wǎng)絡(luò)爬蟲技術(shù)
2.1.1 網(wǎng)絡(luò)爬蟲框架介紹
2.1.2 網(wǎng)絡(luò)爬蟲技術(shù)介紹
2.2 文本特征提取和關(guān)鍵詞提取技術(shù)
2.2.1 Word2Vec詞向量模型的工作原理
2.2.2 基于TF-IDF的關(guān)鍵詞提取技術(shù)
2.3 基于機(jī)器學(xué)習(xí)的文本分類模型
2.3.1 支持向量機(jī)模型原理
2.3.2 遞歸神經(jīng)網(wǎng)絡(luò)模型原理
2.3.3 長(zhǎng)短期記憶網(wǎng)絡(luò)模型原理
2.4 文本處理技術(shù)
2.4.1 分詞處理方法
2.4.2 停用詞處理
2.4.3 數(shù)據(jù)增強(qiáng)技術(shù)
第3章 基于機(jī)器學(xué)習(xí)的微博情感分析
3.1 微博情感的特征提取
3.1.1 微博情感文本預(yù)處理
3.1.2 基于Word2vec的微博文本特征提取
3.2 基于微博情感文本的情感分類模型
3.2.1 構(gòu)建基于支持向量機(jī)的微博情感分類模型
3.2.2 構(gòu)建基于LSTM的微博情感分類模型
3.3 情感分類模型流程與評(píng)價(jià)指標(biāo)
第4章 李心草溺亡案件分析
4.1 案件背景及過(guò)程介紹
4.2 案件情感分析
4.2.1 數(shù)據(jù)集準(zhǔn)備
4.2.2 數(shù)據(jù)預(yù)處理
4.2.3 關(guān)鍵詞提取結(jié)果
4.2.4 基于模型的案件情感分析
4.3 案件輿情分析
4.3.1 傳播過(guò)程分析
4.3.2 微博評(píng)論博主信息分析
4.3.3 評(píng)論內(nèi)容分析
總結(jié)與展望
參考文獻(xiàn)
致謝
【參考文獻(xiàn)】:
期刊論文
[1]中文文獻(xiàn)引文情感語(yǔ)料庫(kù)構(gòu)建[J]. 徐琳宏,丁堃,陳娜,李冰. 情報(bào)學(xué)報(bào). 2020(01)
[2]CNNIC發(fā)布第44次《中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》[J]. 于朝暉. 網(wǎng)信軍民融合. 2019(09)
[3]基于文本情感分析的文化綜藝節(jié)目綜合評(píng)價(jià)——以央視文化類綜藝節(jié)目《國(guó)家寶藏》為例[J]. 周娜,何潤(rùn)奇. 中南民族大學(xué)學(xué)報(bào)(人文社會(huì)科學(xué)版). 2019(05)
[4]基于微博的細(xì)粒度情感分析[J]. 敦欣卉,張?jiān)魄?楊鎧西. 數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn). 2017(07)
[5]在線中文用戶評(píng)論研究綜述:基于情感計(jì)算的視角[J]. 吳應(yīng)良,黃媛,王選飛. 情報(bào)科學(xué). 2017(06)
[6]一種基于改進(jìn)的TF-IDF和支持向量機(jī)的中文文本分類研究[J]. 郭太勇. 軟件. 2016(12)
[7]Mining microblog user interests based on TextRank with TF-IDF factor[J]. Tu Shouzhong,Huang Minlie. The Journal of China Universities of Posts and Telecommunications. 2016(05)
[8]基于Word2Vec的一種文檔向量表示[J]. 唐明,朱磊,鄒顯春. 計(jì)算機(jī)科學(xué). 2016(06)
[9]基于字符串匹配的中文分詞算法的研究[J]. 常建秋,沈煒. 工業(yè)控制計(jì)算機(jī). 2016(02)
[10]一種基于類別不平衡數(shù)據(jù)的層次分類模型[J]. 施培蓓,劉貴全,汪中,衛(wèi)兵. 中國(guó)科學(xué)技術(shù)大學(xué)學(xué)報(bào). 2015(01)
碩士論文
[1]基于深度學(xué)習(xí)的微博短文本情感傾向分析[D]. 李維森.湘潭大學(xué) 2019
[2]危機(jī)傳播視角下事故災(zāi)難事件微博輿情引導(dǎo)研究[D]. 喬田.長(zhǎng)春工業(yè)大學(xué) 2019
[3]基于分類模型的電商用戶復(fù)購(gòu)行為預(yù)測(cè)研究[D]. 杜世民.杭州師范大學(xué) 2019
[4]基于深度學(xué)習(xí)的用戶評(píng)論情感分析[D]. 鄭爽.重慶郵電大學(xué) 2019
[5]政法系統(tǒng)突發(fā)事件網(wǎng)絡(luò)輿情應(yīng)對(duì)機(jī)制研究[D]. 賈佳轄.中央民族大學(xué) 2019
[6]基于生成對(duì)抗網(wǎng)絡(luò)的中文語(yǔ)言模型數(shù)據(jù)增強(qiáng)技術(shù)[D]. 趙鵬飛.哈爾濱工業(yè)大學(xué) 2018
[7]基于Selenium的一種Web自動(dòng)化測(cè)試系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 張競(jìng)帆.北京交通大學(xué) 2017
[8]基于統(tǒng)計(jì)方法的中文文本分類[D]. 殷越.華中師范大學(xué) 2017
[9]基于Scrapy的分布式網(wǎng)絡(luò)新聞抓取系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D]. 馬聯(lián)帥.西安電子科技大學(xué) 2015
[10]基于文本數(shù)據(jù)挖掘的微博情感分析與監(jiān)控系統(tǒng)[D]. 繆茹一.浙江工業(yè)大學(xué) 2015
本文編號(hào):3728731
【文章頁(yè)數(shù)】:55 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
中文摘要
Abstract
第1章 緒論
1.1 研究背景與研究意義
1.1.1 研究背景
1.1.2 研究意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀及發(fā)展趨勢(shì)
1.2.1 國(guó)外研究現(xiàn)狀
1.2.2 國(guó)內(nèi)研究現(xiàn)狀
1.3 論文結(jié)構(gòu)及研究方法
1.3.1 研究方法
1.3.2 論文結(jié)構(gòu)
第2章 相關(guān)理論與技術(shù)
2.1 網(wǎng)絡(luò)爬蟲技術(shù)
2.1.1 網(wǎng)絡(luò)爬蟲框架介紹
2.1.2 網(wǎng)絡(luò)爬蟲技術(shù)介紹
2.2 文本特征提取和關(guān)鍵詞提取技術(shù)
2.2.1 Word2Vec詞向量模型的工作原理
2.2.2 基于TF-IDF的關(guān)鍵詞提取技術(shù)
2.3 基于機(jī)器學(xué)習(xí)的文本分類模型
2.3.1 支持向量機(jī)模型原理
2.3.2 遞歸神經(jīng)網(wǎng)絡(luò)模型原理
2.3.3 長(zhǎng)短期記憶網(wǎng)絡(luò)模型原理
2.4 文本處理技術(shù)
2.4.1 分詞處理方法
2.4.2 停用詞處理
2.4.3 數(shù)據(jù)增強(qiáng)技術(shù)
第3章 基于機(jī)器學(xué)習(xí)的微博情感分析
3.1 微博情感的特征提取
3.1.1 微博情感文本預(yù)處理
3.1.2 基于Word2vec的微博文本特征提取
3.2 基于微博情感文本的情感分類模型
3.2.1 構(gòu)建基于支持向量機(jī)的微博情感分類模型
3.2.2 構(gòu)建基于LSTM的微博情感分類模型
3.3 情感分類模型流程與評(píng)價(jià)指標(biāo)
第4章 李心草溺亡案件分析
4.1 案件背景及過(guò)程介紹
4.2 案件情感分析
4.2.1 數(shù)據(jù)集準(zhǔn)備
4.2.2 數(shù)據(jù)預(yù)處理
4.2.3 關(guān)鍵詞提取結(jié)果
4.2.4 基于模型的案件情感分析
4.3 案件輿情分析
4.3.1 傳播過(guò)程分析
4.3.2 微博評(píng)論博主信息分析
4.3.3 評(píng)論內(nèi)容分析
總結(jié)與展望
參考文獻(xiàn)
致謝
【參考文獻(xiàn)】:
期刊論文
[1]中文文獻(xiàn)引文情感語(yǔ)料庫(kù)構(gòu)建[J]. 徐琳宏,丁堃,陳娜,李冰. 情報(bào)學(xué)報(bào). 2020(01)
[2]CNNIC發(fā)布第44次《中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》[J]. 于朝暉. 網(wǎng)信軍民融合. 2019(09)
[3]基于文本情感分析的文化綜藝節(jié)目綜合評(píng)價(jià)——以央視文化類綜藝節(jié)目《國(guó)家寶藏》為例[J]. 周娜,何潤(rùn)奇. 中南民族大學(xué)學(xué)報(bào)(人文社會(huì)科學(xué)版). 2019(05)
[4]基于微博的細(xì)粒度情感分析[J]. 敦欣卉,張?jiān)魄?楊鎧西. 數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn). 2017(07)
[5]在線中文用戶評(píng)論研究綜述:基于情感計(jì)算的視角[J]. 吳應(yīng)良,黃媛,王選飛. 情報(bào)科學(xué). 2017(06)
[6]一種基于改進(jìn)的TF-IDF和支持向量機(jī)的中文文本分類研究[J]. 郭太勇. 軟件. 2016(12)
[7]Mining microblog user interests based on TextRank with TF-IDF factor[J]. Tu Shouzhong,Huang Minlie. The Journal of China Universities of Posts and Telecommunications. 2016(05)
[8]基于Word2Vec的一種文檔向量表示[J]. 唐明,朱磊,鄒顯春. 計(jì)算機(jī)科學(xué). 2016(06)
[9]基于字符串匹配的中文分詞算法的研究[J]. 常建秋,沈煒. 工業(yè)控制計(jì)算機(jī). 2016(02)
[10]一種基于類別不平衡數(shù)據(jù)的層次分類模型[J]. 施培蓓,劉貴全,汪中,衛(wèi)兵. 中國(guó)科學(xué)技術(shù)大學(xué)學(xué)報(bào). 2015(01)
碩士論文
[1]基于深度學(xué)習(xí)的微博短文本情感傾向分析[D]. 李維森.湘潭大學(xué) 2019
[2]危機(jī)傳播視角下事故災(zāi)難事件微博輿情引導(dǎo)研究[D]. 喬田.長(zhǎng)春工業(yè)大學(xué) 2019
[3]基于分類模型的電商用戶復(fù)購(gòu)行為預(yù)測(cè)研究[D]. 杜世民.杭州師范大學(xué) 2019
[4]基于深度學(xué)習(xí)的用戶評(píng)論情感分析[D]. 鄭爽.重慶郵電大學(xué) 2019
[5]政法系統(tǒng)突發(fā)事件網(wǎng)絡(luò)輿情應(yīng)對(duì)機(jī)制研究[D]. 賈佳轄.中央民族大學(xué) 2019
[6]基于生成對(duì)抗網(wǎng)絡(luò)的中文語(yǔ)言模型數(shù)據(jù)增強(qiáng)技術(shù)[D]. 趙鵬飛.哈爾濱工業(yè)大學(xué) 2018
[7]基于Selenium的一種Web自動(dòng)化測(cè)試系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 張競(jìng)帆.北京交通大學(xué) 2017
[8]基于統(tǒng)計(jì)方法的中文文本分類[D]. 殷越.華中師范大學(xué) 2017
[9]基于Scrapy的分布式網(wǎng)絡(luò)新聞抓取系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D]. 馬聯(lián)帥.西安電子科技大學(xué) 2015
[10]基于文本數(shù)據(jù)挖掘的微博情感分析與監(jiān)控系統(tǒng)[D]. 繆茹一.浙江工業(yè)大學(xué) 2015
本文編號(hào):3728731
本文鏈接:http://www.sikaile.net/xinwenchuanbolunwen/3728731.html
最近更新
教材專著