高校網(wǎng)絡輿情監(jiān)控系統(tǒng)設計與實現(xiàn)
發(fā)布時間:2021-09-03 12:06
隨著互聯(lián)網(wǎng)的應用日益普及化,互聯(lián)網(wǎng)平臺已經(jīng)成為高校在校生發(fā)表意見、溝通交流的主要平臺。大學生利用互聯(lián)網(wǎng)形成的網(wǎng)絡輿論群,對社會輿論的產(chǎn)生和傳播有著越來越重要的影響,已經(jīng)到了必須加強監(jiān)管的地步。本文根據(jù)當前需要加強對高校網(wǎng)絡言論進行監(jiān)管的現(xiàn)實需求,設計了基于互聯(lián)網(wǎng)的高校輿情分析系統(tǒng),通過對網(wǎng)絡輿論的動態(tài)監(jiān)測,實現(xiàn)對網(wǎng)絡輿情的有效監(jiān)管和正確引導。在對互聯(lián)網(wǎng)輿情分析系統(tǒng)研究開發(fā)的現(xiàn)狀進行了分析和總結(jié)、對若干輿情分析系統(tǒng)的關鍵技術(shù)分析的基礎上,針對高;ヂ(lián)網(wǎng)輿情分析系統(tǒng)建設的實際需求,本文開展了以下幾方面的工作:1.針對高校對網(wǎng)絡輿情的監(jiān)測需求做了認真的分析,根據(jù)分析的結(jié)果,對輿情監(jiān)控系統(tǒng)的架構(gòu)進行了整體設計。具體地,按照功能需求分析結(jié)果,完成了各個模塊的設計,將系統(tǒng)分成四大模塊:采集模塊、預處理模塊、分析模塊和管理模塊。以SQLServer作為后臺數(shù)據(jù)庫,完成了相應的輿情信息數(shù)據(jù)庫設計。2.研究并實現(xiàn)了輿情信息預處理、輿情分析算法,包括網(wǎng)頁去噪、文本聚類和分類、中文分詞、話題識別等。針對高校網(wǎng)絡輿情中所表達的情感問題,構(gòu)建了情感詞典,研究和實現(xiàn)了基于情感本體的的情感傾向性判別算法。3.采用J...
【文章來源】:南京理工大學江蘇省 211工程院校
【文章頁數(shù)】:69 頁
【學位級別】:碩士
【部分圖文】:
圖2.1通用網(wǎng)絡爬蟲工作流程圖??通用網(wǎng)絡爬蟲的局限性是:由于爬取的網(wǎng)絡覆蓋范圍很大,往往會抓取大量價值不??
爬取下載相關頁面。爬蟲爬取到頁面后,利用自己的解析器,對頁面執(zhí)行去噪操作(如??除去URL標記),執(zhí)行分詞和提取摘要,形成摘要文本,保存到數(shù)據(jù)庫中。同時提取頁??面中URL,保存到URL列表中。其工作流程圖如圖2.1所示。??<準備>???^?r_???初始URL??!??!???^?[???@取網(wǎng)頁???^?r???|提取新URL放人丨??[?URL隊列?1??N?? ̄二止操作¥>??圖2.1通用網(wǎng)絡爬蟲工作流程圖??通用網(wǎng)絡爬蟲的局限性是:由于爬取的網(wǎng)絡覆蓋范圍很大,往往會抓取大量價值不??高的網(wǎng)頁。信息含量大、具有一定結(jié)構(gòu)的數(shù)據(jù)不能被很好地獲取,也難以實現(xiàn)語義信息??的獲取。總體來說,通用網(wǎng)絡爬蟲在網(wǎng)頁爬取的數(shù)量、質(zhì)量和實效性方面難以做到兼顧。??主題爬蟲,根據(jù)既定的主題目標,有選擇的爬取與主題相關的頁面,因而爬取的信??息更為準確。主題爬蟲需要解決的關鍵問題:如何判定抓取的頁面與主題相關,如果過??濾到與主題不相關的頁面。主題爬蟲的爬取過程如圖2.2所示。??8??
Web頁面中含有大量的超文本標記(即HTML標記),正是這些標記使文檔在瀏覽??器中顯示了不同的格式和風格,這些標記具有一定的層次結(jié)構(gòu),也使得Web頁面具有??一定的層次結(jié)構(gòu),我們可以利用這種層次性構(gòu)建一個樹,成為DOM樹,如圖2.3所示。??在DOM樹中,根是Documents,即文檔,這也是網(wǎng)頁解析工具的入口處。DOM樹中每??一個節(jié)點代表一個對象,由于對象眾多,類型不同,所以解析工具需要多模型的分析方??法。在網(wǎng)頁分析模型中,除了節(jié)點概念,還有如下概念:??文本節(jié)點(Text?Node):該節(jié)點的功能是處理文檔中的文本。??兀素(Element):?Node的子對象,繼承于節(jié)點Node。??文檔??<html>??,??I??,??1?|?|?I??<head>?<body>??1?I?I??title?<hl>?<div>??最簡單的DOM樹結(jié)構(gòu)模型?DOM樹結(jié)構(gòu)?<a>????DOM樹結(jié)構(gòu)?屬性:href??圖2.3?Dom樹結(jié)構(gòu)??HtmlParser是一個比較流行的頁面解析程序,它由Java編寫,用來對html文檔進行??解析。它不僅可以提取文檔中鏈接
【參考文獻】:
期刊論文
[1]基于情感維度的大數(shù)據(jù)網(wǎng)絡輿情情感傾向性分析研究——以“南昌大學自主保潔”微博輿情事件為例[J]. 王英,龔花萍. 情報科學. 2017(04)
[2]高職院校學生輿情監(jiān)測工作機制的探索與研究——以浙江建設職業(yè)技術(shù)學院為例[J]. 朱婧. 教育教學論壇. 2016(29)
[3]校園網(wǎng)絡輿情的監(jiān)督、預警、干預和引導機制研究——以福建地區(qū)高職院校為例[J]. 鄒禹涵,蔡雪敏,張智佳. 湖北函授大學學報. 2016(12)
[4]基于微博的情感傾向性分析方法研究[J]. 高凱,李思雨,阮冬茹,劉邵博,周二亮,喬世權(quán). 中文信息學報. 2015(04)
[5]基于網(wǎng)絡爬蟲技術(shù)的輿情數(shù)據(jù)采集系統(tǒng)設計與實現(xiàn)[J]. 張明杰. 現(xiàn)代計算機(專業(yè)版). 2015(18)
[6]一種基于HowNet的詞語語義相似度計算方法[J]. 范弘屹,張仰森. 北京信息科技大學學報(自然科學版). 2014(04)
[7]基于雙語信息和標簽傳播算法的中文情感詞典構(gòu)建方法[J]. 李壽山,李逸薇,黃居仁,蘇艷. 中文信息學報. 2013(06)
[8]高校網(wǎng)絡輿情監(jiān)測關鍵技術(shù)研究[J]. 吳曉倩,陳誠. 電腦知識與技術(shù). 2013(16)
[9]基于主題發(fā)現(xiàn)的輿情分析系統(tǒng)的設計與實現(xiàn)[J]. 黃美璇. 北京聯(lián)合大學學報(自然科學版). 2012(01)
[10]面向Web論壇的網(wǎng)絡信息獲取技術(shù)及系統(tǒng)實現(xiàn)[J]. 彭冬,蔡皖東. 計算機工程與科學. 2011(01)
碩士論文
[1]網(wǎng)絡輿情監(jiān)控與分析系統(tǒng)的設計與實現(xiàn)[D]. 鄒妍.吉林大學 2015
[2]校園輿情分析中的意見挖掘技術(shù)研究[D]. 羅晶.東南大學 2015
[3]高職院校校園危機預警機制研究[D]. 仲臻.西北農(nóng)林科技大學 2014
[4]基于高校BBS的輿情監(jiān)測系統(tǒng)的研究與實現(xiàn)[D]. 劉曉飛.石家莊鐵道大學 2013
[5]BBS準實時輿情監(jiān)測技術(shù)研究與實現(xiàn)[D]. 欒文娟.華中科技大學 2012
[6]中文分詞算法的研究與實現(xiàn)[D]. 林冬盛.西北大學 2011
[7]互聯(lián)網(wǎng)教育輿情監(jiān)測系統(tǒng)的設計與實現(xiàn)[D]. 王培順.華中師范大學 2011
[8]基于Web輿情的意見挖掘關鍵技術(shù)研究[D]. 衛(wèi)偉.電子科技大學 2011
[9]基于樸素貝葉斯的中文文本情感傾向分類研究[D]. 楊鼎.湖南工業(yè)大學 2010
[10]高校BBS輿情研究[D]. 吳迪.中央民族大學 2010
本文編號:3381081
【文章來源】:南京理工大學江蘇省 211工程院校
【文章頁數(shù)】:69 頁
【學位級別】:碩士
【部分圖文】:
圖2.1通用網(wǎng)絡爬蟲工作流程圖??通用網(wǎng)絡爬蟲的局限性是:由于爬取的網(wǎng)絡覆蓋范圍很大,往往會抓取大量價值不??
爬取下載相關頁面。爬蟲爬取到頁面后,利用自己的解析器,對頁面執(zhí)行去噪操作(如??除去URL標記),執(zhí)行分詞和提取摘要,形成摘要文本,保存到數(shù)據(jù)庫中。同時提取頁??面中URL,保存到URL列表中。其工作流程圖如圖2.1所示。??<準備>???^?r_???初始URL??!??!???^?[???@取網(wǎng)頁???^?r???|提取新URL放人丨??[?URL隊列?1??N?? ̄二止操作¥>??圖2.1通用網(wǎng)絡爬蟲工作流程圖??通用網(wǎng)絡爬蟲的局限性是:由于爬取的網(wǎng)絡覆蓋范圍很大,往往會抓取大量價值不??高的網(wǎng)頁。信息含量大、具有一定結(jié)構(gòu)的數(shù)據(jù)不能被很好地獲取,也難以實現(xiàn)語義信息??的獲取。總體來說,通用網(wǎng)絡爬蟲在網(wǎng)頁爬取的數(shù)量、質(zhì)量和實效性方面難以做到兼顧。??主題爬蟲,根據(jù)既定的主題目標,有選擇的爬取與主題相關的頁面,因而爬取的信??息更為準確。主題爬蟲需要解決的關鍵問題:如何判定抓取的頁面與主題相關,如果過??濾到與主題不相關的頁面。主題爬蟲的爬取過程如圖2.2所示。??8??
Web頁面中含有大量的超文本標記(即HTML標記),正是這些標記使文檔在瀏覽??器中顯示了不同的格式和風格,這些標記具有一定的層次結(jié)構(gòu),也使得Web頁面具有??一定的層次結(jié)構(gòu),我們可以利用這種層次性構(gòu)建一個樹,成為DOM樹,如圖2.3所示。??在DOM樹中,根是Documents,即文檔,這也是網(wǎng)頁解析工具的入口處。DOM樹中每??一個節(jié)點代表一個對象,由于對象眾多,類型不同,所以解析工具需要多模型的分析方??法。在網(wǎng)頁分析模型中,除了節(jié)點概念,還有如下概念:??文本節(jié)點(Text?Node):該節(jié)點的功能是處理文檔中的文本。??兀素(Element):?Node的子對象,繼承于節(jié)點Node。??文檔??<html>??,??I??,??1?|?|?I??<head>?<body>??1?I?I??title?<hl>?<div>??最簡單的DOM樹結(jié)構(gòu)模型?DOM樹結(jié)構(gòu)?<a>????DOM樹結(jié)構(gòu)?屬性:href??圖2.3?Dom樹結(jié)構(gòu)??HtmlParser是一個比較流行的頁面解析程序,它由Java編寫,用來對html文檔進行??解析。它不僅可以提取文檔中鏈接
【參考文獻】:
期刊論文
[1]基于情感維度的大數(shù)據(jù)網(wǎng)絡輿情情感傾向性分析研究——以“南昌大學自主保潔”微博輿情事件為例[J]. 王英,龔花萍. 情報科學. 2017(04)
[2]高職院校學生輿情監(jiān)測工作機制的探索與研究——以浙江建設職業(yè)技術(shù)學院為例[J]. 朱婧. 教育教學論壇. 2016(29)
[3]校園網(wǎng)絡輿情的監(jiān)督、預警、干預和引導機制研究——以福建地區(qū)高職院校為例[J]. 鄒禹涵,蔡雪敏,張智佳. 湖北函授大學學報. 2016(12)
[4]基于微博的情感傾向性分析方法研究[J]. 高凱,李思雨,阮冬茹,劉邵博,周二亮,喬世權(quán). 中文信息學報. 2015(04)
[5]基于網(wǎng)絡爬蟲技術(shù)的輿情數(shù)據(jù)采集系統(tǒng)設計與實現(xiàn)[J]. 張明杰. 現(xiàn)代計算機(專業(yè)版). 2015(18)
[6]一種基于HowNet的詞語語義相似度計算方法[J]. 范弘屹,張仰森. 北京信息科技大學學報(自然科學版). 2014(04)
[7]基于雙語信息和標簽傳播算法的中文情感詞典構(gòu)建方法[J]. 李壽山,李逸薇,黃居仁,蘇艷. 中文信息學報. 2013(06)
[8]高校網(wǎng)絡輿情監(jiān)測關鍵技術(shù)研究[J]. 吳曉倩,陳誠. 電腦知識與技術(shù). 2013(16)
[9]基于主題發(fā)現(xiàn)的輿情分析系統(tǒng)的設計與實現(xiàn)[J]. 黃美璇. 北京聯(lián)合大學學報(自然科學版). 2012(01)
[10]面向Web論壇的網(wǎng)絡信息獲取技術(shù)及系統(tǒng)實現(xiàn)[J]. 彭冬,蔡皖東. 計算機工程與科學. 2011(01)
碩士論文
[1]網(wǎng)絡輿情監(jiān)控與分析系統(tǒng)的設計與實現(xiàn)[D]. 鄒妍.吉林大學 2015
[2]校園輿情分析中的意見挖掘技術(shù)研究[D]. 羅晶.東南大學 2015
[3]高職院校校園危機預警機制研究[D]. 仲臻.西北農(nóng)林科技大學 2014
[4]基于高校BBS的輿情監(jiān)測系統(tǒng)的研究與實現(xiàn)[D]. 劉曉飛.石家莊鐵道大學 2013
[5]BBS準實時輿情監(jiān)測技術(shù)研究與實現(xiàn)[D]. 欒文娟.華中科技大學 2012
[6]中文分詞算法的研究與實現(xiàn)[D]. 林冬盛.西北大學 2011
[7]互聯(lián)網(wǎng)教育輿情監(jiān)測系統(tǒng)的設計與實現(xiàn)[D]. 王培順.華中師范大學 2011
[8]基于Web輿情的意見挖掘關鍵技術(shù)研究[D]. 衛(wèi)偉.電子科技大學 2011
[9]基于樸素貝葉斯的中文文本情感傾向分類研究[D]. 楊鼎.湖南工業(yè)大學 2010
[10]高校BBS輿情研究[D]. 吳迪.中央民族大學 2010
本文編號:3381081
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/3381081.html
最近更新
教材專著