天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 軟件論文 >

互聯(lián)網(wǎng)輿情監(jiān)控系統(tǒng)的關(guān)鍵技術(shù)研究與實(shí)現(xiàn)

發(fā)布時(shí)間:2017-08-16 07:21

  本文關(guān)鍵詞:互聯(lián)網(wǎng)輿情監(jiān)控系統(tǒng)的關(guān)鍵技術(shù)研究與實(shí)現(xiàn)


  更多相關(guān)文章: 互聯(lián)網(wǎng) 輿情監(jiān)控 微博 未登錄詞 文本聚類(lèi)


【摘要】:基于互聯(lián)網(wǎng)的輿情分析已被廣泛應(yīng)用,但隨著新的交流平臺(tái)的出現(xiàn),互聯(lián)網(wǎng)輿情分析也在不斷的擴(kuò)充與完善。如今互聯(lián)網(wǎng)輿情監(jiān)控已經(jīng)覆蓋到微博、微信、論壇、博客、貼吧、新聞等各個(gè)方面。微博作為近年來(lái)最流行的網(wǎng)絡(luò)社交工具之一,其傳播快、互動(dòng)性強(qiáng)等特點(diǎn),已發(fā)展為重要的互聯(lián)網(wǎng)信息交流共享平臺(tái)。目前微博輿情監(jiān)控尚存在一些不足之處,本文著重從微博出發(fā),對(duì)微博輿情監(jiān)控相關(guān)技術(shù)進(jìn)行分析與研究。本論文的主要研究工作及研究成果如下:針對(duì)微博短文本的特點(diǎn),分析了微博短文本信息預(yù)處理方案,并對(duì)微博中的“未登錄詞”進(jìn)行識(shí)別。根據(jù)微博文本的特殊形式,提取微博話(huà)題內(nèi)文本,經(jīng)過(guò)過(guò)濾并計(jì)算互信息值等步驟識(shí)別微博新詞。建立未登錄詞詞庫(kù),從而提高微博文本分詞效果。對(duì)傳統(tǒng)輿情監(jiān)控中所涉及到的相關(guān)理論和技術(shù)進(jìn)行了研究,對(duì)比傳統(tǒng)文本與微博短文本之間的差異。深入分析傳統(tǒng)文本聚類(lèi)算法在微博短文本聚類(lèi)中的局限性,借助VSM向量空間模型和LDA文檔主題生成模型對(duì)K-means聚類(lèi)算法性能進(jìn)行優(yōu)化,優(yōu)化了K-means初始中心的確立方法和文本相似度計(jì)算公式,提高了聚類(lèi)的準(zhǔn)確率。互聯(lián)網(wǎng)媒體早已深入廣大人民的日常生活中,網(wǎng)友的高度活躍導(dǎo)致對(duì)國(guó)內(nèi)外任何熱點(diǎn)事件都能立馬產(chǎn)生輿情。在給人們的交流帶來(lái)了巨大的方便的同時(shí),也已經(jīng)成為了社會(huì)輿情傳播的重要載體。因此,輿情監(jiān)測(cè)對(duì)于國(guó)家政府及網(wǎng)絡(luò)監(jiān)管部門(mén)來(lái)說(shuō)是十分必要的。
【關(guān)鍵詞】:互聯(lián)網(wǎng) 輿情監(jiān)控 微博 未登錄詞 文本聚類(lèi)
【學(xué)位授予單位】:東華理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類(lèi)號(hào)】:TP391.1
【目錄】:
  • 摘要4-5
  • Abstract5-9
  • 第一章 緒論9-13
  • 1.1 課題背景及研究意義9-10
  • 1.1.1 輿情概述9
  • 1.1.2 研究的目的和意義9-10
  • 1.2 國(guó)內(nèi)外研究現(xiàn)狀10-11
  • 1.3 學(xué)位論文的主要內(nèi)容11-13
  • 第二章 相關(guān)理論與技術(shù)研究13-29
  • 2.1 輿情監(jiān)控技術(shù)框架13-15
  • 2.1.1 輿情監(jiān)控系統(tǒng)概述13
  • 2.1.2 系統(tǒng)框架結(jié)構(gòu)13-14
  • 2.1.3 輿情監(jiān)控系統(tǒng)關(guān)鍵技術(shù)14-15
  • 2.1.4 輿情監(jiān)控系統(tǒng)存在的問(wèn)題15
  • 2.2 微博Web文本信息獲取技術(shù)15-17
  • 2.2.1 基于網(wǎng)絡(luò)爬蟲(chóng)的數(shù)據(jù)獲取技術(shù)15-17
  • 2.2.2 基于微博開(kāi)放平臺(tái)的數(shù)據(jù)獲取技術(shù)17
  • 2.3 中文分詞技術(shù)17-18
  • 2.4 特征降維18-21
  • 2.4.1 特征選擇18-20
  • 2.4.2 特征權(quán)重計(jì)算20-21
  • 2.5 文本表示21-24
  • 2.5.1 空間向量模型21-23
  • 2.5.2 布爾模型23-24
  • 2.5.3 概率模型24
  • 2.5.4 語(yǔ)言模型24
  • 2.6 相似度計(jì)算24-25
  • 2.7 文本聚類(lèi)的主要方法25-28
  • 2.8 本章小結(jié)28-29
  • 第三章 微博文本預(yù)處理及未登錄詞識(shí)別29-39
  • 3.1 短文本數(shù)據(jù)特點(diǎn)分析29
  • 3.2 微博短文本預(yù)處理29-32
  • 3.2.1 符號(hào)預(yù)處理30-31
  • 3.2.2 中文分詞31-32
  • 3.3 未登錄詞識(shí)別算法32-36
  • 3.3.1 未登錄詞識(shí)別32-33
  • 3.3.2 微博未登錄詞識(shí)別算法33-36
  • 3.4 實(shí)驗(yàn)與結(jié)果分析36-38
  • 3.4.1 實(shí)驗(yàn)環(huán)境36
  • 3.4.2 數(shù)據(jù)采集36
  • 3.4.3 實(shí)驗(yàn)結(jié)果36-37
  • 3.4.4 結(jié)果分析37-38
  • 3.5 本章小結(jié)38-39
  • 第四章 微博短文本聚類(lèi)技術(shù)研究與優(yōu)化39-55
  • 4.1 向量空間模型39-40
  • 4.2 文檔主題生成模型40-42
  • 4.3 基于LDA的傳統(tǒng)K-means算法42-44
  • 4.3.1 算法思想描述43-44
  • 4.3.2 存在的局限44
  • 4.4 優(yōu)化的K-means算法44-48
  • 4.4.1 初始中心的確定優(yōu)化45-46
  • 4.4.2 文本相似度計(jì)算優(yōu)化46-47
  • 4.4.3 整體優(yōu)化的K-means聚類(lèi)算法47-48
  • 4.5 實(shí)驗(yàn)與結(jié)果分析48-53
  • 4.5.1 實(shí)驗(yàn)環(huán)境48
  • 4.5.2 文本聚類(lèi)評(píng)價(jià)標(biāo)準(zhǔn)48-49
  • 4.5.3 實(shí)驗(yàn)相關(guān)參數(shù)設(shè)定49-51
  • 4.5.4 微博文本聚類(lèi)結(jié)果與分析51-53
  • 4.6 本章小結(jié)53-55
  • 第五章 輿情監(jiān)控系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)55-67
  • 5.1 系統(tǒng)總體設(shè)計(jì)55-57
  • 5.1.1 系統(tǒng)需求分析55
  • 5.1.2 系統(tǒng)設(shè)計(jì)目標(biāo)55-57
  • 5.2 功能模塊詳細(xì)設(shè)計(jì)與實(shí)現(xiàn)57-63
  • 5.2.1 數(shù)據(jù)采集模塊57-59
  • 5.2.2 文本預(yù)處理59-60
  • 5.2.3 短文本聚類(lèi)60
  • 5.2.4 微博輿情分析模塊60-63
  • 5.3 系統(tǒng)功能描述63-65
  • 5.3.1 系統(tǒng)設(shè)置63-64
  • 5.3.2 數(shù)據(jù)采集64
  • 5.3.3 監(jiān)控設(shè)置64-65
  • 5.3.4 門(mén)戶(hù)管理65
  • 5.4 本章小結(jié)65-67
  • 第六章 總結(jié)與展望67-69
  • 6.1 總結(jié)67
  • 6.2 展望67-69
  • 致謝69-71
  • 參考文獻(xiàn)71-73

【參考文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條

1 于海歡;;大數(shù)據(jù)時(shí)代的網(wǎng)絡(luò)輿情管理和應(yīng)對(duì)[J];視聽(tīng);2016年02期

2 王雨;;事業(yè)單位財(cái)務(wù)管理的科學(xué)化與精細(xì)化趨勢(shì)分析[J];價(jià)值工程;2016年04期

3 吳青林;周天宏;;基于話(huà)題聚類(lèi)及情感強(qiáng)度的中文微博輿情分析[J];情報(bào)理論與實(shí)踐;2016年01期

4 李玲;劉華文;徐曉丹;趙建民;;基于信息增益的多標(biāo)簽特征選擇算法[J];計(jì)算機(jī)科學(xué);2015年07期

5 潘舒;祁云嵩;;多重假設(shè)檢驗(yàn)及其在大數(shù)據(jù)特征降維中的應(yīng)用[J];計(jì)算機(jī)科學(xué);2015年S1期

6 崔保國(guó);何丹嵋;;互聯(lián)網(wǎng)驅(qū)動(dòng)傳媒產(chǎn)業(yè)增長(zhǎng)——2014年中國(guó)傳媒產(chǎn)業(yè)發(fā)展報(bào)告[J];中國(guó)報(bào)業(yè);2015年11期

7 劉晉勝;;基于平均互信息的混合條件屬性聚類(lèi)算法[J];計(jì)算機(jī)科學(xué);2015年03期

8 李綱;王丹丹;;社交網(wǎng)站用戶(hù)個(gè)人信息披露意愿影響因素研究——以新浪微博為例[J];情報(bào)資料工作;2015年01期

9 徐濤;于洪志;加羊吉;;基于改進(jìn)卡方統(tǒng)計(jì)量的藏文文本表示方法[J];計(jì)算機(jī)工程;2014年06期

10 丁兆云;賈焰;周斌;;微博數(shù)據(jù)挖掘研究綜述[J];計(jì)算機(jī)研究與發(fā)展;2014年04期

中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前1條

1 董堅(jiān)峰;面向公共危機(jī)預(yù)警的網(wǎng)絡(luò)輿情分析研究[D];武漢大學(xué);2013年

中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條

1 鄒妍;網(wǎng)絡(luò)輿情監(jiān)控與分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];吉林大學(xué);2015年

2 佟林;基于Hadoop平臺(tái)的網(wǎng)絡(luò)輿情分析系統(tǒng)的研究與實(shí)現(xiàn)[D];吉林大學(xué);2015年

3 傅饒;基于中文分詞的輿情監(jiān)控系統(tǒng)分析模塊的設(shè)計(jì)與實(shí)現(xiàn)[D];南京大學(xué);2015年

4 賀偉;互聯(lián)網(wǎng)輿情監(jiān)控軟件的設(shè)計(jì)開(kāi)發(fā)[D];華南理工大學(xué);2015年

5 姜朋;山東大學(xué)輿情分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];山東大學(xué);2015年

6 劉峰;基于數(shù)據(jù)挖掘技術(shù)的輿情監(jiān)控系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2015年

7 高天宏;互聯(lián)網(wǎng)輿情分析中信息采集技術(shù)的研究與設(shè)計(jì)[D];北京郵電大學(xué);2015年

8 馮金剛;網(wǎng)絡(luò)輿情中文信息情感傾向分析研究[D];華北電力大學(xué);2015年

9 毛立鵬;互聯(lián)網(wǎng)輿情監(jiān)控分析系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];西安電子科技大學(xué);2014年

10 郭永輝;面向短文本分類(lèi)的特征擴(kuò)展方法[D];哈爾濱工業(yè)大學(xué);2013年

,

本文編號(hào):682020

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/682020.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)6772f***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com