天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

突發(fā)事件微博新話題檢測(cè)與跟蹤系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)

發(fā)布時(shí)間:2018-07-16 10:07
【摘要】:相對(duì)于傳統(tǒng)的新聞媒體,微博以其簡(jiǎn)短快速便捷的特性迅速成為傳遞公眾話題信息的媒介,并成長(zhǎng)為人們獲取與發(fā)布信息的主要渠道之一。目前,各類微博平臺(tái)已經(jīng)積累了大量的用戶使用群體,并且其每天的信息發(fā)布量巨大。因此,基于話題檢測(cè)與跟蹤的研究也開始從傳統(tǒng)新聞?lì)I(lǐng)域向微博平臺(tái)進(jìn)行轉(zhuǎn)移。而突發(fā)事件的發(fā)生關(guān)乎國(guó)家安全與社會(huì)穩(wěn)定,這使得針對(duì)各類突發(fā)事件的話題檢測(cè)與跟蹤在應(yīng)對(duì)災(zāi)害事故和進(jìn)行危機(jī)處理有著顯著而重要的意義。本文著眼于微博平臺(tái),使用話題檢測(cè)技術(shù)挖掘突發(fā)事件中相關(guān)的話題信息,并以此基礎(chǔ)進(jìn)行微博網(wǎng)絡(luò)話題傳播方式的建模研究。 本文采用理論與實(shí)踐相結(jié)合的研究方法,分別從國(guó)內(nèi)外研究現(xiàn)狀調(diào)研,微博數(shù)據(jù)采集,話題檢測(cè)以及突發(fā)事件微博傳播網(wǎng)絡(luò)建模四個(gè)方面依次展開。首先基于國(guó)內(nèi)外研究在數(shù)據(jù)挖掘、復(fù)雜網(wǎng)絡(luò)等方面已有的技術(shù)優(yōu)勢(shì)和研究成果,通過密切關(guān)注國(guó)內(nèi)外相關(guān)研究的最新動(dòng)態(tài),提出本文在突發(fā)事件的微博新話題檢測(cè)與跟蹤領(lǐng)域可以補(bǔ)充或創(chuàng)新的論點(diǎn)。其次,在新浪微博上采集用于微博話題研究的數(shù)據(jù)集,包括設(shè)計(jì)針對(duì)微博平臺(tái)的爬蟲程序,以及對(duì)其數(shù)據(jù)進(jìn)行提取、預(yù)處理并存入數(shù)據(jù)庫(kù)等操作。再次,在完成數(shù)據(jù)信息收集的基礎(chǔ)上,檢測(cè)微博中突發(fā)事件的相關(guān)話題。但由于微博內(nèi)容的簡(jiǎn)短性以及口語化,導(dǎo)致常用的文本聚類方法并不適用于微博文本的話題聚類。因此,本文選用LDA算法作為研究微博話題的檢測(cè)算法,并在此基礎(chǔ)上,針對(duì)微博數(shù)據(jù)集中的背景噪聲問題,進(jìn)一步提出改進(jìn)后的TC-LDA算法。最后,展開突發(fā)事件微博傳播網(wǎng)絡(luò)的研究。通過使用Petri網(wǎng)和Agent相結(jié)合的研究方法對(duì)傳播網(wǎng)絡(luò)進(jìn)行建模,使之可以從微觀個(gè)體和宏觀系統(tǒng)兩個(gè)方面觀測(cè)微博網(wǎng)絡(luò)的傳播特性。 綜上所述,本文通過對(duì)突發(fā)事件在微博平臺(tái)的話題檢測(cè)與跟蹤研究,設(shè)計(jì)實(shí)現(xiàn)一個(gè)從微博數(shù)據(jù)采集,話題檢測(cè)以及建立微博傳播模型的系統(tǒng),為各類突發(fā)事件的檢測(cè),預(yù)警以及應(yīng)急管理提供決策參考。
[Abstract]:At present, all kinds of Weibo platforms have accumulated a large number of user groups, and the amount of information released every day is huge. Therefore, the research based on topic detection and tracking began to shift from the traditional news field to the Weibo platform. The thesis points out that this paper can supplement or innovate in the field of Weibo new topic detection and tracking. Thirdly, based on the completion of data collection, the related topics of unexpected events in Weibo are detected. However, due to the brevity and colloquialization of Weibo, the commonly used text clustering methods are not suitable for topic clustering of Weibo texts. Therefore, this paper selects LDA algorithm as the detection algorithm of Weibo topic, and on this basis, proposes an improved TC-LDA algorithm for the background noise problem in Weibo dataset. Finally, the research on the Weibo communication network of unexpected events is carried out. To sum up, this paper designs and implements a system from Weibo data acquisition, topic detection and Weibo propagation model to detect all kinds of emergencies through the research of topic detection and tracking on Weibo platform. Early warning and emergency management provide decision-making reference.
【學(xué)位授予單位】:北京郵電大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2014
【分類號(hào)】:TP393.092

【參考文獻(xiàn)】

相關(guān)期刊論文 前6條

1 張晨逸;孫建伶;丁軼群;;基于MB-LDA模型的微博主題挖掘[J];計(jì)算機(jī)研究與發(fā)展;2011年10期

2 李保利,俞士汶;話題識(shí)別與跟蹤研究[J];計(jì)算機(jī)工程與應(yīng)用;2003年17期

3 閔可銳;趙迎賓;劉昕;趙澤宇;閆華;;互聯(lián)網(wǎng)話題識(shí)別與跟蹤系統(tǒng)設(shè)計(jì)及實(shí)現(xiàn)[J];計(jì)算機(jī)工程;2008年19期

4 駱衛(wèi)華;于滿泉;許洪波;王斌;程學(xué)旗;;基于多策略優(yōu)化的分治多層聚類算法的話題發(fā)現(xiàn)研究[J];中文信息學(xué)報(bào);2006年01期

5 洪宇;張宇;劉挺;李生;;話題檢測(cè)與跟蹤的評(píng)測(cè)及研究綜述[J];中文信息學(xué)報(bào);2007年06期

6 周剛;鄒鴻程;熊小兵;黃永忠;;MB-SinglePass:基于組合相似度的微博話題檢測(cè)[J];計(jì)算機(jī)科學(xué);2012年10期



本文編號(hào):2126051

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/guanlilunwen/ydhl/2126051.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶0f688***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com