微博自動分類系統(tǒng)設(shè)計
本文關(guān)鍵詞:微博自動分類系統(tǒng)設(shè)計
更多相關(guān)文章: 微博分類 用戶聚類 輪廓系數(shù)
【摘要】:文章提出了一種熱門微博分類的新思路,通過對熱門微博的轉(zhuǎn)發(fā)用戶進行聚類分析,并根據(jù)不同的用戶聚集狀態(tài)來區(qū)分不同種類的熱門微博。在用戶聚類中采用了基于K-means聚類算法的改進算法X-means,并根據(jù)微博用戶數(shù)據(jù)特點對X-means算法進行了進一步改進,將屬性差異和用戶節(jié)點差異考慮在聚類過程當中。其中,在對X-means算法改進過程中,對于用戶屬性的加權(quán)采用了基于對數(shù)函數(shù)的加權(quán)方式,確保聚類結(jié)果更加科學(xué)、準確;在對用戶自身權(quán)重的加權(quán)中,通過建立重點人員信息庫的方式,實現(xiàn)了對特殊用戶節(jié)點的加權(quán),并利用HITS算法對重點人員信息庫實現(xiàn)動態(tài)更新。在完成用戶聚類之后,將得到的重要用戶的信息分領(lǐng)域錄入重點人員信息庫,實現(xiàn)聚類過程與信息庫的反饋機制。另外,實驗將相同數(shù)據(jù)分別代入改進前后的K-means算法與X-means算法中,并通過輪廓系數(shù)評價聚類結(jié)果,證明了改進后的X-means算法在微博用戶聚類中更有優(yōu)勢。
【作者單位】: 中國人民公安大學(xué)網(wǎng)絡(luò)安全保衛(wèi)學(xué)院;
【關(guān)鍵詞】: 微博分類 用戶聚類 輪廓系數(shù)
【基金】:公安部重點研究計劃[2011ZDYJGADX016]
【分類號】:TP391.1
【正文快照】: 0引言在新興的互聯(lián)網(wǎng)時代,微博作為一種短內(nèi)容交互式的社交平臺已經(jīng)成為人們發(fā)表意見、共享信息的一種主要工具。而隨著微博的普及,在微博中也出現(xiàn)了許多影響社會穩(wěn)定、危害社會治安的輿情事件,其中包括誹謗、謠言、反動言論以及恐嚇威脅等內(nèi)容。公安網(wǎng)監(jiān)部門必須仔細地對微博
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 丁向榮;;基于用戶聚類的框計算改進模型研究[J];科技通報;2012年12期
2 王榮;李晉宏;宋威;;基于關(guān)鍵字的用戶聚類算法[J];計算機工程與設(shè)計;2012年09期
3 張晨;;集群環(huán)境下用戶聚類算法的智能化站點的架構(gòu)[J];硅谷;2012年24期
4 彭艷;王小玲;;一種混合聚類算法在用戶聚類中的應(yīng)用研究[J];信息技術(shù);2008年01期
5 張海榮;朱信忠;趙建民;徐慧英;;一種優(yōu)化的基于用戶聚類的過濾推薦策略[J];計算機系統(tǒng)應(yīng)用;2008年11期
6 王燕;孫玲芳;徐曰光;陳思光;黎維良;王雁秋;閆超;;基于高效多功能的聚類算法在Web挖掘中應(yīng)用的研究[J];科學(xué)技術(shù)與工程;2008年04期
7 趙潔;董振寧;張沙清;肖南峰;;一種基于粒度原理的多指標綜合Web用戶聚類算法[J];計算機應(yīng)用研究;2011年07期
8 劉芳先;李國;;基于項目簇偏好的用戶聚類算法[J];現(xiàn)代計算機;2013年18期
9 王瓊;顧文軒;徐汀榮;;結(jié)合關(guān)聯(lián)規(guī)則與FCM的用戶聚類改進[J];微電子學(xué)與計算機;2008年03期
10 翁偉;朱順痣;鐘瑛;;基于訪問路徑的Web用戶聚類算法[J];福建電腦;2013年01期
中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條
1 趙潔;基于粒計算的Web使用挖掘研究[D];華南理工大學(xué);2010年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前9條
1 顧振宇;基于點擊的用戶聚類的研究[D];電子科技大學(xué);2011年
2 陳澤紅;基于Web訪問日志的用戶聚類研究[D];廈門大學(xué);2014年
3 付志濤;基于Web日志的網(wǎng)絡(luò)用戶聚類研究與實現(xiàn)[D];南京理工大學(xué);2007年
4 蔣超;基于用戶聚類和語義詞典的微博推薦系統(tǒng)[D];浙江大學(xué);2013年
5 肖宗花;基于用戶訪問行為與內(nèi)容的用戶聚類算法的研究與實現(xiàn)[D];北京交通大學(xué);2013年
6 郝建斌;基于模糊理論的Web用戶聚類的研究[D];北京理工大學(xué);2011年
7 周松松;基于MapReduce用戶聚類算法在Web日志挖掘中應(yīng)用[D];河北工業(yè)大學(xué);2015年
8 楊登武;基于改進的混合蛙跳算法的Web用戶聚類研究[D];西南大學(xué);2015年
9 鄭富蘭;基于Web用戶聚類的多Markov鏈預(yù)測模型研究[D];山西師范大學(xué);2013年
,本文編號:742279
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/742279.html