基于重用檢測的微博垃圾用戶過濾算法
本文關(guān)鍵詞: 垃圾消息 微博 重用檢測 出處:《南京大學(xué)學(xué)報(自然科學(xué)版)》2013年04期 論文類型:期刊論文
【摘要】:針對微博中的反垃圾處理問題,本文提出了基于重用檢測模型的垃圾用戶檢測算法,該方法綜合考慮了消息序列中文本相關(guān)性和時間相關(guān)性,對垃圾用戶的發(fā)布行為進(jìn)行建模.按照文本粒度不同,基于重用檢測模型的檢測算法分為語句級檢測(SRD)和詞項級檢測(TRD).SRD算法側(cè)重于用戶行為方式,而TRD算法側(cè)重于垃圾消息的主題.基于真實數(shù)據(jù)集的實驗表明,SRD算法在整體性能上優(yōu)于TRD算法,但TRD算法具有更高的運(yùn)行效率,并且檢測針對性強(qiáng),可發(fā)現(xiàn)指定類型的垃圾用戶.最后,本文運(yùn)用重用檢測算法在垃圾用戶群體檢測方面做了初步嘗試,實驗表明基于轉(zhuǎn)發(fā)關(guān)系的重用檢測算法可以發(fā)現(xiàn)真實有效的垃圾群體用戶.
[Abstract]:For the problem of waste micro-blog in the proposed detection algorithm reuse spam detection model based on this method, considering the correlation and time correlation of text message sequence, modeling the user's garbage release behavior. According to the text of different size, detection algorithm reuse detection model is divided into a statement level detection based on SRD () and lexical entry level detection (TRD).SRD algorithm focuses on user behavior, while the TRD algorithm focuses on junk news theme. Experiments based on real data sets show that, SRD algorithm is better than TRD in the overall performance, but the TRD algorithm has higher efficiency, and the detection of targeted, can be found in the specified the type of garbage users. Finally, this paper uses the reuse detection algorithm in spam detection of user groups to do a preliminary attempt, experiments show that the reuse detection method based on the relationship of the forwarding can be issued The real and effective users of the garbage group.
【作者單位】: 南京師范大學(xué)計算機(jī)科學(xué)與技術(shù)學(xué)院;
【基金】:江蘇省自然科學(xué)基金重點(diǎn)項目(BK2011005) 國家自然科學(xué)基金(61272221) 江蘇省社科基金(12YYA002)
【分類號】:TP393.092
【正文快照】: 微博作為目前流行的網(wǎng)絡(luò)營銷媒體,為商業(yè)用戶拓展市場空間、樹立品牌形象和開展網(wǎng)絡(luò)營銷提供了巨大的幫助.但同時也成為了垃圾用戶(Spammer)發(fā)布非法廣告和垃圾消息的平臺.垃圾消息的大量出現(xiàn)不僅影響了用戶的使用體驗,還妨礙了商業(yè)營銷活動在微博平臺上的健康發(fā)展.所以,研究
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 王鼎云;;對微博的發(fā)展?fàn)顩r和趨勢的冷思考[J];時代教育(教育教學(xué));2011年01期
2 王艷;;Twitter技術(shù)及其在情景教育中的應(yīng)用[J];中國西部科技;2010年16期
3 李士奇;;微博使用者應(yīng)具備的基本素養(yǎng)[J];科教導(dǎo)刊(上旬刊);2011年03期
4 張來勇;;淺析移動互聯(lián)網(wǎng)技術(shù)的教育應(yīng)用[J];中國信息技術(shù)教育;2011年Z1期
5 崔爭艷;;基于語義的微博短信息分類[J];現(xiàn)代計算機(jī)(專業(yè)版);2010年08期
6 劉穎錄;;淺析新網(wǎng)絡(luò)時代的微博傳播[J];商業(yè)文化(上半月);2011年05期
7 申詩逸;;論“微博”的傳播特點(diǎn)與推廣[J];青年文學(xué)家;2010年14期
8 揭瀟君;;淺析動漫作品在微博平臺的傳播[J];數(shù)字技術(shù)與應(yīng)用;2010年11期
9 王傳林;符易陽;;網(wǎng)絡(luò)隱蔽通道及其識別技術(shù)研究[J];現(xiàn)代電子技術(shù);2009年15期
10 陳丹偉;劉杰;孫國梓;韓俊;;一種基于概率訓(xùn)練的病毒檢測模型[J];計算機(jī)應(yīng)用研究;2010年06期
相關(guān)會議論文 前10條
1 秦首科;常建龍;谷姍姍;周傲英;;數(shù)據(jù)流上的綜合性突變檢測算法[A];第二十二屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2005年
2 廖鵬;;基于異常特征的DDoS檢測模型[A];經(jīng)濟(jì)發(fā)展方式轉(zhuǎn)變與自主創(chuàng)新——第十二屆中國科學(xué)技術(shù)協(xié)會年會(第四卷)[C];2010年
3 羅浩;方濱興;云曉春;王欣;辛毅;;一種高速實時的郵件蠕蟲異常檢測模型[A];全國網(wǎng)絡(luò)與信息安全技術(shù)研討會'2005論文集(上冊)[C];2005年
4 謝毅;張俊靈;王瑩;胡翠林;;一種基于SVM的信息安全入侵檢測模型[A];2007通信理論與技術(shù)新發(fā)展——第十二屆全國青年通信學(xué)術(shù)會議論文集(上冊)[C];2007年
5 李俊薇;楊青;張連發(fā);黃宇穎;;基于貝葉斯定理的個性化體檢網(wǎng)站的研究[A];第二十三屆中國(天津)2009IT、網(wǎng)絡(luò)、信息技術(shù)、電子、儀器儀表創(chuàng)新學(xué)術(shù)會議論文集[C];2009年
6 李千目;戚涌;嚴(yán)悍;張宏;劉鳳玉;;基于免疫學(xué)的網(wǎng)絡(luò)節(jié)點(diǎn)故障檢測系統(tǒng)[A];第二十二屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2005年
7 李俊薇;楊青;張連發(fā);黃宇穎;;基于貝葉斯定理的個性化體檢網(wǎng)站的研究[A];第二十二屆中國(天津)'2008IT、網(wǎng)絡(luò)、信息技術(shù)、電子、儀器儀表創(chuàng)新學(xué)術(shù)會議論文集[C];2008年
8 許列;王明印;;基于隱馬爾可夫模型(HMM)實時異常檢測[A];中國通信學(xué)會第六屆學(xué)術(shù)年會論文集(上)[C];2009年
9 劉子豪;莊毅;;一種電子郵件敏感信息檢測算法[A];第八屆全國信息隱藏與多媒體安全學(xué)術(shù)大會湖南省計算機(jī)學(xué)會第十一屆學(xué)術(shù)年會論文集[C];2009年
10 帥春燕;江建慧;歐陽鑫;;基于狀態(tài)機(jī)的多階段網(wǎng)絡(luò)攻擊模型及檢測算法[A];第六屆中國測試學(xué)術(shù)會議論文集[C];2010年
相關(guān)重要報紙文章 前10條
1 包家慶;IDS五大發(fā)展趨勢[N];網(wǎng)絡(luò)世界;2002年
2 ;分擔(dān)分析提高無線安全性[N];網(wǎng)絡(luò)世界;2005年
3 科文;VIXD算法分析Web異常[N];中國計算機(jī)報;2008年
4 ;方興未艾的入侵檢測技術(shù)[N];人民郵電;2007年
5 陳星霖;NIDS:老樹發(fā)新枝[N];網(wǎng)絡(luò)世界;2009年
6 谷雨;入侵檢測需要協(xié)同[N];網(wǎng)絡(luò)世界;2001年
7 中聯(lián)綠盟、李群;IDS的關(guān)鍵:解決好誤報和漏報[N];中國計算機(jī)報;2002年
8 ;免費(fèi)與付費(fèi)IDS你選誰[N];中國計算機(jī)報;2005年
9 趙曉濤;當(dāng)Web安全成為難以實現(xiàn)的夢想[N];網(wǎng)絡(luò)世界;2008年
10 ;聯(lián)想網(wǎng)御百兆防火墻[N];計算機(jī)世界;2002年
相關(guān)博士學(xué)位論文 前10條
1 王曉鋒;Web應(yīng)用入侵異常檢測新技術(shù)研究[D];華中科技大學(xué);2007年
2 李目海;基于流量的分布式拒絕服務(wù)攻擊檢測[D];華東師范大學(xué);2010年
3 張亮;推薦系統(tǒng)中協(xié)同過濾算法若干問題的研究[D];北京郵電大學(xué);2009年
4 楊曉峰;基于機(jī)器學(xué)習(xí)的Web安全檢測方法研究[D];南京理工大學(xué);2011年
5 曾劍平;基于模糊集的自適應(yīng)偽裝入侵檢測算法及其在ASP服務(wù)安全中的應(yīng)用研究[D];廈門大學(xué);2006年
6 趙靜;網(wǎng)絡(luò)協(xié)議異常檢測模型的研究與應(yīng)用[D];北京交通大學(xué);2010年
7 詹川;反垃圾郵件技術(shù)的研究[D];電子科技大學(xué);2005年
8 秦首科;數(shù)據(jù)流上的異常檢測[D];復(fù)旦大學(xué);2006年
9 吳作順;基于免疫學(xué)的入侵檢測系統(tǒng)研究[D];中國人民解放軍國防科學(xué)技術(shù)大學(xué);2003年
10 黎耀;IPv6環(huán)境下異常檢測系統(tǒng)的關(guān)鍵技術(shù)研究[D];華中科技大學(xué);2006年
相關(guān)碩士學(xué)位論文 前10條
1 朱少萍;微博內(nèi)作弊和推廣聯(lián)盟的檢測算法研究[D];大連理工大學(xué);2013年
2 王翔宇;基于IP流量的僵尸網(wǎng)絡(luò)檢測模型的設(shè)計與實現(xiàn)[D];上海交通大學(xué);2011年
3 陳濤;網(wǎng)絡(luò)威脅檢測模型及行為序列分析方法研究[D];西安電子科技大學(xué);2010年
4 米金良;入侵檢測技術(shù)及其應(yīng)用[D];西安建筑科技大學(xué);2003年
5 王棟;防火墻深度包檢測技術(shù)研究[D];西安電子科技大學(xué);2005年
6 吳甜甜;一種低存儲消耗的超點(diǎn)檢測算法研究[D];大連海事大學(xué);2012年
7 李俐穎;分布式拒絕服務(wù)攻擊檢測技術(shù)研究[D];電子科技大學(xué);2007年
8 何金艷;基于內(nèi)容分析的Blog話題檢測方法研究[D];哈爾濱工業(yè)大學(xué);2010年
9 胡大偉;基于標(biāo)簽協(xié)同過濾算法在微博推薦中的研究[D];內(nèi)蒙古科技大學(xué);2012年
10 江華;基于組合聚類分析的網(wǎng)絡(luò)異常檢測模型[D];中國民航大學(xué);2013年
,本文編號:1481617
本文鏈接:http://www.sikaile.net/guanlilunwen/ydhl/1481617.html