基于用戶行為的郵件分類算法
本文選題:分類算法 + 垃圾郵件; 參考:《計(jì)算機(jī)應(yīng)用》2014年05期
【摘要】:針對(duì)垃圾郵件過濾過程中分類模型難以個(gè)性化、難以適應(yīng)用戶興趣動(dòng)態(tài)變化的問題,提出了一種基于用戶行為的郵件分類算法。通過分析樸素貝葉(NB)斯分類算法的原理,改造樸素貝葉斯算法,使其具有動(dòng)態(tài)調(diào)整能力。郵件服務(wù)器接收到新郵件后自動(dòng)進(jìn)行分類判別,用戶瀏覽郵件的過程中對(duì)郵件進(jìn)行操作,根據(jù)用戶對(duì)錯(cuò)分郵件的處理自動(dòng)將該郵件加入訓(xùn)練數(shù)據(jù)集,并動(dòng)態(tài)更新相應(yīng)特征的統(tǒng)計(jì)概率,使郵件分類算法能夠依據(jù)用戶對(duì)不同郵件的操作行為動(dòng)態(tài)調(diào)整分類模型,以達(dá)到有效過濾垃圾郵件的目的。與常用的貝葉斯分類算法的實(shí)驗(yàn)比較表明在給定小樣本集合進(jìn)行訓(xùn)練的情況下,新算法對(duì)于垃圾郵件的識(shí)別率比傳統(tǒng)的樸素貝葉斯方法、基于風(fēng)險(xiǎn)敏感的樸素貝葉斯方法等提高了10%,獲得了較好的分類性能。
[Abstract]:In order to solve the problem that the classification model is difficult to personalize and adapt to the dynamic changes of users' interests in spam filtering, a classification algorithm based on user behavior is proposed. By analyzing the principle of NBs classification algorithm, the naive Bayes algorithm is modified to make it have the ability of dynamic adjustment. After receiving the new mail, the mail server automatically classifies and discriminates. During the process of browsing the mail, the mail is operated, and the mail is automatically added to the training data set according to the processing of the user's right and wrong mail. The statistical probability of the corresponding features is dynamically updated so that the mail classification algorithm can dynamically adjust the classification model according to the user's operation behavior to achieve the purpose of filtering spam effectively. The experimental results show that the new algorithm is more efficient than the traditional naive Bayesian algorithm in the case of training the set of small samples. The naive Bayes method based on risk sensitivity improves 10% and achieves better classification performance.
【作者單位】: 長沙學(xué)院信息與計(jì)算科學(xué)系;
【分類號(hào)】:TP393.098
【參考文獻(xiàn)】
相關(guān)期刊論文 前9條
1 鄧文韜;王國胤;董振興;;一種改進(jìn)KNN個(gè)性化郵件過濾的方法[J];重慶郵電大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年06期
2 劉伍穎;王挺;;結(jié)構(gòu)化集成學(xué)習(xí)垃圾郵件過濾[J];計(jì)算機(jī)研究與發(fā)展;2012年03期
3 馬小龍;;一種改進(jìn)的貝葉斯算法在垃圾郵件過濾中的研究[J];計(jì)算機(jī)應(yīng)用研究;2012年03期
4 秦逸;;基于行為的垃圾郵件檢測(cè)技術(shù)[J];計(jì)算機(jī)科學(xué);2012年11期
5 薛正元;;基于改進(jìn)貝葉斯決策的郵件過濾[J];計(jì)算機(jī)工程與應(yīng)用;2013年07期
6 雷劍剛;孫細(xì)斌;;一種智能垃圾郵件過濾模型的仿真研究[J];計(jì)算機(jī)仿真;2013年05期
7 黃國偉;許昱瑋;;基于用戶反饋的混合型垃圾郵件過濾方法[J];計(jì)算機(jī)應(yīng)用;2013年07期
8 李淵;廖聞劍;彭艷兵;程光;;復(fù)雜網(wǎng)絡(luò)性質(zhì)探討及在垃圾郵件過濾中的運(yùn)用[J];計(jì)算機(jī)科學(xué);2013年S1期
9 Guanglu Sun;Hongyue Sun;Yingcai Ma;Yuewu Shen;;Spam Filtering:Online Naive Bayes Based on TONE[J];ZTE Communications;2013年02期
【共引文獻(xiàn)】
相關(guān)期刊論文 前10條
1 申鉉京;何月;張博;龍建武;;基于空間信息及隸屬度約束的FCM圖像分割算法[J];北京工業(yè)大學(xué)學(xué)報(bào);2012年07期
2 蘇艷剛;;一種改進(jìn)自動(dòng)更新的中文郵件過濾模型的設(shè)計(jì)[J];電腦知識(shí)與技術(shù);2013年20期
3 翟軍昌;車偉偉;;一種基于條件熵的垃圾郵件過濾算法[J];計(jì)算機(jī)與現(xiàn)代化;2014年02期
4 楊赫;孫廣路;何勇軍;;基于樸素貝葉斯模型的郵件過濾技術(shù)[J];哈爾濱理工大學(xué)學(xué)報(bào);2014年01期
5 陳宇;;基于用戶行為的個(gè)性化郵件分類算法[J];福建工程學(xué)院學(xué)報(bào);2014年01期
6 周全強(qiáng);張付志;;基于仿生模式識(shí)別的用戶概貌攻擊集成檢測(cè)方法[J];計(jì)算機(jī)研究與發(fā)展;2014年04期
7 郭軍權(quán);諸葛建偉;孫東紅;段海新;;Spampot:基于分布式蜜罐的垃圾郵件捕獲系統(tǒng)[J];計(jì)算機(jī)研究與發(fā)展;2014年05期
8 翟軍昌;秦玉平;車偉偉;;垃圾郵件過濾中信息增益的改進(jìn)研究[J];計(jì)算機(jī)科學(xué);2014年06期
9 陳念;唐振民;;QBC主動(dòng)采樣學(xué)習(xí)在垃圾郵件在線過濾中的應(yīng)用[J];計(jì)算機(jī)工程與應(yīng)用;2014年22期
10 楊艷燕;郭紅轉(zhuǎn);路新華;;基于粗糙集的帶決策規(guī)則邊界的郵件過濾算法[J];計(jì)算機(jī)應(yīng)用研究;2015年01期
【二級(jí)參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 閻艷;黃智興;邱玉輝;;一種基于派系過濾的社區(qū)進(jìn)化發(fā)現(xiàn)研究[J];重慶師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2009年02期
2 洪艷;程克勤;;基于電子郵件原理的垃圾郵件過濾策略[J];電腦知識(shí)與技術(shù)(學(xué)術(shù)交流);2007年09期
3 鄧蔚;秦志光;劉嶠;程紅蓉;;抗好詞攻擊的中文垃圾郵件過濾模型[J];電子測(cè)量與儀器學(xué)報(bào);2010年12期
4 胡佳妮,徐蔚然,郭軍,鄧偉洪;中文文本分類中的特征選擇算法研究[J];光通信研究;2005年03期
5 王美珍;李芝棠;吳漢濤;;改進(jìn)的貝葉斯垃圾郵件過濾算法[J];華中科技大學(xué)學(xué)報(bào)(自然科學(xué)版);2009年08期
6 韓家煒,孟小峰,王靜,李盛恩;Web挖掘研究[J];計(jì)算機(jī)研究與發(fā)展;2001年04期
7 姜遠(yuǎn);周志華;;基于詞頻分類器集成的文本分類方法[J];計(jì)算機(jī)研究與發(fā)展;2006年10期
8 王濤;李舟軍;顏躍進(jìn);陳火旺;;數(shù)據(jù)流挖掘分類技術(shù)綜述[J];計(jì)算機(jī)研究與發(fā)展;2007年11期
9 劉赫;劉大有;裴志利;高瀅;;一種基于特征重要度的文本分類特征加權(quán)方法[J];計(jì)算機(jī)研究與發(fā)展;2009年10期
10 朱明,王俊普,蔡慶生;一種最優(yōu)特征集的選擇算法[J];計(jì)算機(jī)研究與發(fā)展;1998年09期
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 呢仔男孩;垃圾郵件防守戰(zhàn)[J];電腦愛好者;2001年09期
2 馮小民;徹底拒絕垃圾郵件[J];電腦愛好者;2001年16期
3 林義湘;如何避免垃圾郵件的騷擾[J];電子與電腦;2002年10期
4 志杰;垃圾郵件大清除[J];計(jì)算機(jī)與農(nóng)業(yè);2002年03期
5 垂天翼;教您七個(gè)防護(hù)妙招使您遠(yuǎn)離垃圾郵件困擾[J];微計(jì)算機(jī)信息;2002年12期
6 徐濤;讓垃圾郵件靜靜的走開[J];計(jì)算機(jī)與網(wǎng)絡(luò);2002年06期
7 茍宏,李龍海,周利華;高性能郵件轉(zhuǎn)發(fā)服務(wù)器的設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)應(yīng)用研究;2002年01期
8 金哲凡,石教英;基于統(tǒng)一消息的郵件通知系統(tǒng)的研究與實(shí)現(xiàn)[J];計(jì)算機(jī)工程與應(yīng)用;2003年14期
9 趙江;走出垃圾郵件的泥潭[J];個(gè)人電腦;2003年11期
10 劉洋,杜孝平,黃星華,侯志輝,郭晨,周二勝,駱煥林;垃圾郵件的智能過濾系統(tǒng)設(shè)計(jì)探討[J];微機(jī)發(fā)展;2003年04期
相關(guān)會(huì)議論文 前10條
1 張晶;姚建民;董守斌;張凌;;基于自然語言同現(xiàn)詞匯的郵件過濾[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年
2 薛亞楠;廖聞劍;彭艷兵;;垃圾郵件行為識(shí)別研究[A];中國電子學(xué)會(huì)第十六屆信息論學(xué)術(shù)年會(huì)論文集[C];2009年
3 蒯莉;;網(wǎng)絡(luò)垃圾郵件的防范與治理[A];第十六次全國計(jì)算機(jī)安全學(xué)術(shù)交流會(huì)論文集[C];2001年
4 沈衛(wèi)超;;郵件過濾器系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[A];中國工程物理研究院科技年報(bào)(2001)[C];2001年
5 石艷榮;孫丹寧;賀永強(qiáng);;一種基于內(nèi)容的郵件過濾模型的研究與性能分析[A];2007通信理論與技術(shù)新發(fā)展——第十二屆全國青年通信學(xué)術(shù)會(huì)議論文集(上冊(cè))[C];2007年
6 張尼;姜譽(yù);方濱興;郭莉;;一個(gè)基于郵件路徑地理屬性分析的垃圾郵件過濾算法[A];全國網(wǎng)絡(luò)與信息安全技術(shù)研討會(huì)論文集(下冊(cè))[C];2007年
7 朱巧明;周志軍;李培峰;;中文郵件語料庫建設(shè)及其分類研究[A];第六屆漢語詞匯語義學(xué)研討會(huì)論文集[C];2005年
8 仇小鋒;陳鳴;賈永興;;垃圾郵件及其防范技術(shù)[A];第九屆全國青年通信學(xué)術(shù)會(huì)議論文集[C];2004年
9 張相於;陳繼東;李玉坤;孟小峰;;TEXEM:一種基于實(shí)體的郵件任務(wù)提取策略[A];第二十五屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(二)[C];2008年
10 李婧;張煥國;;應(yīng)用于貝葉斯過濾器的噪音消除算法研究[A];2005通信理論與技術(shù)新進(jìn)展——第十屆全國青年通信學(xué)術(shù)會(huì)議論文集[C];2005年
相關(guān)重要報(bào)紙文章 前10條
1 ;砍斷垃圾郵件黑手[N];計(jì)算機(jī)世界;2003年
2 本報(bào)記者 張琳;防垃圾郵件怎樣“行為識(shí)別”[N];網(wǎng)絡(luò)世界;2005年
3 新華社記者 王緬 毛磊 楊駿 何德功 潘治;垃圾郵件全球泛濫,法律怎么辦[N];新華每日電訊;2003年
4 阮光塵邋朱元春;多層構(gòu)建郵件免疫機(jī)能[N];中國計(jì)算機(jī)報(bào);2007年
5 ;垃圾郵件傳播追隨“熱點(diǎn)”[N];網(wǎng)絡(luò)世界;2007年
6 劉向晨;垃圾郵件防治任重道遠(yuǎn)[N];中國電腦教育報(bào);2003年
7 小新;郵箱也能自動(dòng)過濾垃圾郵件[N];中國電腦教育報(bào);2003年
8 絲雨;“垃圾郵件”任憑圍剿輕松反圍剿[N];大眾科技報(bào);2002年
9 ;企業(yè)備戰(zhàn)垃圾郵件[N];計(jì)算機(jī)世界;2004年
10 樂天;對(duì)付垃圾郵件德國出新招[N];計(jì)算機(jī)世界;2011年
相關(guān)博士學(xué)位論文 前6條
1 陳彬;垃圾郵件的特征選擇及檢測(cè)方法研究[D];華南理工大學(xué);2010年
2 劉震;垃圾郵件過濾理論和關(guān)鍵技術(shù)研究[D];電子科技大學(xué);2008年
3 王友衛(wèi);基于統(tǒng)計(jì)的垃圾郵件識(shí)別關(guān)鍵技術(shù)研究[D];吉林大學(xué);2015年
4 劉衛(wèi)紅;垃圾郵件檢測(cè)與過濾關(guān)鍵技術(shù)研究[D];華南理工大學(xué);2010年
5 詹川;反垃圾郵件技術(shù)的研究[D];電子科技大學(xué);2005年
6 王會(huì)珍;文本內(nèi)容分類和主題追蹤關(guān)鍵技術(shù)研究[D];東北大學(xué);2008年
相關(guān)碩士學(xué)位論文 前10條
1 代偉;郵件過濾器的設(shè)計(jì)與實(shí)現(xiàn)[D];吉林大學(xué);2010年
2 戴少鋒;基于多層架構(gòu)的郵件過濾系統(tǒng)研究[D];第一軍醫(yī)大學(xué);2006年
3 肖e,
本文編號(hào):2040897
本文鏈接:http://www.sikaile.net/guanlilunwen/ydhl/2040897.html