基于用戶興趣度的垃圾郵件在線識別新方法
本文關鍵詞:基于用戶興趣度的垃圾郵件在線識別新方法 出處:《華南理工大學學報(自然科學版)》2014年07期 論文類型:期刊論文
更多相關文章: 垃圾郵件 支持向量機 增量學習 主動學習 用戶興趣
【摘要】:多數(shù)在線垃圾郵件識別方法未有效區(qū)分用戶針對不同郵件內容的感興趣程度,導致垃圾郵件識別精度不高.文中提出了一種基于支持向量機的垃圾郵件在線識別新方法.即結合傳統(tǒng)增量學習及主動學習理論,先通過隨機選擇代表樣本尋找分類最不確定的樣本進行人工標注;接著引入用戶興趣度的概念,提出了新的樣本標注模型和算法性能評價標準;最后結合"輪盤賭"方法將標注后樣本加入訓練樣本集.多種對比實驗表明,文中方法針對垃圾郵件識別精度高,樣本訓練及待標注樣本選擇速度快,具有較高的在線應用價值.
【作者單位】: 吉林大學計算機科學與技術學院;
【基金】:國家科技成果轉化項目(財建[2011]329,財建[2012]258)
【分類號】:TP393.098
【正文快照】: 隨著網(wǎng)絡技術的迅速發(fā)展,電子郵件已成為人們日常生活中重要的通信手段之一.日益增長的垃圾郵件常常附載大量虛假甚至危害社會穩(wěn)定與安全的信息.垃圾郵件在線識別具有區(qū)別于傳統(tǒng)文本分類的特點[1-2]:1識別過程需根據(jù)用戶興趣進行,同一封郵件在不同用戶甚至處于不同階段的相同
【參考文獻】
相關期刊論文 前5條
1 吳偉寧;劉揚;郭茂祖;劉曉燕;;基于采樣策略的主動學習算法研究進展[J];計算機研究與發(fā)展;2012年06期
2 夏桂梅;曾建潮;;一種基于輪盤賭選擇遺傳算法的隨機微粒群算法[J];計算機工程與科學;2007年06期
3 劉伍穎;王挺;;集成學習和主動學習相結合的個性化垃圾郵件過濾[J];計算機工程與科學;2011年09期
4 陳榮;曹永鋒;孫洪;;基于主動學習和半監(jiān)督學習的多類圖像分類[J];自動化學報;2011年08期
5 王學軍;趙琳琳;王爽;;基于主動學習的視頻對象提取方法[J];吉林大學學報(工學版);2013年S1期
【共引文獻】
相關期刊論文 前10條
1 徐冉冉;李文斌;李朝鋒;;支持向量機在遙感圖像分類中的應用研究綜述[J];電腦知識與技術;2012年18期
2 黃揚帆;張慧敏;徐子航;曹鵬程;;超球體支持向量機的不完全二叉樹多類分類算法[J];重慶大學學報;2012年06期
3 吳新杰;黃國興;王靜文;;粒子濾波算法在ECT圖像重建中的應用[J];光學精密工程;2012年08期
4 張雁;吳保國;王冬;;遙感影像分類方法研究動態(tài)[J];安徽農業(yè)科學;2012年28期
5 Yan ZHANG;Baoguo WU;Dong WANG;;Research Dynamics of the Classification Methods of Remote Sensing Images[J];Asian Agricultural Research;2013年03期
6 李杰;楊婧;陳宣華;;面波頻散曲線遺傳算法反演的程序設計[J];地球物理學進展;2013年05期
7 楊杰明;王靜;曲朝陽;;基于相對貢獻率的特征選擇方法[J];東北電力大學學報;2014年04期
8 郝武偉;曾建潮;;基于聚類分析的隨機微粒群算法[J];計算機工程與應用;2010年08期
9 李鵬;全惠云;;改進的混合粒子群算法[J];計算機工程與應用;2010年11期
10 黃國興;吳新杰;;利用粒子濾波原理求解函數(shù)優(yōu)化問題[J];遼寧大學學報(自然科學版);2012年02期
相關會議論文 前2條
1 盧志剛;文瑩;;基于改進蟻群算法的配電網(wǎng)故障后恢復重構[A];中國高等學校電力系統(tǒng)及其自動化專業(yè)第二十四屆學術年會論文集(中冊)[C];2008年
2 曹健;陳紅倩;毛典輝;李海生;蔡強;;基于局部特征的圖像目標識別問題綜述[A];2013年中國智能自動化學術會議論文集(第五分冊)[C];2013年
相關博士學位論文 前3條
1 陳勇民;承壓式合流制溢流深井淤積及清淤技術研究[D];浙江大學;2011年
2 權偉;可視對象跟蹤算法研究及應用[D];西南交通大學;2013年
3 尚海昆;電力變壓器局部放電信號的特征提取與模式識別方法研究[D];華北電力大學;2014年
相關碩士學位論文 前10條
1 韓璐;基于廣義費用的冷鏈物流配送優(yōu)化研究[D];大連海事大學;2011年
2 王桂琳;城市醫(yī)療廢棄物回收網(wǎng)絡選址——路徑優(yōu)化研究[D];大連海事大學;2011年
3 李平;基于投影尋蹤回歸的網(wǎng)絡異常檢測機制研究[D];華中科技大學;2011年
4 李鵬;一種改進的粒子群優(yōu)化算法[D];湖南師范大學;2008年
5 郭勇;Ad Hoc網(wǎng)絡分簇路由協(xié)議的研究與改進[D];南昌大學;2008年
6 王梅冬;一種基于種群簇的多種群遺傳算法[D];大連理工大學;2009年
7 李琳;基于粗糙集和遺傳算法的聚類方法研究[D];廣西師范大學;2009年
8 呂鵬舉;基于相似變換的多自由度系統(tǒng)解耦研究[D];哈爾濱工程大學;2009年
9 張冰;航天測控網(wǎng)資源分配策略研究[D];沈陽航空工業(yè)學院;2010年
10 王芳;自動組卷系統(tǒng)的設計和實現(xiàn)[D];華東師范大學;2010年
【二級參考文獻】
相關期刊論文 前3條
1 宮秀軍,孫建平,史忠植;主動貝葉斯網(wǎng)絡分類器[J];計算機研究與發(fā)展;2002年05期
2 曾建潮,崔志華;一種保證全局收斂的PSO算法[J];計算機研究與發(fā)展;2004年08期
3 龍軍;殷建平;祝恩;蔡志平;;選取最大可能預測錯誤樣例的主動學習算法[J];計算機研究與發(fā)展;2008年03期
【相似文獻】
相關期刊論文 前10條
1 馬建慶;鐘亦平;張世永;;基于興趣度的關聯(lián)規(guī)則挖掘算法[J];計算機工程;2006年17期
2 汪慎文;劉坤起;石艷麗;;基于興趣度的多值關聯(lián)規(guī)則挖掘[J];微計算機信息;2008年24期
3 鄧春林;鄒凱;;基于關聯(lián)規(guī)則的圖書館讀者興趣度實證分析[J];情報理論與實踐;2009年04期
4 陸楠;梁正平;杜文峰;;一種面向商業(yè)智能興趣度的顧客目錄分割算法[J];信息與電腦(理論版);2011年03期
5 李金厚;周麗平;于曉青;;基于用戶操作行為的興趣度的分析與計算[J];工業(yè)控制計算機;2011年07期
6 張曉濱;龐海燕;;基于興趣度變化的社區(qū)網(wǎng)站用戶性格相似度計算[J];計算機系統(tǒng)應用;2013年02期
7 張騏;;基于興趣度的關聯(lián)規(guī)則挖掘及其在醫(yī)療審計中的應用[J];信息與電腦(理論版);2013年04期
8 周欣,沙朝鋒,朱揚勇,施伯樂;興趣度——關聯(lián)規(guī)則的又一個閾值[J];計算機研究與發(fā)展;2000年05期
9 周皓峰,朱揚勇,施伯樂;一個基于興趣度的關聯(lián)規(guī)則采掘算法[J];計算機研究與發(fā)展;2002年04期
10 曲守寧;徐德軍;吳同;王欽;;興趣度在選課指導系統(tǒng)中的研究與應用[J];計算機工程與應用;2006年27期
相關會議論文 前3條
1 周皓峰;高攀;施伯樂;;一個基于興趣度包含負屬性項的關聯(lián)規(guī)則采掘算法[A];第十七屆全國數(shù)據(jù)庫學術會議論文集(研究報告篇)[C];2000年
2 曲爽;谷文祥;;基于興趣度和負項集的關聯(lián)規(guī)則挖掘算法的研究[A];2005年全國理論計算機科學學術年會論文集[C];2005年
3 方煒煒;楊炳儒;唐志剛;楊君;;基于客觀興趣度的關聯(lián)規(guī)則優(yōu)化算法研究[A];2008'中國信息技術與應用學術論壇論文集(一)[C];2008年
相關重要報紙文章 前6條
1 ;音樂,,我不能沒有你[N];中國消費者報;2000年
2 李寶春;長虹開創(chuàng)Portable視聽新時代[N];中華工商時報;2003年
3 李寶春;長虹移動DVD完美上市[N];經濟參考報;2003年
4 周童;Vista賺盡眼球[N];計算機世界;2007年
5 孫海東;國際科教大片為何無人喝彩[N];市場報;2000年
6 本報記者 蘭海燕;誰該先補“這一課”?[N];工人日報;2001年
相關碩士學位論文 前10條
1 吳杰;基于興趣度的關聯(lián)規(guī)則挖掘[D];哈爾濱理工大學;2009年
2 劉正紅;基于興趣度的關聯(lián)規(guī)則挖掘算法研究[D];東北師范大學;2009年
3 靳峰;基于興趣度的推薦系統(tǒng)研究[D];西安建筑科技大學;2005年
4 余玲;客觀興趣度模型及其在關聯(lián)分類中的應用研究[D];西南交通大學;2010年
5 陳安龍;基于興趣度的關聯(lián)規(guī)則挖掘算法的研究[D];西南交通大學;2003年
6 王梟翔;基于相關興趣度的關聯(lián)規(guī)則挖掘[D];蘭州交通大學;2013年
7 曹新志;基于決策樹的客戶興趣度分析[D];吉林大學;2006年
8 豐淑娟;基于加權興趣度的協(xié)同過濾算法研究[D];中北大學;2011年
9 姜虹;基于興趣度的增量數(shù)據(jù)挖掘算法的研究[D];河海大學;2002年
10 劉曉鵬;基于用戶瀏覽興趣度的WEB挖掘[D];遼寧工程技術大學;2005年
本文編號:1328528
本文鏈接:http://www.sikaile.net/guanlilunwen/ydhl/1328528.html