堆疊去噪自編碼器在垃圾郵件過(guò)濾中的應(yīng)用
本文關(guān)鍵詞:堆疊去噪自編碼器在垃圾郵件過(guò)濾中的應(yīng)用
更多相關(guān)文章: 堆疊去噪自編碼器 垃圾郵件 分類 支持向量機(jī) 貝葉斯方法
【摘要】:針對(duì)垃圾郵件數(shù)量日益攀升的問(wèn)題,提出了將堆疊去噪自編碼器應(yīng)用到垃圾郵件分類中。首先,在無(wú)標(biāo)簽數(shù)據(jù)集上,使用無(wú)監(jiān)督學(xué)習(xí)方法最小化重構(gòu)誤差,對(duì)堆疊去噪自編碼器進(jìn)行貪心逐層預(yù)訓(xùn)練,從而獲得原始數(shù)據(jù)更加抽象和健壯的特征表示;然后,在堆疊去噪自編碼器的最上層添加一個(gè)分類器后,在有標(biāo)簽數(shù)據(jù)集上,利用有監(jiān)督學(xué)習(xí)方法最小化分類誤差,對(duì)預(yù)訓(xùn)練獲得的網(wǎng)絡(luò)參數(shù)進(jìn)行微調(diào),獲得最優(yōu)化的模型;最后,利用訓(xùn)練完成的堆疊去噪編碼器在6個(gè)不同的公開(kāi)數(shù)據(jù)集上進(jìn)行測(cè)試。將準(zhǔn)確率、召回率、更具有平衡性的馬修斯相關(guān)系數(shù)作為實(shí)驗(yàn)性能評(píng)價(jià)標(biāo)準(zhǔn),實(shí)驗(yàn)結(jié)果表明,相比支持向量機(jī)算法、貝葉斯方法和深度置信網(wǎng)絡(luò)的分類效果,基于堆疊去噪自編碼器的垃圾郵件分類器的準(zhǔn)確率都高于95%,馬修斯相關(guān)系數(shù)都大于0.88,在應(yīng)用中具有更高的準(zhǔn)確率和更好的健壯性。
【作者單位】: 四川大學(xué)計(jì)算機(jī)學(xué)院;
【關(guān)鍵詞】: 堆疊去噪自編碼器 垃圾郵件 分類 支持向量機(jī) 貝葉斯方法
【分類號(hào)】:TP393.098
【正文快照】: 0引言電子郵件因?yàn)橐子谑褂谩⑺俣瓤、溝通方便等原?已經(jīng)成為人們重要的聯(lián)系方式,但與此同時(shí),垃圾郵件的數(shù)量卻急劇地增加:卡巴斯基實(shí)驗(yàn)室的研究發(fā)現(xiàn),2014年第1季度的垃圾郵件數(shù)目占總郵件的66.34%;Mc Afee實(shí)驗(yàn)室2015年2月的威脅報(bào)告表明,2014年,垃圾郵件數(shù)量大概為31.2萬(wàn)億
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 陳長(zhǎng)偉;劉罡;洪躍楓;;電子垃圾郵件過(guò)濾技術(shù)的應(yīng)用[J];辦公自動(dòng)化;2004年06期
2 劉震,佘X,周明天;基于多級(jí)屬性集的垃圾郵件過(guò)濾技術(shù)[J];計(jì)算機(jī)應(yīng)用研究;2005年07期
3 陳治平;王雷;;基于自學(xué)習(xí)K近鄰的垃圾郵件過(guò)濾算法[J];計(jì)算機(jī)應(yīng)用;2005年S1期
4 李星;田瑩;段海新;;中文垃圾郵件過(guò)濾系統(tǒng)的實(shí)現(xiàn)和評(píng)估[J];大連理工大學(xué)學(xué)報(bào);2005年S1期
5 劉紅翼;;一種垃圾郵件過(guò)濾器的設(shè)計(jì)與實(shí)現(xiàn)[J];廣西科學(xué)院學(xué)報(bào);2005年04期
6 詹川;盧顯良;周旭;侯孟書(shū);袁連海;;基于貝葉斯公式的垃圾郵件過(guò)濾方法[J];計(jì)算機(jī)科學(xué);2005年02期
7 張強(qiáng);;基于阻斷發(fā)送源的垃圾郵件過(guò)濾技術(shù)[J];網(wǎng)絡(luò)安全技術(shù)與應(yīng)用;2006年02期
8 胡永杰;卜紅霞;;垃圾郵件過(guò)濾技術(shù)研究[J];河北師范大學(xué)學(xué)報(bào);2006年02期
9 王倩倩;段震;;基于神經(jīng)網(wǎng)絡(luò)的垃圾郵件過(guò)濾[J];合肥學(xué)院學(xué)報(bào)(自然科學(xué)版);2006年01期
10 袁耀文;盛勵(lì);;基于信息免疫技術(shù)的垃圾郵件過(guò)濾技術(shù)[J];計(jì)算機(jī)應(yīng)用研究;2006年05期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條
1 李軍;何曉寧;黃成哲;齊浩亮;雷國(guó)華;;基于特征貢獻(xiàn)度的垃圾郵件過(guò)濾方法[A];第六屆全國(guó)信息檢索學(xué)術(shù)會(huì)議論文集[C];2010年
2 潘文鋒;王斌;譚松波;;貝葉斯垃圾郵件過(guò)濾研究[A];全國(guó)網(wǎng)絡(luò)與信息安全技術(shù)研討會(huì)’2004論文集[C];2004年
3 劉紅翼;;一種垃圾郵件過(guò)濾器的設(shè)計(jì)與實(shí)現(xiàn)[A];廣西計(jì)算機(jī)學(xué)會(huì)2005年學(xué)術(shù)年會(huì)論文集[C];2005年
4 張尼;方濱興;;垃圾郵件過(guò)濾技術(shù)綜述[A];全國(guó)網(wǎng)絡(luò)與信息安全技術(shù)研討會(huì)'2005論文集(下冊(cè))[C];2005年
5 張志斌;施水才;呂學(xué)強(qiáng);;基于貝葉斯方法的中文垃圾郵件過(guò)濾技術(shù)綜述[A];中文信息處理前沿進(jìn)展——中國(guó)中文信息學(xué)會(huì)二十五周年學(xué)術(shù)會(huì)議論文集[C];2006年
6 周立兵;柳景超;;貝葉斯理論在垃圾郵件過(guò)濾中的應(yīng)用分析[A];中國(guó)造船工程學(xué)會(huì)電子技術(shù)學(xué)術(shù)委員會(huì)2006學(xué)術(shù)年會(huì)論文集(上冊(cè))[C];2006年
7 張海雷;王會(huì)珍;王安慧;朱靖波;;基于樸素貝葉斯模型的垃圾郵件過(guò)濾技術(shù)比較分析[A];全國(guó)網(wǎng)絡(luò)與信息安全技術(shù)研討會(huì)論文集(下冊(cè))[C];2007年
8 米淑云;辛陽(yáng);羅群;;一種新型垃圾郵件過(guò)濾系統(tǒng)的設(shè)計(jì)和研究[A];2008通信理論與技術(shù)新進(jìn)展——第十三屆全國(guó)青年通信學(xué)術(shù)會(huì)議論文集(上)[C];2008年
9 岑芳明;王明文;王鵬鳴;戴玉娟;;基于核偏最小二乘分類的垃圾郵件過(guò)濾[A];第四屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集(上)[C];2008年
10 牛明珠;;病毒和垃圾郵件過(guò)濾技術(shù)淺析[A];二○○九年全國(guó)電力企業(yè)信息化大會(huì)論文集[C];2009年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前10條
1 ;“垃圾郵件過(guò)濾系統(tǒng)”幾乎沒(méi)有一個(gè)完善的[N];新華每日電訊;2003年
2 ;測(cè)試?yán)]件過(guò)濾系統(tǒng)[N];網(wǎng)絡(luò)世界;2003年
3 本報(bào)記者 高穎;清除網(wǎng)絡(luò)“牛皮癬”勝算幾何?[N];計(jì)算機(jī)世界;2003年
4 John D. Halamka;IT手段的兩面性[N];計(jì)算機(jī)世界;2007年
5 ;不止是垃圾郵件過(guò)濾[N];網(wǎng)絡(luò)世界;2005年
6 ;2003十大網(wǎng)絡(luò)應(yīng)用電子郵箱[N];中國(guó)電腦教育報(bào);2003年
7 本報(bào)記者 李建平;Comdex走向?qū)WN];計(jì)算機(jī)世界;2003年
8 張穎;東西方交流不會(huì)被“垃圾”阻斷[N];中國(guó)經(jīng)營(yíng)報(bào);2002年
9 ;如何選擇和使用UTM設(shè)備[N];網(wǎng)絡(luò)世界;2009年
10 ;用戶關(guān)心的問(wèn)題:MSN 8值嗎?[N];計(jì)算機(jī)世界;2002年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前5條
1 董建設(shè);協(xié)作式垃圾郵件過(guò)濾關(guān)鍵技術(shù)研究[D];蘭州理工大學(xué);2009年
2 惠孛;基于即時(shí)分類的垃圾郵件過(guò)濾關(guān)鍵技術(shù)的研究[D];電子科技大學(xué);2009年
3 鄧蔚;垃圾郵件過(guò)濾中的敵手分類問(wèn)題研究[D];電子科技大學(xué);2011年
4 孫晶濤;基于內(nèi)容的垃圾郵件過(guò)濾技術(shù)研究[D];蘭州理工大學(xué);2010年
5 張澤明;人工免疫算法及其應(yīng)用研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2007年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 陳俊偉;圖片垃圾郵件過(guò)濾系統(tǒng)[D];華東師范大學(xué);2009年
2 徐雋;基于流數(shù)據(jù)特性的垃圾郵件過(guò)濾技術(shù)研究[D];復(fù)旦大學(xué);2009年
3 林偉;基于貝葉斯分類的垃圾郵件過(guò)濾系統(tǒng)研究與實(shí)現(xiàn)[D];西華大學(xué);2009年
4 徐熙;基于內(nèi)容的多級(jí)垃圾郵件過(guò)濾系統(tǒng)研究[D];西華大學(xué);2009年
5 盧揚(yáng)竹;基于內(nèi)容的垃圾郵件過(guò)濾技術(shù)研究[D];西南交通大學(xué);2009年
6 鄭春光;基于免疫的垃圾郵件過(guò)濾技術(shù)研究[D];哈爾濱理工大學(xué);2009年
7 歐德寧;垃圾郵件過(guò)濾技術(shù)研究[D];山東大學(xué);2009年
8 王志波;基于數(shù)據(jù)挖掘的垃圾郵件過(guò)濾技術(shù)研究[D];陜西師范大學(xué);2009年
9 王劍;惰性學(xué)習(xí)分類法在垃圾郵件過(guò)濾中的應(yīng)用研究[D];上海師范大學(xué);2009年
10 孫雪;基于內(nèi)容的垃圾郵件過(guò)濾系統(tǒng)研究[D];河北大學(xué);2010年
,本文編號(hào):624175
本文鏈接:http://www.sikaile.net/guanlilunwen/ydhl/624175.html