粒子群優(yōu)化的SVM垃圾郵件過(guò)濾研究
發(fā)布時(shí)間:2022-01-13 14:23
隨著互聯(lián)網(wǎng)的普及,電子郵件作為一種方便、快捷、費(fèi)用低廉的通訊方式得到了極大的普及。電子郵件在給人們工作生活帶來(lái)巨大方便的同時(shí),隨之而來(lái)的垃圾郵件泛濫也使整個(gè)網(wǎng)絡(luò)不堪重負(fù),占用網(wǎng)絡(luò)帶寬,侵占收件人郵箱空間,耗費(fèi)收件人的時(shí)間,數(shù)以萬(wàn)計(jì)的垃圾郵件襲擊目標(biāo)網(wǎng)站,造成被攻擊網(wǎng)站網(wǎng)路堵塞,最終癱瘓的案例也時(shí)有發(fā)生。垃圾郵件泛濫降低了整個(gè)網(wǎng)絡(luò)的運(yùn)行效率,也對(duì)現(xiàn)實(shí)社會(huì)造成了嚴(yán)重危害。如何防范和過(guò)濾垃圾郵件引起了人們的極大關(guān)注,也是網(wǎng)絡(luò)安全研究領(lǐng)域的熱點(diǎn)問(wèn)題之一本文針對(duì)垃圾郵件的過(guò)濾問(wèn)題進(jìn)行學(xué)習(xí)、研究和探討,提出用粒子群優(yōu)化的支持向量機(jī)(PSO-SVM)進(jìn)行中文垃圾郵件過(guò)濾,并通過(guò)與其它如樸素貝葉斯(NB)、支持向量機(jī)(SVM)和遺傳優(yōu)化的支持向量機(jī)(GA-SVM)等算法進(jìn)行理論上的橫向比較,證明了PSO-SVM較其它常用的垃圾郵件過(guò)濾算法更適合進(jìn)行中文垃圾郵件過(guò)濾,實(shí)驗(yàn)結(jié)果也證明了這一點(diǎn)。本文的內(nèi)容大致可以分為四部分。首先介紹了垃圾郵件過(guò)濾研究的背景、意義、國(guó)內(nèi)外研究現(xiàn)狀以及本文的主要研究工作,并給出了各個(gè)章節(jié)的內(nèi)容安排。其次,對(duì)電子郵件的基本知識(shí)進(jìn)行簡(jiǎn)要的介紹,主要包括電子郵件的工作原理,電子郵件傳...
【文章來(lái)源】:鄭州大學(xué)河南省 211工程院校
【文章頁(yè)數(shù)】:62 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景
1.2 研究意義
1.3 國(guó)內(nèi)外研究現(xiàn)狀及本文主要工作
1.3.1 國(guó)內(nèi)外研究現(xiàn)狀
1.3.2 本文主要工作
1.4 本文組織安排
2 電子郵件基本知識(shí)及其預(yù)處理
2.1 垃圾郵件的定義及其分類(lèi)
2.2 電子郵件的工作原理
2.3 電子郵件相關(guān)協(xié)議
2.3.1 SMTP協(xié)議
2.3.2 POP3協(xié)議
2.3.3 IMAP協(xié)議
2.3.4 MIME協(xié)議
2.4 中文電子郵件的預(yù)處理
2.4.1 中文分詞
2.4.2 去停用詞
2.4.3 特征選擇
2.4.3.1 信息增益
2.4.3.2 互信息
2.4.3.3 文檔頻率
2.4.3.4 χ~2統(tǒng)計(jì)量
2.4.4 特征值的計(jì)算
3 垃圾郵件過(guò)濾技術(shù)及文本分類(lèi)算法
3.1 垃圾郵件過(guò)濾技術(shù)
3.1.1 基于IP層的過(guò)濾
3.1.2 基于SMTP協(xié)議的過(guò)濾
3.1.3 基于內(nèi)容的過(guò)濾
3.2 垃圾郵件過(guò)濾與文本分類(lèi)
3.3 常用的文本分類(lèi)算法
3.3.1 樸素貝葉斯算法
3.3.2 K近鄰算法
3.3.3 支持向量機(jī)算法
3.3.4 決策樹(shù)算法
4 基于粒子群優(yōu)化的支持向量機(jī)垃圾郵件過(guò)濾
4.1 支持向量機(jī)算法參數(shù)分析
4.2 遺傳算法簡(jiǎn)介
4.3 遺傳優(yōu)化的支持向量機(jī)
4.4 粒子群算法
4.5 粒子群優(yōu)化的支持向量機(jī)
4.6 PSO-SVM較GA-SVM優(yōu)勢(shì)分析
4.7 PSO-SVM垃圾郵件過(guò)濾
5 實(shí)驗(yàn)結(jié)果與分析
5.1 實(shí)驗(yàn)介紹
5.2 實(shí)驗(yàn)軟硬件環(huán)境
5.3 實(shí)驗(yàn)垃圾郵件語(yǔ)料庫(kù)
5.4 郵件預(yù)處理
5.5 實(shí)驗(yàn)的性能評(píng)估指標(biāo)
5.6 實(shí)驗(yàn)結(jié)果
5.7 性能分析
6 結(jié)論與展望
6.1 本文工作總結(jié)
6.2 未來(lái)工作展望
參考文獻(xiàn)
致謝
個(gè)人簡(jiǎn)歷、在學(xué)期間發(fā)表的學(xué)術(shù)論文
【參考文獻(xiàn)】:
期刊論文
[1]基于Log4j改進(jìn)的日志存儲(chǔ)應(yīng)用研究[J]. 郭節(jié). 軟件導(dǎo)刊. 2011(01)
[2]基于REST Web服務(wù)的資源定位方法研究[J]. 鐘約夫. 自動(dòng)化與儀器儀表. 2010(05)
[3]Hibernate緩存機(jī)制研究與應(yīng)用[J]. 敖小玲,黃晉. 計(jì)算機(jī)與現(xiàn)代化. 2010(09)
[4]面向資源的RESTful Web應(yīng)用研究[J]. 潘冰. 微計(jì)算機(jī)應(yīng)用. 2010(07)
[5]Grails框架研究[J]. 舒丹. 銅仁學(xué)院學(xué)報(bào). 2010(02)
[6]淺談Grails面向領(lǐng)域Web應(yīng)用開(kāi)發(fā)[J]. 張浩,王廣興. 微型電腦應(yīng)用. 2009(08)
[7]基于Grails框架的Web應(yīng)用開(kāi)發(fā)[J]. 蔡波斯. 計(jì)算機(jī)應(yīng)用與軟件. 2009(08)
[8]基于REST架構(gòu)風(fēng)格的Web 2.0實(shí)現(xiàn)[J]. 戴亞娥,俞成海,堯飄海,李艷芳. 計(jì)算機(jī)系統(tǒng)應(yīng)用. 2009(07)
[9]數(shù)據(jù)交換格式的研究和應(yīng)用[J]. 蘭素秋,孫淑霞,彭武杰. 電腦與電信. 2009(07)
[10]基于Spring框架的輕量級(jí)J2EE架構(gòu)與應(yīng)用[J]. 胡啟敏,薛錦云,鐘林輝. 計(jì)算機(jī)工程與應(yīng)用. 2008(05)
博士論文
[1]Java虛擬機(jī)的自適應(yīng)動(dòng)態(tài)優(yōu)化[D]. 鄒瓊.中國(guó)科學(xué)技術(shù)大學(xué) 2008
碩士論文
[1]基于REST架構(gòu)風(fēng)格的Web服務(wù)的研究和設(shè)計(jì)[D]. 楊波.江蘇大學(xué) 2010
[2]基于Grails的Web應(yīng)用研究[D]. 穆利偉.北京交通大學(xué) 2010
[3]基于MVC模式的Web開(kāi)發(fā)框架Ruby on Rails的研究[D]. 孫奇.北京交通大學(xué) 2009
[4]輕量級(jí)J2EE架構(gòu)的研究與應(yīng)用[D]. 李金海.山東理工大學(xué) 2007
[5]基于J2EE和MVC模式的Web應(yīng)用研究[D]. 劉繼華.武漢理工大學(xué) 2003
本文編號(hào):3586594
【文章來(lái)源】:鄭州大學(xué)河南省 211工程院校
【文章頁(yè)數(shù)】:62 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景
1.2 研究意義
1.3 國(guó)內(nèi)外研究現(xiàn)狀及本文主要工作
1.3.1 國(guó)內(nèi)外研究現(xiàn)狀
1.3.2 本文主要工作
1.4 本文組織安排
2 電子郵件基本知識(shí)及其預(yù)處理
2.1 垃圾郵件的定義及其分類(lèi)
2.2 電子郵件的工作原理
2.3 電子郵件相關(guān)協(xié)議
2.3.1 SMTP協(xié)議
2.3.2 POP3協(xié)議
2.3.3 IMAP協(xié)議
2.3.4 MIME協(xié)議
2.4 中文電子郵件的預(yù)處理
2.4.1 中文分詞
2.4.2 去停用詞
2.4.3 特征選擇
2.4.3.1 信息增益
2.4.3.2 互信息
2.4.3.3 文檔頻率
2.4.3.4 χ~2統(tǒng)計(jì)量
2.4.4 特征值的計(jì)算
3 垃圾郵件過(guò)濾技術(shù)及文本分類(lèi)算法
3.1 垃圾郵件過(guò)濾技術(shù)
3.1.1 基于IP層的過(guò)濾
3.1.2 基于SMTP協(xié)議的過(guò)濾
3.1.3 基于內(nèi)容的過(guò)濾
3.2 垃圾郵件過(guò)濾與文本分類(lèi)
3.3 常用的文本分類(lèi)算法
3.3.1 樸素貝葉斯算法
3.3.2 K近鄰算法
3.3.3 支持向量機(jī)算法
3.3.4 決策樹(shù)算法
4 基于粒子群優(yōu)化的支持向量機(jī)垃圾郵件過(guò)濾
4.1 支持向量機(jī)算法參數(shù)分析
4.2 遺傳算法簡(jiǎn)介
4.3 遺傳優(yōu)化的支持向量機(jī)
4.4 粒子群算法
4.5 粒子群優(yōu)化的支持向量機(jī)
4.6 PSO-SVM較GA-SVM優(yōu)勢(shì)分析
4.7 PSO-SVM垃圾郵件過(guò)濾
5 實(shí)驗(yàn)結(jié)果與分析
5.1 實(shí)驗(yàn)介紹
5.2 實(shí)驗(yàn)軟硬件環(huán)境
5.3 實(shí)驗(yàn)垃圾郵件語(yǔ)料庫(kù)
5.4 郵件預(yù)處理
5.5 實(shí)驗(yàn)的性能評(píng)估指標(biāo)
5.6 實(shí)驗(yàn)結(jié)果
5.7 性能分析
6 結(jié)論與展望
6.1 本文工作總結(jié)
6.2 未來(lái)工作展望
參考文獻(xiàn)
致謝
個(gè)人簡(jiǎn)歷、在學(xué)期間發(fā)表的學(xué)術(shù)論文
【參考文獻(xiàn)】:
期刊論文
[1]基于Log4j改進(jìn)的日志存儲(chǔ)應(yīng)用研究[J]. 郭節(jié). 軟件導(dǎo)刊. 2011(01)
[2]基于REST Web服務(wù)的資源定位方法研究[J]. 鐘約夫. 自動(dòng)化與儀器儀表. 2010(05)
[3]Hibernate緩存機(jī)制研究與應(yīng)用[J]. 敖小玲,黃晉. 計(jì)算機(jī)與現(xiàn)代化. 2010(09)
[4]面向資源的RESTful Web應(yīng)用研究[J]. 潘冰. 微計(jì)算機(jī)應(yīng)用. 2010(07)
[5]Grails框架研究[J]. 舒丹. 銅仁學(xué)院學(xué)報(bào). 2010(02)
[6]淺談Grails面向領(lǐng)域Web應(yīng)用開(kāi)發(fā)[J]. 張浩,王廣興. 微型電腦應(yīng)用. 2009(08)
[7]基于Grails框架的Web應(yīng)用開(kāi)發(fā)[J]. 蔡波斯. 計(jì)算機(jī)應(yīng)用與軟件. 2009(08)
[8]基于REST架構(gòu)風(fēng)格的Web 2.0實(shí)現(xiàn)[J]. 戴亞娥,俞成海,堯飄海,李艷芳. 計(jì)算機(jī)系統(tǒng)應(yīng)用. 2009(07)
[9]數(shù)據(jù)交換格式的研究和應(yīng)用[J]. 蘭素秋,孫淑霞,彭武杰. 電腦與電信. 2009(07)
[10]基于Spring框架的輕量級(jí)J2EE架構(gòu)與應(yīng)用[J]. 胡啟敏,薛錦云,鐘林輝. 計(jì)算機(jī)工程與應(yīng)用. 2008(05)
博士論文
[1]Java虛擬機(jī)的自適應(yīng)動(dòng)態(tài)優(yōu)化[D]. 鄒瓊.中國(guó)科學(xué)技術(shù)大學(xué) 2008
碩士論文
[1]基于REST架構(gòu)風(fēng)格的Web服務(wù)的研究和設(shè)計(jì)[D]. 楊波.江蘇大學(xué) 2010
[2]基于Grails的Web應(yīng)用研究[D]. 穆利偉.北京交通大學(xué) 2010
[3]基于MVC模式的Web開(kāi)發(fā)框架Ruby on Rails的研究[D]. 孫奇.北京交通大學(xué) 2009
[4]輕量級(jí)J2EE架構(gòu)的研究與應(yīng)用[D]. 李金海.山東理工大學(xué) 2007
[5]基于J2EE和MVC模式的Web應(yīng)用研究[D]. 劉繼華.武漢理工大學(xué) 2003
本文編號(hào):3586594
本文鏈接:http://www.sikaile.net/guanlilunwen/ydhl/3586594.html
最近更新
教材專(zhuān)著