天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

遺傳算法和貝葉斯模型在垃圾郵件過濾中的應用

發(fā)布時間:2017-12-08 10:03

  本文關(guān)鍵詞:遺傳算法和貝葉斯模型在垃圾郵件過濾中的應用


  更多相關(guān)文章: 垃圾郵件過濾 互信息 卡方統(tǒng)計 遺傳算法 貝葉斯分類模型


【摘要】:隨著科學技術(shù)的快速發(fā)展和互聯(lián)網(wǎng)時代的到來,電子郵件以其方便、快捷、低成本的特點成為人們工作、生活不可缺少的通訊工具。但是電子郵件的快速發(fā)展也讓某些不法商人看到其中的巨大利益,垃圾郵件隨之出現(xiàn)并且日益泛濫。垃圾郵件在互聯(lián)網(wǎng)上的傳播不僅浪費互聯(lián)網(wǎng)資源,而且成為有害信息和惡意軟件傳播的重要途徑。由于數(shù)量龐大的垃圾郵件對個人和企業(yè)的利益都造成了嚴重危害,反垃圾郵件的相關(guān)技術(shù)和政策隨之出現(xiàn)。在早期的反垃圾郵件技術(shù)中,研究者們提出了基于黑白名單的過濾技術(shù)、基于關(guān)鍵字的過濾技術(shù)、基于自定義規(guī)則的過濾技術(shù)等。這些方法能在一定程度上遏制垃圾郵件的傳播,但是由于本身規(guī)則固定、且需要大量人工維護,目前都只是作為輔助手段。針對這些反垃圾郵件技術(shù)的缺點,研究者們提出了基于概率統(tǒng)計和機器學習的過濾技術(shù),如貝葉斯分類技術(shù)。研究者們對于原始的貝葉斯分類技術(shù)進行了很多方面的改進,比如樸素貝葉斯分類模型以及AODE分類模型。針對實際應用場景中對實時性的要求,也有研究者提出了AAPE分類模型。但是AAPE分類模型在選擇父屬性時沒有考慮屬性本身的順序?qū)Ψ诸惤Y(jié)果的影響,因此有可能導致分類早期的分類正確率較差。本文中針對AAPE分類模型的不足,提出了基于遺傳算法和特征項權(quán)重的GAAPE分類模型,在計算資源和分類結(jié)果之間取得動態(tài)平衡。本文的主要研究成果如下:1.將遺傳算法和特征項權(quán)重計算方法引入AAPE分類模型,提出了GAAPE分類模型。分別利用屬性平均互信息和卡方統(tǒng)計信息的大小作為遺傳算法適應度函數(shù)的依據(jù),使用遺傳算法將屬性排序后分別計算SPODE。結(jié)果顯示GAAPE分類模型分類效果比AAPE好,特別是在分類的早期能迅速降低分類錯誤率。2.設(shè)計并實現(xiàn)了一個基于GAAPE模型的垃圾郵件過濾系統(tǒng)原型。該系統(tǒng)引入了黑白名單和關(guān)鍵字過濾技術(shù)作為第一階段的初步過濾,實現(xiàn)了以GAAPE分類模型為主體的第二階段的智能過濾。通過實驗測試,GAAPE分類模型比AAPE分類模型在分類準確度上有明顯的提升,達到了過濾的即時性和準確性的動態(tài)平衡。
【學位授予單位】:電子科技大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:TP393.098;TP18

【參考文獻】

中國期刊全文數(shù)據(jù)庫 前4條

1 陳治平;王雷;;基于自學習K近鄰的垃圾郵件過濾算法[J];計算機應用;2005年S1期

2 陳志賢;;垃圾郵件過濾技術(shù)研究綜述[J];計算機應用研究;2009年05期

3 黃昌寧;趙海;;中文分詞十年回顧[J];中文信息學報;2007年03期

4 石民;李斌;陳小荷;;基于CRF的先秦漢語分詞標注一體化研究[J];中文信息學報;2010年02期

中國碩士學位論文全文數(shù)據(jù)庫 前1條

1 金彩琴;基于意圖分析的垃圾郵件過濾研究[D];陜西師范大學;2011年

,

本文編號:1265946

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/guanlilunwen/ydhl/1265946.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶f63d6***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com