天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于統(tǒng)計(jì)的垃圾郵件識(shí)別關(guān)鍵技術(shù)研究

發(fā)布時(shí)間:2017-04-03 21:21

  本文關(guān)鍵詞:基于統(tǒng)計(jì)的垃圾郵件識(shí)別關(guān)鍵技術(shù)研究,由筆耕文化傳播整理發(fā)布。


【摘要】:垃圾郵件識(shí)別是網(wǎng)絡(luò)安全領(lǐng)域的一個(gè)重要研究課題。其中,特征選擇和垃圾郵件在線識(shí)別是垃圾郵件識(shí)別過(guò)程中的關(guān)鍵技術(shù),本文從這兩個(gè)方面出發(fā)進(jìn)行了具體、深入的研究,具體內(nèi)容包括: 1.針對(duì)傳統(tǒng)單純基于文檔頻率或單純基于詞頻信息的特征選擇方法存在的問(wèn)題,提出了一種基于改進(jìn)粒子群尋優(yōu)的混合特征選擇方法。通過(guò)與多種傳統(tǒng)方法比較發(fā)現(xiàn),本文方法較其他特征選擇方法優(yōu)勢(shì)明顯。 2.針對(duì)基于改進(jìn)粒子群的混合特征選擇方法存在的問(wèn)題,提出了一種基于雙閾值及改進(jìn)調(diào)和尋優(yōu)的特征選擇方法。對(duì)傳統(tǒng)調(diào)和尋優(yōu)方法進(jìn)行改進(jìn),解決了尋優(yōu)過(guò)程中當(dāng)全局最優(yōu)值接近實(shí)際最優(yōu)值時(shí)算法收斂速度較慢的問(wèn)題。與傳統(tǒng)方法相比,本文方法在選擇最優(yōu)特征集合方面表現(xiàn)較為突出。 3.為避免垃圾郵件在線學(xué)習(xí)過(guò)程中用戶(hù)興趣對(duì)郵件識(shí)別效果的影響,,提出了一種基于用戶(hù)興趣度的垃圾郵件在線識(shí)別方法。實(shí)驗(yàn)表明,算法在多個(gè)用戶(hù)、單個(gè)用戶(hù)兩種情況下均獲得較高的準(zhǔn)確率,適用于垃圾郵件在線識(shí)別領(lǐng)域。 4.為提高垃圾郵件的在線識(shí)別速度,提出了一種基于用戶(hù)興趣集的垃圾郵件在線快速識(shí)別方法。實(shí)驗(yàn)證明,使用該算法進(jìn)行郵件識(shí)別及訓(xùn)練速度較快,且能以較小的用戶(hù)標(biāo)注負(fù)擔(dān)獲得較高的郵件識(shí)別精度。
【關(guān)鍵詞】:垃圾郵件識(shí)別 特征選擇 文檔頻率 詞頻 在線識(shí)別 增量學(xué)習(xí) 主動(dòng)學(xué)習(xí)
【學(xué)位授予單位】:吉林大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2015
【分類(lèi)號(hào)】:TP393.08
【目錄】:
  • 提要4-5
  • 摘要5-7
  • Abstract7-14
  • 第1章 緒論14-28
  • 1.1 研究背景及意義14-18
  • 1.1.1 垃圾郵件的起源15-16
  • 1.1.2 垃圾郵件的危害16-18
  • 1.2 國(guó)內(nèi)外研究現(xiàn)狀18-25
  • 1.2.1 系統(tǒng)處理方法18-19
  • 1.2.2 基于內(nèi)容的垃圾郵件識(shí)別方法19-24
  • 1.2.3 現(xiàn)存的主要問(wèn)題24-25
  • 1.3 本文研究?jī)?nèi)容25-26
  • 1.4 本文組織結(jié)構(gòu)26-28
  • 第2章 基于統(tǒng)計(jì)的垃圾郵件識(shí)別方法28-47
  • 2.1 框架描述28-43
  • 2.1.1 預(yù)處理29-30
  • 2.1.2 郵件表示30-35
  • 2.1.3 郵件分類(lèi)35-43
  • 2.2 常用數(shù)據(jù)集43-44
  • 2.3 性能評(píng)價(jià)指標(biāo)44-46
  • 2.4 本章小結(jié)46-47
  • 第3章 一種基于改進(jìn)粒子群尋優(yōu)的混合特征選擇方法47-59
  • 3.1 引言47-48
  • 3.2 傳統(tǒng)特征選擇方法存在的問(wèn)題48-49
  • 3.3 本文方法49-53
  • 3.3.1 方法描述49-51
  • 3.3.2 最優(yōu)閾值的選擇51-53
  • 3.4 實(shí)驗(yàn)結(jié)果與分析53-58
  • 3.4.1 實(shí)驗(yàn)準(zhǔn)備53-54
  • 3.4.2 不同尋優(yōu)方法比較54-56
  • 3.4.3 不同特征選擇方法比較56-57
  • 3.4.4 統(tǒng)計(jì)實(shí)驗(yàn)57-58
  • 3.5 本章小結(jié)58-59
  • 第4章 一種基于雙閾值及改進(jìn)調(diào)和尋優(yōu)的特征選擇方法59-76
  • 4.1 研究動(dòng)機(jī)59-60
  • 4.2 本文方法60-66
  • 4.2.1 方法描述60-63
  • 4.2.2 改進(jìn)的調(diào)和尋優(yōu)方法63-66
  • 4.3 實(shí)驗(yàn)結(jié)果與分析66-74
  • 4.3.1 實(shí)驗(yàn)準(zhǔn)備66
  • 4.3.2 不同尋優(yōu)方法比較66-69
  • 4.3.3 不同特征選擇方法比較69-72
  • 4.3.4 統(tǒng)計(jì)實(shí)驗(yàn)72-73
  • 4.3.5 ODFFS、OTFFS 與 THFS 方法比較73-74
  • 4.4 本章小結(jié)74-76
  • 第5章 一種基于用戶(hù)興趣度的垃圾郵件在線識(shí)別方法76-87
  • 5.1 引言76
  • 5.2 相關(guān)技術(shù)76-78
  • 5.2.1 增量學(xué)習(xí)76-78
  • 5.2.2 主動(dòng)學(xué)習(xí)78
  • 5.3 本文方法78-82
  • 5.3.1 預(yù)處理79
  • 5.3.2 特征選擇、樣本訓(xùn)練及分類(lèi)79-80
  • 5.3.3 不確定樣本類(lèi)別標(biāo)注80-81
  • 5.3.4 訓(xùn)練樣本集更新81-82
  • 5.4 實(shí)驗(yàn)結(jié)果與分析82-86
  • 5.4.1 實(shí)驗(yàn)條件82-83
  • 5.4.2 耗時(shí)分析83
  • 5.4.3 實(shí)驗(yàn)結(jié)果83-86
  • 5.5 本章小結(jié)86-87
  • 第6章 一種基于用戶(hù)興趣集的垃圾郵件在線快速識(shí)別方法87-100
  • 6.1 引言87-88
  • 6.2 本文方法88-93
  • 6.2.1 預(yù)處理88
  • 6.2.2 特征選擇及樣本訓(xùn)練88-89
  • 6.2.3 樣本分類(lèi)89-90
  • 6.2.4 不確定樣本類(lèi)別標(biāo)注90-91
  • 6.2.5 更新用戶(hù)興趣集91-92
  • 6.2.6 更新訓(xùn)練樣本集92-93
  • 6.3 實(shí)驗(yàn)結(jié)果與分析93-99
  • 6.3.1 實(shí)驗(yàn)條件93
  • 6.3.2 耗時(shí)分析93-95
  • 6.3.3 實(shí)驗(yàn)結(jié)果95-99
  • 6.4 本章小結(jié)99-100
  • 第7章 總結(jié)和展望100-103
  • 7.1 本文工作總結(jié)100-102
  • 7.2 未來(lái)研究展望102-103
  • 參考文獻(xiàn)103-112
  • 作者簡(jiǎn)介及在學(xué)期間所取得的科研成果112-115
  • 致謝115

【參考文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條

1 張永;周振龍;侯莉莉;張世宏;;使用增量SVM進(jìn)行文本分類(lèi)[J];蘭州理工大學(xué)學(xué)報(bào);2007年01期

2 吳偉寧;劉揚(yáng);郭茂祖;劉曉燕;;基于采樣策略的主動(dòng)學(xué)習(xí)算法研究進(jìn)展[J];計(jì)算機(jī)研究與發(fā)展;2012年06期

3 陳小全;張繼紅;;基于改進(jìn)粒子群算法的聚類(lèi)算法[J];計(jì)算機(jī)研究與發(fā)展;2012年S1期

4 王熙照,孫娟,楊宏偉,趙明華;模糊決策樹(shù)算法與清晰決策樹(shù)算法的比較研究[J];計(jì)算機(jī)工程與應(yīng)用;2003年21期

5 蔡虹;葉水生;張永;;一種基于粗糙-模糊集理論的分類(lèi)規(guī)則挖掘方法[J];計(jì)算機(jī)工程與應(yīng)用;2006年02期

6 石霞軍;林亞平;陳治平;;基于最小風(fēng)險(xiǎn)的貝葉斯郵件過(guò)濾算法[J];計(jì)算機(jī)科學(xué);2002年08期

7 夏桂梅;曾建潮;;一種基于輪盤(pán)賭選擇遺傳算法的隨機(jī)微粒群算法[J];計(jì)算機(jī)工程與科學(xué);2007年06期

8 劉伍穎;王挺;;集成學(xué)習(xí)和主動(dòng)學(xué)習(xí)相結(jié)合的個(gè)性化垃圾郵件過(guò)濾[J];計(jì)算機(jī)工程與科學(xué);2011年09期

9 丁文軍;薛安榮;;基于SVM的Web文本快速增量分類(lèi)算法[J];計(jì)算機(jī)應(yīng)用研究;2012年04期

10 王斌,潘文鋒;基于內(nèi)容的垃圾郵件過(guò)濾技術(shù)綜述[J];中文信息學(xué)報(bào);2005年05期

中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前2條

1 劉伍穎;面向垃圾信息過(guò)濾的主動(dòng)多域?qū)W習(xí)文本分類(lèi)方法研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2011年

2 陳彬;垃圾郵件的特征選擇及檢測(cè)方法研究[D];華南理工大學(xué);2010年


  本文關(guān)鍵詞:基于統(tǒng)計(jì)的垃圾郵件識(shí)別關(guān)鍵技術(shù)研究,由筆耕文化傳播整理發(fā)布。



本文編號(hào):285003

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/shoufeilunwen/xxkjbs/285003.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)6ba42***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com