天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于分類算法的惡意網(wǎng)頁檢測技術研究

發(fā)布時間:2017-08-23 19:43

  本文關鍵詞:基于分類算法的惡意網(wǎng)頁檢測技術研究


  更多相關文章: 惡意網(wǎng)頁檢測 惡意網(wǎng)頁特征 分類學習算法 支持向量機 自適應學習


【摘要】:隨著web2.0時代的來臨,B/S架構的web應用以其靈活性、易用性和跨平臺性等優(yōu)點而被越來越多的人們所熟悉,隨之而來的惡意網(wǎng)頁攻擊也逐漸成為網(wǎng)絡信息安全的主要威脅之一。有效進行惡意網(wǎng)頁檢測,尤其是對新出現(xiàn)的惡意網(wǎng)頁樣本能夠及時識別和檢測,是當前web安全檢測領域研究的重要內容。 調研國內外專家學者在惡意網(wǎng)頁檢測領域的研究動態(tài)和主要技術手段,分析現(xiàn)有的基于特征匹配的惡意網(wǎng)頁檢測技術雖然可以快速準確地檢測出已知類型的惡意網(wǎng)頁,但存在對混淆變形后的惡意網(wǎng)頁無法識別且對于新出現(xiàn)的惡意網(wǎng)頁也很難有效分辨的問題。針對這一問題,本文提出了在基于惡意網(wǎng)頁特征匹配的基礎上使用分類學習算法對未知類型的網(wǎng)頁進行分類預測的惡意網(wǎng)頁檢測方案。 本文選擇出網(wǎng)頁源碼中24個能夠有效分辨惡意網(wǎng)頁的屬性特征作為訓練分類器的特征向量,分別使用樸素貝葉斯算法、決策樹C4.5算法、分類回歸樹算法和支持向量機四種分類算法在采集的惡意網(wǎng)頁樣本集上進行分類實驗比較,并選擇對惡意網(wǎng)頁具有高識別準確率的支持向量機算法作為我們惡意網(wǎng)頁檢測方案的分類算法。由于惡意網(wǎng)頁的形式不斷增加和更新,標準支持向量機算法很難對新出現(xiàn)的惡意網(wǎng)頁樣本進行正確識別,所以我們使用具有增量學習能力的自適應支持向量機算法在當前分類器的基礎上定期對新采集的惡意網(wǎng)頁樣本進行特征學習,并更新分類器對新惡意網(wǎng)頁樣本的識別能力。 在上述工作的基礎上,本文設計并實現(xiàn)了基于分類算法的惡意網(wǎng)頁檢測系統(tǒng)(CA-MWDS).系統(tǒng)首先使用知識庫中的鏈接地址黑/白名單和惡意代碼特征庫,檢測出已知類型的網(wǎng)頁暗鏈、惡意鏈接和惡意代碼。然后對于第一步檢測中不能判斷是否惡意的網(wǎng)頁源碼,使用基于當前惡意網(wǎng)頁樣本集訓練生成的SVM分類器進行網(wǎng)頁類別預測。對新出現(xiàn)的惡意網(wǎng)頁樣本,系統(tǒng)使用自適應支持向量機算法對當前分類器進行自適應學習,使更新后的分類器能夠有效識別新的惡意網(wǎng)頁。最后,本文通過實驗測試了CA-MWDS系統(tǒng)對惡意網(wǎng)頁檢測的效率和性能,實驗結果表明該系統(tǒng)在惡意網(wǎng)頁檢測中具有高準確率和低誤報率,同時具有自適應學習能力,能準確檢測新出現(xiàn)的惡意網(wǎng)頁。但是同成熟的商業(yè)反病毒軟件相比,系統(tǒng)具有較大的時間開銷,如何在保證對惡意網(wǎng)頁高檢出率和準確率的前提下有效降低系統(tǒng)開銷是我們后期進行系統(tǒng)優(yōu)化的重要方面。
【關鍵詞】:惡意網(wǎng)頁檢測 惡意網(wǎng)頁特征 分類學習算法 支持向量機 自適應學習
【學位授予單位】:北京郵電大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:TP393.08
【目錄】:
  • 摘要4-6
  • ABSTRACT6-10
  • 第一章 緒論10-16
  • 1.1 研究背景10-12
  • 1.2 國內外研究動態(tài)12-13
  • 1.3 課題研究的目的與意義13-14
  • 1.4 論文結構與主要工作14-16
  • 第二章 網(wǎng)頁惡意代碼概述16-24
  • 2.1 網(wǎng)頁惡意代碼定義及發(fā)展歷程16-17
  • 2.1.1 網(wǎng)頁惡意代碼相關概念16
  • 2.1.2 網(wǎng)頁惡意代碼發(fā)展歷程16-17
  • 2.2 網(wǎng)頁惡意腳本攻擊一般流程17-18
  • 2.3 網(wǎng)頁惡意攻擊與漏洞18-20
  • 2.3.1 邏輯型漏洞19
  • 2.3.2 溢出型漏洞19-20
  • 2.4 惡意網(wǎng)頁攻擊常用的技術及典型形式20-22
  • 2.4.1 惡意網(wǎng)頁攻擊常用的技術20-21
  • 2.4.2 網(wǎng)頁惡意代碼的典型形式21-22
  • 2.5 防御惡意網(wǎng)頁攻擊的常用措施22-23
  • 2.6 本章小結23-24
  • 第三章 分類學習算法概述24-32
  • 3.1 樸素貝葉斯算法24-25
  • 3.2 決策樹算法25-26
  • 3.3 分類回歸樹算法26-27
  • 3.4 支持向量機分類算法27-30
  • 3.4.1 統(tǒng)計學習理論27-28
  • 3.4.2 支持向量機算法28-29
  • 3.4.3 支持向量機的主要優(yōu)點29-30
  • 3.5 分類結果評價標準30-31
  • 3.6 本章小結31-32
  • 第四章 基于分類算法的惡意網(wǎng)頁檢測系統(tǒng)設計與實現(xiàn)32-52
  • 4.1 惡意網(wǎng)頁檢測系統(tǒng)總體設計32-34
  • 4.1.1 系統(tǒng)結構32-33
  • 4.1.2 工作流程33-34
  • 4.2 基于知識庫的特征匹配檢測子模塊34-43
  • 4.2.1 惡意代碼特征提取34-38
  • 4.2.2 暗鏈與惡意鏈接檢測38-41
  • 4.2.3 惡意代碼檢測子功能模塊41-43
  • 4.3 基于分類算法的惡意檢測子模塊43-47
  • 4.3.1 樣本特征選擇43-45
  • 4.3.2 分類算法選擇45
  • 4.3.3 分類結果比較45-47
  • 4.4 分類器自適應學習子模塊47-50
  • 4.4.1 標準支持向量機算法的不足47
  • 4.4.2 自適應支持向量機算法47-48
  • 4.4.3 自適應支持向量機算法原理及時空開銷分析48-50
  • 4.5 本章小結50-52
  • 第五章 實驗結果分析52-58
  • 5.1 實驗環(huán)境52
  • 5.2 實驗樣本采集52-54
  • 5.3 實驗結果分析54-57
  • 5.3.1 基于知識庫特征匹配檢測結果54-55
  • 5.3.2 自適應支持向量機算法分類效果55-56
  • 5.3.3 系統(tǒng)惡意網(wǎng)頁掃描效率測試56
  • 5.3.4 系統(tǒng)惡意網(wǎng)頁檢測性能測試56-57
  • 5.4 本章小結57-58
  • 第六章 總結與展望58-60
  • 6.1 本文主要完成的工作58-59
  • 6.2 本文的不足和改進方向59-60
  • 參考文獻60-64
  • 附錄64-68
  • 致謝68-69
  • 攻讀學位期間發(fā)表的學術論文69

【參考文獻】

中國期刊全文數(shù)據(jù)庫 前2條

1 廖凱;;網(wǎng)站安全新隱患——暗鏈[J];中國信息安全;2012年06期

2 張慧琳;鄒維;韓心慧;;網(wǎng)頁木馬機理與防御技術[J];軟件學報;2013年04期

,

本文編號:726940

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/guanlilunwen/ydhl/726940.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶cf1c5***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com