基于隨機森林的數據庫入侵檢測研究
發(fā)布時間:2021-01-11 02:33
數據庫是信息系統(tǒng)中極易被攻擊的一個環(huán)節(jié),其安全問題備受關注。入侵檢測是安全技術的重要方法之一,也是數據庫安全機制的組成部分。入侵檢測的本質是分類,因此分類算法對入侵檢測系統(tǒng)起著至關重要的作用。隨機森林具有集成學習理論、高效數據處理能力和參數設置簡單等優(yōu)點。本文對隨機森林算法在數據庫入侵檢測中的應用進行研究。本文介紹了數據庫安防和入侵檢測的相關內容,研究了數據庫的常見攻擊手段以及數據庫入侵檢測的主要技術,分析了決策樹、梯度提升決策樹和隨機森林的三種分類算法應用于數據庫入侵檢測中的優(yōu)缺點。針對隨機森林算法元分類器精度不足的問題,本文給出了以梯度提升決策樹作為元分類器的隨機森林數據庫入侵檢測算法。在提升分類精度的同時,改進算法中對原始數據集進行的重采樣處理,可以降低噪聲數據的關聯(lián)性,而其中的隨機投票機制還可以從一定程度上過濾掉單個元分類器出現過擬合的情況,降低了整體模型出現過擬合的可能性。此外,針對單棵梯度提升決策樹在數據庫入侵檢測應用中容易出現過擬合的問題,本文給出了通過相關參數,控制樹的深度,進行剪枝操作,降低模型的復雜度的改進方案。為了驗證改進算法的性能,本文選擇了9組UCI公有數據集...
【文章來源】:河北大學河北省
【文章頁數】:64 頁
【學位級別】:碩士
【部分圖文】:
多階段控制的數據庫入侵容忍框架圖
圖 2-2 數據挖掘技術識別用戶行為模式的過程示意圖(2)數據挖掘中的聚類分析方法聚類分析能夠將數據劃分為不同的簇,并且在不同簇中尋找對象最大的相似化。對行為進行劃分設置,使系統(tǒng)中不同的簇之間能夠產生多種類別,就能夠將正常行
基于數據挖掘的入侵檢測流程圖
本文編號:2969900
【文章來源】:河北大學河北省
【文章頁數】:64 頁
【學位級別】:碩士
【部分圖文】:
多階段控制的數據庫入侵容忍框架圖
圖 2-2 數據挖掘技術識別用戶行為模式的過程示意圖(2)數據挖掘中的聚類分析方法聚類分析能夠將數據劃分為不同的簇,并且在不同簇中尋找對象最大的相似化。對行為進行劃分設置,使系統(tǒng)中不同的簇之間能夠產生多種類別,就能夠將正常行
基于數據挖掘的入侵檢測流程圖
本文編號:2969900
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/2969900.html