基于機器學(xué)習的網(wǎng)絡(luò)入侵檢測技術(shù)研究
發(fā)布時間:2023-02-09 19:16
隨著互聯(lián)網(wǎng)的飛速發(fā)展,智能化的信息時代為惡意人員的數(shù)據(jù)泄露、網(wǎng)絡(luò)攻擊等行為提供了更多可能性,網(wǎng)絡(luò)安全面臨嚴峻挑戰(zhàn)。入侵檢測是用于檢測計算機網(wǎng)絡(luò)系統(tǒng)中的入侵行為的新型信息安全技術(shù),基于機器學(xué)習的入侵檢測方法相比于傳統(tǒng)的基于規(guī)則的方法能更好地識別未知的異常以及應(yīng)對大數(shù)據(jù)時代龐大且復(fù)雜的日志數(shù)據(jù)。本文以NSL-KDD網(wǎng)絡(luò)入侵檢測數(shù)據(jù)集為研究對象,研究了采用決策樹(Decision Tree,DT)、隨機森林(Random Forests,RF)、梯度提升決策樹(Gradient Boosting Decision Tree,GBDT)、極端梯度提升決策樹(e Xtreme Gradient Boosting,XGBoost)和支持向量機(Support Vector Machine,SVM)五種機器學(xué)習算法進行網(wǎng)絡(luò)入侵檢測,并設(shè)計了基于樹模型+Boruta模式的新型特征選擇算法來提升五種機器學(xué)習模型的檢測效果,為實際網(wǎng)絡(luò)入侵檢測項目提供參考與指導(dǎo)。本文首先對NSL-KDD數(shù)據(jù)集進行預(yù)處理,用XGBoost實現(xiàn)特征選擇,通過網(wǎng)格搜索技術(shù)尋找決策樹、隨機森林、GBDT、XGBoost、SVM五種...
【文章頁數(shù)】:93 頁
【學(xué)位級別】:碩士
【文章目錄】:
致謝
摘要
ABSTRACT
1 緒論
1.1 課題背景及意義
1.2 國內(nèi)外發(fā)展歷史及現(xiàn)狀
1.3 發(fā)展方向
1.4 本文主要研究內(nèi)容
1.5 本文的組織結(jié)構(gòu)
2 入侵檢測研究理論基礎(chǔ)
2.1 數(shù)據(jù)預(yù)處理和特征選擇概述
2.1.1 數(shù)據(jù)預(yù)處理的必要性與常用方法
2.1.2 特征選擇的必要性與常用方法
2.2 入侵檢測模型評估指標
2.3 模型參數(shù)優(yōu)化方法
2.3.1 交叉驗證
2.3.2 網(wǎng)格搜索
2.4 Person相關(guān)系數(shù)
2.5 機器學(xué)習模型理論基礎(chǔ)
2.5.1 決策樹
2.5.2 隨機森林
2.5.3 GBDT
2.5.4 XGBoost
2.5.5 SVM
2.6 本章小結(jié)
3 基于樹模型+Boruta模式的特征選擇算法
3.1 Boruta特征選擇算法
3.1.1 傳統(tǒng)Boruta算法
3.1.2 BorutaShap
3.1.3 BoostARoota
3.2 樹模型+BoostARoota算法思想及設(shè)計
3.3 樹模型+CatBoruta算法
3.3.1 CatBoost算法
3.3.2 CatBoruta算法思想及設(shè)計
3.3.3 樹模型+CatBoruta算法思想及設(shè)計
3.4 本章小結(jié)
4 實驗對比與分析
4.1 數(shù)據(jù)集描述與預(yù)處理方法
4.1.1 數(shù)據(jù)集描述
4.1.2 數(shù)據(jù)預(yù)處理方法
4.2 XGBoost特征選擇效果分析
4.3 機器學(xué)習模型參數(shù)尋優(yōu)
4.3.1 隨機森林參數(shù)尋優(yōu)
4.3.2 決策樹參數(shù)尋優(yōu)
4.3.3 SVM參數(shù)尋優(yōu)
4.3.4 GBDT參數(shù)尋優(yōu)
4.3.5 XGBoost參數(shù)尋優(yōu)方法
4.4 基于機器學(xué)習的網(wǎng)絡(luò)入侵檢測實驗
4.5 實驗結(jié)果對比與分析
4.5.1 XGBoost特征選擇方案
4.5.2 樹模型+BoostARoota特征選擇方案
4.5.3 樹模型+CatBoruta特征選擇方案
4.6 本章小結(jié)
5 總結(jié)與展望
參考文獻
作者簡歷及攻讀碩士學(xué)位期間取得的研究成果
學(xué)位論文數(shù)據(jù)集
本文編號:3739101
【文章頁數(shù)】:93 頁
【學(xué)位級別】:碩士
【文章目錄】:
致謝
摘要
ABSTRACT
1 緒論
1.1 課題背景及意義
1.2 國內(nèi)外發(fā)展歷史及現(xiàn)狀
1.3 發(fā)展方向
1.4 本文主要研究內(nèi)容
1.5 本文的組織結(jié)構(gòu)
2 入侵檢測研究理論基礎(chǔ)
2.1 數(shù)據(jù)預(yù)處理和特征選擇概述
2.1.1 數(shù)據(jù)預(yù)處理的必要性與常用方法
2.1.2 特征選擇的必要性與常用方法
2.2 入侵檢測模型評估指標
2.3 模型參數(shù)優(yōu)化方法
2.3.1 交叉驗證
2.3.2 網(wǎng)格搜索
2.4 Person相關(guān)系數(shù)
2.5 機器學(xué)習模型理論基礎(chǔ)
2.5.1 決策樹
2.5.2 隨機森林
2.5.3 GBDT
2.5.4 XGBoost
2.5.5 SVM
2.6 本章小結(jié)
3 基于樹模型+Boruta模式的特征選擇算法
3.1 Boruta特征選擇算法
3.1.1 傳統(tǒng)Boruta算法
3.1.2 BorutaShap
3.1.3 BoostARoota
3.2 樹模型+BoostARoota算法思想及設(shè)計
3.3 樹模型+CatBoruta算法
3.3.1 CatBoost算法
3.3.2 CatBoruta算法思想及設(shè)計
3.3.3 樹模型+CatBoruta算法思想及設(shè)計
3.4 本章小結(jié)
4 實驗對比與分析
4.1 數(shù)據(jù)集描述與預(yù)處理方法
4.1.1 數(shù)據(jù)集描述
4.1.2 數(shù)據(jù)預(yù)處理方法
4.2 XGBoost特征選擇效果分析
4.3 機器學(xué)習模型參數(shù)尋優(yōu)
4.3.1 隨機森林參數(shù)尋優(yōu)
4.3.2 決策樹參數(shù)尋優(yōu)
4.3.3 SVM參數(shù)尋優(yōu)
4.3.4 GBDT參數(shù)尋優(yōu)
4.3.5 XGBoost參數(shù)尋優(yōu)方法
4.4 基于機器學(xué)習的網(wǎng)絡(luò)入侵檢測實驗
4.5 實驗結(jié)果對比與分析
4.5.1 XGBoost特征選擇方案
4.5.2 樹模型+BoostARoota特征選擇方案
4.5.3 樹模型+CatBoruta特征選擇方案
4.6 本章小結(jié)
5 總結(jié)與展望
參考文獻
作者簡歷及攻讀碩士學(xué)位期間取得的研究成果
學(xué)位論文數(shù)據(jù)集
本文編號:3739101
本文鏈接:http://www.sikaile.net/guanlilunwen/lindaojc/3739101.html
最近更新
教材專著