GBDT與LR融合模型在加密流量識別中的應用
發(fā)布時間:2021-06-15 16:42
隨著網(wǎng)絡應用服務類型的多樣化以及網(wǎng)絡流量加密技術的不斷發(fā)展,加密流量識別已經(jīng)成為網(wǎng)絡安全領域的一個重大挑戰(zhàn)。傳統(tǒng)的流量識別技術如深度包檢測無法有效地識別加密流量,而基于機器學習理論的加密流量識別技術則表現(xiàn)出很好的效果。因此,本文提出一種融合梯度提升決策樹算法(GBDT)與邏輯回歸(LR)算法的加密流量分類模型,使用貝葉斯優(yōu)化(BO)算法進行超參數(shù)調(diào)整,利用與時間相關的流特征對普通加密流量與VPN加密流量進行識別,實現(xiàn)了整體高于90%的流量識別準確度,與其他常用分類模型相比擁有更好的識別效果。
【文章來源】:計算機與現(xiàn)代化. 2020,(03)
【文章頁數(shù)】:6 頁
【部分圖文】:
GBDT-LR模型訓練示意圖
在GBDT算法中,每一次迭代的預測值都是將之前所有決策樹的預測值以串行的方式累加的,新決策樹是向擬合之前決策樹的殘差的方向形成。在一系列的決策樹形成過程中,結點分裂會首先關注于能區(qū)分多數(shù)樣本的特征,然后關注于能區(qū)分少數(shù)樣本的特征。這種先選用整體上有區(qū)分度的特征,再選用對少數(shù)樣本有區(qū)分度的特征的方式用于特征工程是比較合理的。因此,新的特征同時包含了能區(qū)分多數(shù)樣本和少數(shù)樣本的特征,這種策略剛好適用于特征工程。3 基于GBDT與LR融合模型的加密流量識別
GBDT-LR分類器訓練流程圖
【參考文獻】:
期刊論文
[1]基于深度卷積神經(jīng)網(wǎng)絡的網(wǎng)絡流量分類方法[J]. 王勇,周慧怡,俸皓,葉苗,柯文龍. 通信學報. 2018(01)
本文編號:3231417
【文章來源】:計算機與現(xiàn)代化. 2020,(03)
【文章頁數(shù)】:6 頁
【部分圖文】:
GBDT-LR模型訓練示意圖
在GBDT算法中,每一次迭代的預測值都是將之前所有決策樹的預測值以串行的方式累加的,新決策樹是向擬合之前決策樹的殘差的方向形成。在一系列的決策樹形成過程中,結點分裂會首先關注于能區(qū)分多數(shù)樣本的特征,然后關注于能區(qū)分少數(shù)樣本的特征。這種先選用整體上有區(qū)分度的特征,再選用對少數(shù)樣本有區(qū)分度的特征的方式用于特征工程是比較合理的。因此,新的特征同時包含了能區(qū)分多數(shù)樣本和少數(shù)樣本的特征,這種策略剛好適用于特征工程。3 基于GBDT與LR融合模型的加密流量識別
GBDT-LR分類器訓練流程圖
【參考文獻】:
期刊論文
[1]基于深度卷積神經(jīng)網(wǎng)絡的網(wǎng)絡流量分類方法[J]. 王勇,周慧怡,俸皓,葉苗,柯文龍. 通信學報. 2018(01)
本文編號:3231417
本文鏈接:http://www.sikaile.net/guanlilunwen/ydhl/3231417.html
最近更新
教材專著