一種基于stacking集成學習的DGA域名檢測方法
發(fā)布時間:2021-11-16 00:09
目前針對基于機器學習的DGA算法生成域名檢測方法普遍存在的特征信息不全、檢測精度不高等問題,提出了一種基于stacking集成學習的DGA域名檢測方法。通過挖掘正常域名和DGA生成域名的字符特征、語言特征,并進一步提取出域名的衍生特征HMM系數共同作為域名特征,選擇距離預測方法的KNN模型和基于超平面分類方法的SVM模型,并使用基于梯度提升迭代決策樹方法的Cat Boost模型共同作為基分類器,同時以SVM作為第二層元分類器進行回歸,通過stacking集成學習方法對DGA域名進行檢測。實驗證明,該方法一定程度的提升了檢測的精確度和召回率。
【文章來源】:數據通信. 2020,(06)
【文章頁數】:6 頁
【部分圖文】:
基于stacking集成學習的DGA域名檢測方法
步驟3:當基學習器Mx個數不為1時重復步驟1、2,并將每一次步驟2的預測結果ynstage_x與對應標簽yn數據作為元學習器的輸入數據并訓練。本文實驗強分類器的需求通過支持向量機(SVM)的線性核函數已能實現,不需進一步通過非線性核函數和優(yōu)化調參,模型精度較高,且對過擬合有理論保證;KNN算法訓練代價低,在類域重復交疊較多的樣本集下分類效果更好;Cat Boost是通過選擇決策樹為基礎預測器并使用GBDT進行分類的監(jiān)督機器學習算法,其計算樣本梯度不取決于所選樣本,而是剔除樣本后的整體梯度,可以避免特征空間梯度域真實梯度分布偏移而造成的過擬合。
stacking集成方法流程圖
【參考文獻】:
期刊論文
[1]基于混合詞向量深度學習模型的DGA域名檢測方法[J]. 杜鵬,丁世飛. 計算機研究與發(fā)展. 2020(02)
[2]基于XGBoost特征選擇的疾病診斷XLC-Stacking方法[J]. 岳鵬,侯凌燕,楊大利,佟強. 計算機工程與應用. 2020(17)
[3]集成學習在短文本分類中的應用研究[J]. 王國薇,黃浩,周剛,胡英. 現代電子技術. 2019(24)
[4]基于文本和DNS查詢的非常規(guī)域名檢測研究[J]. 李建飛,成衛(wèi)青. 計算機技術與發(fā)展. 2020(02)
[5]特征選擇方法綜述[J]. 李郅琴,杜建強,聶斌,熊旺平,黃燦奕,李歡. 計算機工程與應用. 2019(24)
[6]DGA惡意域名檢測方法[J]. 蔣鴻玲,戴俊偉. 北京信息科技大學學報(自然科學版). 2019(05)
[7]基于加權支持向量機的Domain Flux僵尸網絡域名檢測方法研究[J]. 宋金偉,楊進,李濤. 信息網絡安全. 2018(12)
[8]特征選擇穩(wěn)定性研究綜述[J]. 劉藝,曹建軍,刁興春,周星. 軟件學報. 2018(09)
[9]基于IP分布及請求響應時間的惡意fast-flux域名檢測算法[J]. 袁福祥,王琤,劉粉林,鞏道福. 信息工程大學學報. 2017(05)
[10]基于詞素特征的輕量級域名檢測算法[J]. 張維維,龔儉,劉茜,劉尚東,胡曉艷. 軟件學報. 2016(09)
本文編號:3497783
【文章來源】:數據通信. 2020,(06)
【文章頁數】:6 頁
【部分圖文】:
基于stacking集成學習的DGA域名檢測方法
步驟3:當基學習器Mx個數不為1時重復步驟1、2,并將每一次步驟2的預測結果ynstage_x與對應標簽yn數據作為元學習器的輸入數據并訓練。本文實驗強分類器的需求通過支持向量機(SVM)的線性核函數已能實現,不需進一步通過非線性核函數和優(yōu)化調參,模型精度較高,且對過擬合有理論保證;KNN算法訓練代價低,在類域重復交疊較多的樣本集下分類效果更好;Cat Boost是通過選擇決策樹為基礎預測器并使用GBDT進行分類的監(jiān)督機器學習算法,其計算樣本梯度不取決于所選樣本,而是剔除樣本后的整體梯度,可以避免特征空間梯度域真實梯度分布偏移而造成的過擬合。
stacking集成方法流程圖
【參考文獻】:
期刊論文
[1]基于混合詞向量深度學習模型的DGA域名檢測方法[J]. 杜鵬,丁世飛. 計算機研究與發(fā)展. 2020(02)
[2]基于XGBoost特征選擇的疾病診斷XLC-Stacking方法[J]. 岳鵬,侯凌燕,楊大利,佟強. 計算機工程與應用. 2020(17)
[3]集成學習在短文本分類中的應用研究[J]. 王國薇,黃浩,周剛,胡英. 現代電子技術. 2019(24)
[4]基于文本和DNS查詢的非常規(guī)域名檢測研究[J]. 李建飛,成衛(wèi)青. 計算機技術與發(fā)展. 2020(02)
[5]特征選擇方法綜述[J]. 李郅琴,杜建強,聶斌,熊旺平,黃燦奕,李歡. 計算機工程與應用. 2019(24)
[6]DGA惡意域名檢測方法[J]. 蔣鴻玲,戴俊偉. 北京信息科技大學學報(自然科學版). 2019(05)
[7]基于加權支持向量機的Domain Flux僵尸網絡域名檢測方法研究[J]. 宋金偉,楊進,李濤. 信息網絡安全. 2018(12)
[8]特征選擇穩(wěn)定性研究綜述[J]. 劉藝,曹建軍,刁興春,周星. 軟件學報. 2018(09)
[9]基于IP分布及請求響應時間的惡意fast-flux域名檢測算法[J]. 袁福祥,王琤,劉粉林,鞏道福. 信息工程大學學報. 2017(05)
[10]基于詞素特征的輕量級域名檢測算法[J]. 張維維,龔儉,劉茜,劉尚東,胡曉艷. 軟件學報. 2016(09)
本文編號:3497783
本文鏈接:http://www.sikaile.net/guanlilunwen/ydhl/3497783.html
最近更新
教材專著