基于深度自編碼和決策樹(shù)的惡意域名檢測(cè)
發(fā)布時(shí)間:2021-11-05 04:56
針對(duì)目前惡意域名檢測(cè)方法特征提取過(guò)程復(fù)雜和檢測(cè)準(zhǔn)確率不高的問(wèn)題,提出一種基于深度自編碼和決策樹(shù)(Deep Auto Encoder and Decision Tree, DAE-DT)的惡意域名檢測(cè)算法.該算法首先將每一域名按照域名詞法組成與結(jié)構(gòu)等屬性進(jìn)行特征映射,并進(jìn)行正則化處理;然后將正則化處理后的無(wú)標(biāo)簽域名數(shù)據(jù)隨機(jī)置0作為模型的輸入,域名字符統(tǒng)計(jì)特征作為輸出,構(gòu)造深度自編碼網(wǎng)絡(luò)模型.并通過(guò)計(jì)算模型輸出值與未處理數(shù)據(jù)之間的重構(gòu)誤差,實(shí)現(xiàn)各層參數(shù)與權(quán)值的優(yōu)化,以增強(qiáng)模型的魯棒性;最后依據(jù)提取的域名字符統(tǒng)計(jì)特征構(gòu)造惡意域名判定的決策樹(shù).通過(guò)在Alexa和Malware domain list等標(biāo)準(zhǔn)數(shù)據(jù)集上進(jìn)行測(cè)試.實(shí)驗(yàn)結(jié)果表明,該模型的檢測(cè)準(zhǔn)確率、精確率、假陰性率和假陽(yáng)性率值分別為95.21%、94.17%、2.41%和3.63%.
【文章來(lái)源】:微電子學(xué)與計(jì)算機(jī). 2020,37(05)北大核心
【文章頁(yè)數(shù)】:5 頁(yè)
【部分圖文】:
有監(jiān)督訓(xùn)練流程
Accuracy曲線
圖2 Accuracy曲線由圖2可知,在訓(xùn)練與測(cè)試初期,模型的準(zhǔn)確率隨著訓(xùn)練步數(shù)的增加而快速上升,且訓(xùn)練準(zhǔn)確率高于測(cè)試準(zhǔn)確率;由圖3可知,在訓(xùn)練初期模型的loss值隨著訓(xùn)練步數(shù)的增加快速下降,且訓(xùn)練loss值低于測(cè)試loss值,表明該模型具有較好的訓(xùn)練與測(cè)試效果.
【參考文獻(xiàn)】:
期刊論文
[1]深度自編碼網(wǎng)絡(luò)在入侵檢測(cè)中的應(yīng)用研究[J]. 丁紅衛(wèi),萬(wàn)良,龍廷艷. 哈爾濱工業(yè)大學(xué)學(xué)報(bào). 2019(05)
[2]基于決策樹(shù)的病毒檢測(cè)算法[J]. 朱俚治. 計(jì)算機(jī)與數(shù)字工程. 2015(06)
本文編號(hào):3477119
【文章來(lái)源】:微電子學(xué)與計(jì)算機(jī). 2020,37(05)北大核心
【文章頁(yè)數(shù)】:5 頁(yè)
【部分圖文】:
有監(jiān)督訓(xùn)練流程
Accuracy曲線
圖2 Accuracy曲線由圖2可知,在訓(xùn)練與測(cè)試初期,模型的準(zhǔn)確率隨著訓(xùn)練步數(shù)的增加而快速上升,且訓(xùn)練準(zhǔn)確率高于測(cè)試準(zhǔn)確率;由圖3可知,在訓(xùn)練初期模型的loss值隨著訓(xùn)練步數(shù)的增加快速下降,且訓(xùn)練loss值低于測(cè)試loss值,表明該模型具有較好的訓(xùn)練與測(cè)試效果.
【參考文獻(xiàn)】:
期刊論文
[1]深度自編碼網(wǎng)絡(luò)在入侵檢測(cè)中的應(yīng)用研究[J]. 丁紅衛(wèi),萬(wàn)良,龍廷艷. 哈爾濱工業(yè)大學(xué)學(xué)報(bào). 2019(05)
[2]基于決策樹(shù)的病毒檢測(cè)算法[J]. 朱俚治. 計(jì)算機(jī)與數(shù)字工程. 2015(06)
本文編號(hào):3477119
本文鏈接:http://www.sikaile.net/guanlilunwen/ydhl/3477119.html
最近更新
教材專著