基于半監(jiān)督學(xué)習(xí)的惡意URL檢測方法
發(fā)布時(shí)間:2024-02-02 13:56
檢測惡意URL對防御網(wǎng)絡(luò)攻擊有著重要意義.針對有監(jiān)督學(xué)習(xí)需要大量有標(biāo)簽樣本這一問題,本文采用半監(jiān)督學(xué)習(xí)方式訓(xùn)練惡意URL檢測模型,減少了為數(shù)據(jù)打標(biāo)簽帶來的成本開銷.在傳統(tǒng)半監(jiān)督學(xué)習(xí)協(xié)同訓(xùn)練(co-training)的基礎(chǔ)上進(jìn)行了算法改進(jìn),利用專家知識與Doc2Vec兩種方法預(yù)處理的數(shù)據(jù)訓(xùn)練兩個(gè)分類器,篩選兩個(gè)分類器預(yù)測結(jié)果相同且置信度高的數(shù)據(jù)打上偽標(biāo)簽(pseudo-labeled)后用于分類器繼續(xù)學(xué)習(xí).實(shí)驗(yàn)結(jié)果表明,本文方法只用0.67%的有標(biāo)簽數(shù)據(jù)即可訓(xùn)練出檢測精確度(precision)分別達(dá)到99.42%和95.23%的兩個(gè)不同類型分類器,與有監(jiān)督學(xué)習(xí)性能相近,比自訓(xùn)練與協(xié)同訓(xùn)練表現(xiàn)更優(yōu)異.
【文章頁數(shù)】:10 頁
本文編號:3892775
【文章頁數(shù)】:10 頁
本文編號:3892775
本文鏈接:http://www.sikaile.net/guanlilunwen/ydhl/3892775.html
最近更新
教材專著