基于t-SNE的網(wǎng)絡(luò)攻擊流量無(wú)監(jiān)督聚類(lèi)方法
發(fā)布時(shí)間:2021-03-17 20:05
網(wǎng)絡(luò)攻擊聚類(lèi)是面向無(wú)標(biāo)簽數(shù)據(jù)場(chǎng)景的重要分類(lèi)技術(shù)。在實(shí)際應(yīng)用環(huán)境中,存在大量未標(biāo)記的網(wǎng)絡(luò)數(shù)據(jù)。通過(guò)設(shè)計(jì)聚類(lèi)算法,可以有效的對(duì)這類(lèi)數(shù)據(jù)的安全性進(jìn)行無(wú)監(jiān)督檢測(cè),t-SNE算法可以同時(shí)考慮數(shù)據(jù)的全局關(guān)系和局部關(guān)系,根據(jù)此特點(diǎn)本文選用該算法對(duì)網(wǎng)絡(luò)攻擊行為進(jìn)行檢測(cè)。為了適應(yīng)于t-SNE算法,本文提出了一種適應(yīng)的數(shù)據(jù)預(yù)處理方案。進(jìn)行了基于一個(gè)公開(kāi)網(wǎng)絡(luò)攻擊數(shù)據(jù)集的仿真實(shí)驗(yàn),比較了t-SNE算法與主成份分析(PCA)和自動(dòng)編碼(auto-encoder)的性能差距。實(shí)驗(yàn)表明,t-SNE算法具有較好的網(wǎng)絡(luò)攻擊行為的聚類(lèi)效果。
【文章來(lái)源】:網(wǎng)絡(luò)新媒體技術(shù). 2020,9(06)
【文章頁(yè)數(shù)】:6 頁(yè)
【部分圖文】:
微流預(yù)處理流程圖
(1)截?cái)嗯c補(bǔ)齊。為了構(gòu)造等長(zhǎng)的流,需要截?cái)嗪脱a(bǔ)齊的操作。預(yù)設(shè)每路流固定包含t個(gè)網(wǎng)絡(luò)包,且每個(gè)網(wǎng)絡(luò)包包含k字節(jié)。在已知t和k的條件下,可以對(duì)過(guò)長(zhǎng)的網(wǎng)絡(luò)包或流進(jìn)行截?cái)。而?duì)于過(guò)短的網(wǎng)絡(luò)包或流,需要用0值補(bǔ)齊。一般的,因?yàn)榘^包含了大量有效信息,截?cái)鄶?shù)據(jù)從包頭開(kāi)始。具體流程圖見(jiàn)圖2。
我們?cè)O(shè)計(jì)了3組超參數(shù)對(duì)比組。第一組為學(xué)習(xí)率對(duì)比組(見(jiàn)圖3),其中,迭代周期固定為1000次,困惑度固定為30,學(xué)習(xí)率從0.001到10000分布。具體見(jiàn)圖3?梢钥闯,當(dāng)學(xué)習(xí)率過(guò)大或過(guò)小時(shí),聚類(lèi)效果都不佳,這點(diǎn)與理論分析相符。因此,建議的學(xué)習(xí)率范圍為[10,1000]。第二組為困惑度對(duì)比組(見(jiàn)圖4)。其中,學(xué)習(xí)率固定為100,迭代周期固定為1000次,困惑度的范圍為2到100。可以看出,最佳困惑度在20到50之間。當(dāng)然,實(shí)驗(yàn)中并沒(méi)有出現(xiàn)數(shù)據(jù)和模型對(duì)困惑度不敏感的情況。這說(shuō)明了選擇合適的困惑度有助于優(yōu)化t-SNE算法。
【參考文獻(xiàn)】:
期刊論文
[1]基于遞歸神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)安全事件預(yù)測(cè)[J]. 郝怡然,盛益強(qiáng),王勁林,李超鵬. 網(wǎng)絡(luò)新媒體技術(shù). 2017(05)
本文編號(hào):3087644
【文章來(lái)源】:網(wǎng)絡(luò)新媒體技術(shù). 2020,9(06)
【文章頁(yè)數(shù)】:6 頁(yè)
【部分圖文】:
微流預(yù)處理流程圖
(1)截?cái)嗯c補(bǔ)齊。為了構(gòu)造等長(zhǎng)的流,需要截?cái)嗪脱a(bǔ)齊的操作。預(yù)設(shè)每路流固定包含t個(gè)網(wǎng)絡(luò)包,且每個(gè)網(wǎng)絡(luò)包包含k字節(jié)。在已知t和k的條件下,可以對(duì)過(guò)長(zhǎng)的網(wǎng)絡(luò)包或流進(jìn)行截?cái)。而?duì)于過(guò)短的網(wǎng)絡(luò)包或流,需要用0值補(bǔ)齊。一般的,因?yàn)榘^包含了大量有效信息,截?cái)鄶?shù)據(jù)從包頭開(kāi)始。具體流程圖見(jiàn)圖2。
我們?cè)O(shè)計(jì)了3組超參數(shù)對(duì)比組。第一組為學(xué)習(xí)率對(duì)比組(見(jiàn)圖3),其中,迭代周期固定為1000次,困惑度固定為30,學(xué)習(xí)率從0.001到10000分布。具體見(jiàn)圖3?梢钥闯,當(dāng)學(xué)習(xí)率過(guò)大或過(guò)小時(shí),聚類(lèi)效果都不佳,這點(diǎn)與理論分析相符。因此,建議的學(xué)習(xí)率范圍為[10,1000]。第二組為困惑度對(duì)比組(見(jiàn)圖4)。其中,學(xué)習(xí)率固定為100,迭代周期固定為1000次,困惑度的范圍為2到100。可以看出,最佳困惑度在20到50之間。當(dāng)然,實(shí)驗(yàn)中并沒(méi)有出現(xiàn)數(shù)據(jù)和模型對(duì)困惑度不敏感的情況。這說(shuō)明了選擇合適的困惑度有助于優(yōu)化t-SNE算法。
【參考文獻(xiàn)】:
期刊論文
[1]基于遞歸神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)安全事件預(yù)測(cè)[J]. 郝怡然,盛益強(qiáng),王勁林,李超鵬. 網(wǎng)絡(luò)新媒體技術(shù). 2017(05)
本文編號(hào):3087644
本文鏈接:http://www.sikaile.net/guanlilunwen/ydhl/3087644.html
最近更新
教材專(zhuān)著