基于機器學習的加密流量識別算法研究
發(fā)布時間:2022-09-29 16:46
隨著信息技術(shù)的不斷發(fā)展,網(wǎng)絡(luò)中充斥的各種各樣的加密流量,而為了有效識別各類應(yīng)用的加密流量,以提高網(wǎng)絡(luò)管理、改善網(wǎng)絡(luò)服務(wù)、保障網(wǎng)絡(luò)環(huán)境安全,加密流量的特征提取和應(yīng)用識別顯得越來越重要。本文在機器學習算法的基礎(chǔ)上,就加密流量識別算法進行研究,本文的主要工作如下:1)本文首先分析總結(jié)了傳統(tǒng)流量識別方法,對比了各個方法的優(yōu)缺點以及適用場景,并進一步分析了傳統(tǒng)方法在當前加密流量爆發(fā)式增長的網(wǎng)絡(luò)環(huán)境下面臨的困境。然后分析了機器學習方法相比于傳統(tǒng)流量識別方法的優(yōu)勢所在。2)本文基于Bagging提出了一種面向應(yīng)用的加密流量識別算法,借助數(shù)據(jù)流統(tǒng)計特征對加密流量對應(yīng)的應(yīng)用類型進行分類,并利用孤立森林對特征數(shù)據(jù)集中的噪聲樣本進行去除,以進一步提高算法的準確率。在該算法的基礎(chǔ)上,對應(yīng)用進一步細化分類,嘗試對應(yīng)用的功能模塊的進行識別,并提出了一種面向功能的加密流量識別算法。在功能識別中,由于數(shù)據(jù)流統(tǒng)計特征難以覆蓋所有功能,本文引入了負載特征作為輔助,并有效提高了算法的識別準確率。最后通過實驗測試了兩個算法分別在應(yīng)用識別和功能識別的識別效果,均取得較高的準確率、精確率、召回率。3)本文在上述兩個算法的基礎(chǔ)上,...
【文章頁數(shù)】:68 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 研究背景及意義
1.2 研究現(xiàn)狀
1.3 本文的主要研究內(nèi)容
1.3.1 流量特征提取
1.3.2 傳統(tǒng)流量識別方法
1.3.3 基于機器學習的流量識別算法
1.3.4 并行優(yōu)化
1.4 文章架構(gòu)
第2章 相關(guān)背景知識
2.1 常見加密協(xié)議
2.2 加密流量特征提取
2.3 流量識別方法
2.3.1 基于端口的流量識別技術(shù)
2.3.2 深度報文檢測技術(shù)
2.3.3 基于行為特征的流量識別技術(shù)
2.4 機器學習
2.4.1 支持向量機算法
2.4.2 C4.5決策樹算法
2.4.3 樸素貝葉斯算法
2.4.4 效果評估標準
2.5 集成學習
2.5.1 Boosting
2.5.2 Bagging
2.5.3 Stacking
2.5.4 集成學習組合策略
第3章 面向應(yīng)用的加密流量識別算法
3.1 數(shù)據(jù)集
3.1.1 ISCX VPN-non VPN數(shù)據(jù)集
3.1.2 捕獲數(shù)據(jù)集
3.2 特征選擇
3.2.1 條件熵
3.2.2 基于條件熵的特征選擇
3.3 噪聲處理
3.3.1 孤立森林
3.3.2 基于孤立深林的噪聲處理
3.4 算法設(shè)計
3.5 實驗結(jié)果
3.5.1 機器學習算法效果對比
3.5.2 噪聲數(shù)據(jù)影響
3.6 本章小結(jié)
第4章 面向功能的加密流量識別算法
4.1 數(shù)據(jù)集
4.2 特征選擇
4.2.1 數(shù)據(jù)流統(tǒng)計特征
4.2.2 負載特征
4.3 算法設(shè)計
4.4 實驗結(jié)果
4.4.1 機器學習算法效果對比
4.4.2 特征影響
4.5 本章小結(jié)
第5章 基于SPARK的并行優(yōu)化方法
5.1 整體框架
5.2 基于SPARK的 BAGGING算法優(yōu)化
5.2.1 數(shù)據(jù)并行策略
5.2.2 任務(wù)并行策略
5.3 實驗結(jié)果
5.3.1 識別效果
5.3.2 識別效率
5.4 本章小結(jié)
結(jié)論
參考文獻
攻讀碩士學位期間發(fā)表的論文及其它成果
致謝
本文編號:3682947
【文章頁數(shù)】:68 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 研究背景及意義
1.2 研究現(xiàn)狀
1.3 本文的主要研究內(nèi)容
1.3.1 流量特征提取
1.3.2 傳統(tǒng)流量識別方法
1.3.3 基于機器學習的流量識別算法
1.3.4 并行優(yōu)化
1.4 文章架構(gòu)
第2章 相關(guān)背景知識
2.1 常見加密協(xié)議
2.2 加密流量特征提取
2.3 流量識別方法
2.3.1 基于端口的流量識別技術(shù)
2.3.2 深度報文檢測技術(shù)
2.3.3 基于行為特征的流量識別技術(shù)
2.4 機器學習
2.4.1 支持向量機算法
2.4.2 C4.5決策樹算法
2.4.3 樸素貝葉斯算法
2.4.4 效果評估標準
2.5 集成學習
2.5.1 Boosting
2.5.2 Bagging
2.5.3 Stacking
2.5.4 集成學習組合策略
第3章 面向應(yīng)用的加密流量識別算法
3.1 數(shù)據(jù)集
3.1.1 ISCX VPN-non VPN數(shù)據(jù)集
3.1.2 捕獲數(shù)據(jù)集
3.2 特征選擇
3.2.1 條件熵
3.2.2 基于條件熵的特征選擇
3.3 噪聲處理
3.3.1 孤立森林
3.3.2 基于孤立深林的噪聲處理
3.4 算法設(shè)計
3.5 實驗結(jié)果
3.5.1 機器學習算法效果對比
3.5.2 噪聲數(shù)據(jù)影響
3.6 本章小結(jié)
第4章 面向功能的加密流量識別算法
4.1 數(shù)據(jù)集
4.2 特征選擇
4.2.1 數(shù)據(jù)流統(tǒng)計特征
4.2.2 負載特征
4.3 算法設(shè)計
4.4 實驗結(jié)果
4.4.1 機器學習算法效果對比
4.4.2 特征影響
4.5 本章小結(jié)
第5章 基于SPARK的并行優(yōu)化方法
5.1 整體框架
5.2 基于SPARK的 BAGGING算法優(yōu)化
5.2.1 數(shù)據(jù)并行策略
5.2.2 任務(wù)并行策略
5.3 實驗結(jié)果
5.3.1 識別效果
5.3.2 識別效率
5.4 本章小結(jié)
結(jié)論
參考文獻
攻讀碩士學位期間發(fā)表的論文及其它成果
致謝
本文編號:3682947
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/3682947.html
最近更新
教材專著