一種HTTPS應用的層次分類方法
發(fā)布時間:2021-07-01 07:11
HTTPS協(xié)議用以網站服務器的身份認證,提供交換數(shù)據的保密性和完整性。然而一些不法分子利用HTTPS頁面散布不良信息,這給通信流量的管理和安全分析帶來了新的挑戰(zhàn)。因此,準確識別基于SSL/TLS的HTTPS加密應用,對于提高網絡服務質量、優(yōu)化網絡帶寬分配、加強安全管控有著重要意義,F(xiàn)有的方法大多側重于直接識別網站和應用程序,而很少關注類別的層次性結構。本文提出一種根據HTTPS應用類別的樹狀層次結構,自頂向下,逐層分類識別的方法,在頂層根據簽名和樣本流的關聯(lián)關系將業(yè)務流識別為對應的大類,在次頂層提取檢測流的特征值,使用隨機森林模型分類為對應的最底層子類。實驗結果表明,該方法能克服直接識別方法分類誤差高的缺點,提高業(yè)務識別的精確率。
【文章來源】:網絡新媒體技術. 2020,9(03)
【文章頁數(shù)】:7 頁
【部分圖文】:
HTTPS應用層次結構
本文提出一個多層次的HTTPS應用分類方法-MLCM(Multi-level Classification Method)。在樹狀的分類體系中,在頂層,采用證書域名簽名分類識別應用的提供者,次頂層為每一個提供者構建機器學習分類器分類子應用。多層次HTTPS應用分類的整體結構如圖2所示。在預處理階段,需要訓練頂層和次頂層的分類器,頂層分類器的訓練旨在建立簽名和流的匹配表,次頂層分類器根據流的統(tǒng)計特征建立分類模型。步驟①-步驟⑦展示了實際應用場景中應用識別的流程,步驟1負責對網絡中的SSL/TLS流量進行提取并對流進行重組,步驟2提取流的證書域信息簽名,步驟3對業(yè)務流進行第一次分類,步驟4得出分類的應用提供者。并且為了防止無法識別重連的SSL/TLS會話(無證書和密鑰交換信息),需要收集會話Session ID和服務器IP的對應集,并給予應用提供者標識,這是在步驟4a做的操作。步驟5提取應用流的統(tǒng)計特征,步驟6運用應用提供者的特定模型精確的識別應用,步驟7輸出次頂層分類器識別的結果。1.1 頂層分類
由于加密流量的不確定性,因此很難對其進行識別。有很多關于HTTPS流量分類的研究,他們都偏向直接識別應用,忽略了應用本身的層次信息。本文提出一種基于簽名和流特征的層次分類方法-MLCM,來對HTTPS應用進行精細分類識別。該方法能克服單一簽名或流特征識別HTTPS應用精度不夠且容易產生誤報的缺點,且對網絡中實際產生的流量分類性能較好。在未來的工作中,我們計劃研究其他可用于簽名的SSL/TLS字段和識別HTTPS應用的流特征,提高識別性能。圖4 SCU_DATASET分類結果
【參考文獻】:
期刊論文
[1]基于深度卷積神經網絡的網絡流量分類方法[J]. 王勇,周慧怡,俸皓,葉苗,柯文龍. 通信學報. 2018(01)
[2]基于特征加權的樸素貝葉斯流量分類方法研究[J]. 張澤鑫,李俊,常向青. 高技術通訊. 2016(02)
[3]使用貝葉斯學習算法分類網絡流量[J]. 邱密,陽愛民,劉永定,何震凱. 計算機工程與應用. 2010(25)
碩士論文
[1]基于深度學習的網絡流量識別關鍵技術研究[D]. 李玎.戰(zhàn)略支援部隊信息工程大學 2018
[2]Website指紋識別攻擊與防護技術研究[D]. 吳家順.南京理工大學 2013
本文編號:3258690
【文章來源】:網絡新媒體技術. 2020,9(03)
【文章頁數(shù)】:7 頁
【部分圖文】:
HTTPS應用層次結構
本文提出一個多層次的HTTPS應用分類方法-MLCM(Multi-level Classification Method)。在樹狀的分類體系中,在頂層,采用證書域名簽名分類識別應用的提供者,次頂層為每一個提供者構建機器學習分類器分類子應用。多層次HTTPS應用分類的整體結構如圖2所示。在預處理階段,需要訓練頂層和次頂層的分類器,頂層分類器的訓練旨在建立簽名和流的匹配表,次頂層分類器根據流的統(tǒng)計特征建立分類模型。步驟①-步驟⑦展示了實際應用場景中應用識別的流程,步驟1負責對網絡中的SSL/TLS流量進行提取并對流進行重組,步驟2提取流的證書域信息簽名,步驟3對業(yè)務流進行第一次分類,步驟4得出分類的應用提供者。并且為了防止無法識別重連的SSL/TLS會話(無證書和密鑰交換信息),需要收集會話Session ID和服務器IP的對應集,并給予應用提供者標識,這是在步驟4a做的操作。步驟5提取應用流的統(tǒng)計特征,步驟6運用應用提供者的特定模型精確的識別應用,步驟7輸出次頂層分類器識別的結果。1.1 頂層分類
由于加密流量的不確定性,因此很難對其進行識別。有很多關于HTTPS流量分類的研究,他們都偏向直接識別應用,忽略了應用本身的層次信息。本文提出一種基于簽名和流特征的層次分類方法-MLCM,來對HTTPS應用進行精細分類識別。該方法能克服單一簽名或流特征識別HTTPS應用精度不夠且容易產生誤報的缺點,且對網絡中實際產生的流量分類性能較好。在未來的工作中,我們計劃研究其他可用于簽名的SSL/TLS字段和識別HTTPS應用的流特征,提高識別性能。圖4 SCU_DATASET分類結果
【參考文獻】:
期刊論文
[1]基于深度卷積神經網絡的網絡流量分類方法[J]. 王勇,周慧怡,俸皓,葉苗,柯文龍. 通信學報. 2018(01)
[2]基于特征加權的樸素貝葉斯流量分類方法研究[J]. 張澤鑫,李俊,常向青. 高技術通訊. 2016(02)
[3]使用貝葉斯學習算法分類網絡流量[J]. 邱密,陽愛民,劉永定,何震凱. 計算機工程與應用. 2010(25)
碩士論文
[1]基于深度學習的網絡流量識別關鍵技術研究[D]. 李玎.戰(zhàn)略支援部隊信息工程大學 2018
[2]Website指紋識別攻擊與防護技術研究[D]. 吳家順.南京理工大學 2013
本文編號:3258690
本文鏈接:http://www.sikaile.net/guanlilunwen/ydhl/3258690.html
最近更新
教材專著