基于卷積神經網絡的Android流量分類方法
發(fā)布時間:2021-07-16 19:56
深度學習就是機器學習研究的過程,主要通過模擬人腦分析學習的過程對數據進行分析。目前,深度學習技術已經在計算機視覺、語音識別、自然語言處理等領域獲得了較大發(fā)展,并且隨著該技術的不斷發(fā)展,為網絡流量分類和異常檢測帶來了新的發(fā)展方向。移動智能手機與大家的生活息息相關,但是其存在的安全問題也日益凸顯。針對傳統(tǒng)機器學習算法對于流量分類需要人工提取特征、計算量大的問題,提出了基于卷積神經網絡模型的應用程序流量分類算法。首先,將網絡流量數據集進行數據預處理,去除無關數據字段,并使數據滿足卷積神經網絡的輸入特性。其次,設計了一種新的卷積神經網絡模型,從網絡結構、超參數空間以及參數優(yōu)化方面入手,構造了最優(yōu)分類模型。該模型通過卷積層自主學習數據特征,解決了傳統(tǒng)基于機器學習的流量分類算法中的特征選擇問題。最后,通過CICAndmal2017網絡公開數據集進行模型測試,相比于傳統(tǒng)的機器學習流量分類模型,設計的卷積神經網絡模型的查準率和查全率分別提高了2.93%和11.87%,同時在類精度、召回率以及F1分數方面都有較好的提升。
【文章來源】:通信技術. 2020,53(02)
【文章頁數】:6 頁
【部分圖文】:
流量數據位圖可視化效果
流量數據位圖可視化效果
流量數據的實際概念是按層次結構組織的一維字節(jié)流。這類數據主要由字節(jié)、數據包、會話和結構信息組成。這類序列類型數據非常適合采用卷積神經網絡進行流量分類。進一步地,預處理后的流量數據規(guī)模和每張圖片的尺寸都類似于MNIST手寫體識別數據信息,因此本文采用LeNet-5[10]的CNN結構,模型結構如圖2所示。流量數據處理的具體過程如下。首先輸入層接收IDX格式的流量圖像信息,并適當調整像素值,讓其由0~255直接轉換為0~1,實現(xiàn)歸一化。在卷積層C1運算處理時,流量數據經過卷積層C1,由尺寸為5×5的卷積核進行處理。由于C1層共具有32個通道,所以最終會生成32個尺寸為28×28的特征圖。經過處理的特征圖進入池化層P1,該層會對特征圖進行一次2×2的最大值池化處理,最終生成為32個尺寸為14×14的特征圖。經過池化操作的特征圖進入第二個卷積層C2,該卷積層的卷積核尺寸與C1相同,都是5×5,但是該層共具有64個通道,所以最后會生成64個尺寸為14×14的特征圖。然后進入第二個池化層P2,在此層會對特征圖進行2×2的最大值池化操作,與P1層操作相同,所以共生成64個7×7的特征圖;接著會被兩個全連接層處理,最后輸出數據其輸出節(jié)點數分別為1 024和10。最后,使用一個Softmax函數將輸出結果轉換為0~1的概率值。CNN各層輸入、輸出及參數設置如表1所示。
本文編號:3287661
【文章來源】:通信技術. 2020,53(02)
【文章頁數】:6 頁
【部分圖文】:
流量數據位圖可視化效果
流量數據位圖可視化效果
流量數據的實際概念是按層次結構組織的一維字節(jié)流。這類數據主要由字節(jié)、數據包、會話和結構信息組成。這類序列類型數據非常適合采用卷積神經網絡進行流量分類。進一步地,預處理后的流量數據規(guī)模和每張圖片的尺寸都類似于MNIST手寫體識別數據信息,因此本文采用LeNet-5[10]的CNN結構,模型結構如圖2所示。流量數據處理的具體過程如下。首先輸入層接收IDX格式的流量圖像信息,并適當調整像素值,讓其由0~255直接轉換為0~1,實現(xiàn)歸一化。在卷積層C1運算處理時,流量數據經過卷積層C1,由尺寸為5×5的卷積核進行處理。由于C1層共具有32個通道,所以最終會生成32個尺寸為28×28的特征圖。經過處理的特征圖進入池化層P1,該層會對特征圖進行一次2×2的最大值池化處理,最終生成為32個尺寸為14×14的特征圖。經過池化操作的特征圖進入第二個卷積層C2,該卷積層的卷積核尺寸與C1相同,都是5×5,但是該層共具有64個通道,所以最后會生成64個尺寸為14×14的特征圖。然后進入第二個池化層P2,在此層會對特征圖進行2×2的最大值池化操作,與P1層操作相同,所以共生成64個7×7的特征圖;接著會被兩個全連接層處理,最后輸出數據其輸出節(jié)點數分別為1 024和10。最后,使用一個Softmax函數將輸出結果轉換為0~1的概率值。CNN各層輸入、輸出及參數設置如表1所示。
本文編號:3287661
本文鏈接:http://www.sikaile.net/guanlilunwen/ydhl/3287661.html
最近更新
教材專著