基于多特征的惡意代碼分類研究
發(fā)布時間:2021-03-04 19:33
隨著信息技術(shù)進(jìn)入新的時代尤其是5G技術(shù)的發(fā)展,信息傳遞進(jìn)入高速共享的階段。各種未知形式未知領(lǐng)域的惡意代碼層出不窮,使得惡意代碼的檢測工作面臨巨大挑戰(zhàn)。傳統(tǒng)的惡意代碼特征匹配檢測方法針對當(dāng)今網(wǎng)絡(luò)環(huán)境中形式豐富的惡意代碼顯得無所適從。越來越多的計算機(jī)新技術(shù)應(yīng)用到惡意代碼檢測當(dāng)中,針對惡意代碼及其變種取得了較好的檢測效果,將機(jī)器學(xué)習(xí)算法和深度學(xué)習(xí)算法應(yīng)用到惡意代碼檢測當(dāng)中是時下熱門的研究內(nèi)容。針對傳統(tǒng)惡意代碼分類效率低,特征提取單一,準(zhǔn)確性差的的問題。本文提出了兩種分類方式,第一種人工提取多種特征且不局限于文本特征結(jié)合隨機(jī)森林算法進(jìn)行惡意代碼分類。本文選擇將匯編操作碼抽象為灰度圖像,圖像可視化的特點可以有效地發(fā)現(xiàn)新的特征。本文將惡意軟件源文件經(jīng)過IDA反編譯后生成.bytes文件和.asm文件,.asm文件可以從兩個角度提取特征。首先可以通過N-Gram算法提取文本特征,其次可以將.asm文件圖像化轉(zhuǎn)化成為灰度圖像,灰度圖像可以提取兩方面的特征分別是顏色特征和紋理特征,最后結(jié)合隨機(jī)森林算法進(jìn)行分類。然而人工提取特征需要花費(fèi)大量的時間對隨機(jī)森林的各個參數(shù)進(jìn)行調(diào)整,才能使不同的特征構(gòu)建的隨機(jī)森林...
【文章來源】:武漢郵電科學(xué)研究院湖北省
【文章頁數(shù)】:76 頁
【學(xué)位級別】:碩士
【部分圖文】:
傳統(tǒng)模式
武漢郵電科學(xué)研究院碩士學(xué)位論文18所欠缺,其檢測流程如圖2-1所示。圖2-1傳統(tǒng)模式本文的核心思路是轉(zhuǎn)變傳統(tǒng)單一切入點的弊病,著眼于多角度結(jié)合多方位特征選取結(jié)合機(jī)器學(xué)習(xí)算法和深度學(xué)習(xí)算法在處理數(shù)據(jù)時的特殊優(yōu)勢,提高準(zhǔn)確率和效率。由此本文選擇兩種方案進(jìn)行惡意代碼分類,第一種方案是多特征結(jié)合隨機(jī)森林算法完成惡意代碼分類,這種方案特征矩陣的構(gòu)建尤為重要。增加特征選擇的切入角度,將特征選擇總體上分為局部特征和全面特征,又根據(jù)匯編操作碼的抽象形式不同細(xì)化的分為文本特征和圖像特征。N-Gram算法在處理語法和語音分析方面具有獨特的優(yōu)勢能夠最大程度展現(xiàn)詞與詞之間的關(guān)聯(lián)程度可以作為文本特征的選取方式,而針對圖像特征,灰度圖像可以直觀的從色彩、灰度級和灰度圖本身所具有的一些參數(shù)來輔助分析惡意代碼抽象化后的圖像特征,圖2-3是第一種方案的設(shè)計流程圖。第二種方案利用B2M算法將惡意代碼的轉(zhuǎn)化為灰度圖像,然后設(shè)計一個卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),實現(xiàn)數(shù)據(jù)的自動訓(xùn)練和特征挖掘最終輸出分類結(jié)果如圖2-2所示。圖2-2灰度圖像+卷積神經(jīng)網(wǎng)絡(luò)
多特征+隨機(jī)森林算法
【參考文獻(xiàn)】:
期刊論文
[1]基于交叉驗證網(wǎng)格尋優(yōu)隨機(jī)森林的黑產(chǎn)用戶識別方法[J]. 章文俊,韓曉龍. 科技視界. 2019(28)
[2]基于N-gram的惡意代碼分類系統(tǒng)設(shè)計研究[J]. 蘇晗舶,黃迎春. 網(wǎng)絡(luò)安全技術(shù)與應(yīng)用. 2019(07)
[3]基于矩陣分解與隨機(jī)森林的多準(zhǔn)則推薦算法[J]. 林栢全,肖菁. 華南師范大學(xué)學(xué)報(自然科學(xué)版). 2019(02)
[4]基于大樣本的隨機(jī)森林惡意代碼檢測與分類算法[J]. 李雪虎,王發(fā)明,戰(zhàn)凱. 信息技術(shù)與網(wǎng)絡(luò)安全. 2018(07)
[5]基于隨機(jī)森林的惡意代碼檢測[J]. 戴逸輝,殷旭東. 網(wǎng)絡(luò)空間安全. 2018(02)
[6]機(jī)器學(xué)習(xí)中的特征選擇方法研究及展望[J]. 崔鴻雁,徐帥,張利鋒,Roy E.Welsch,Berthold K.P.Horn. 北京郵電大學(xué)學(xué)報. 2018(01)
[7]基于N-Gram與加權(quán)分類器集成的惡意代碼檢測[J]. 王衛(wèi)紅,朱雨辰. 浙江工業(yè)大學(xué)學(xué)報. 2017(06)
[8]基于改進(jìn)隨機(jī)森林算法的Android惡意軟件檢測[J]. 楊宏宇,徐晉. 通信學(xué)報. 2017(04)
[9]熵可視化方法在惡意代碼分類中的應(yīng)用[J]. 任卓君,陳光. 計算機(jī)工程. 2017(09)
[10]基于詞素特征的輕量級域名檢測算法[J]. 張維維,龔儉,劉茜,劉尚東,胡曉艷. 軟件學(xué)報. 2016(09)
碩士論文
[1]基于灰度共生矩陣木材表面紋理模式識別方法的研究[D]. 王輝.東北林業(yè)大學(xué) 2007
本文編號:3063783
【文章來源】:武漢郵電科學(xué)研究院湖北省
【文章頁數(shù)】:76 頁
【學(xué)位級別】:碩士
【部分圖文】:
傳統(tǒng)模式
武漢郵電科學(xué)研究院碩士學(xué)位論文18所欠缺,其檢測流程如圖2-1所示。圖2-1傳統(tǒng)模式本文的核心思路是轉(zhuǎn)變傳統(tǒng)單一切入點的弊病,著眼于多角度結(jié)合多方位特征選取結(jié)合機(jī)器學(xué)習(xí)算法和深度學(xué)習(xí)算法在處理數(shù)據(jù)時的特殊優(yōu)勢,提高準(zhǔn)確率和效率。由此本文選擇兩種方案進(jìn)行惡意代碼分類,第一種方案是多特征結(jié)合隨機(jī)森林算法完成惡意代碼分類,這種方案特征矩陣的構(gòu)建尤為重要。增加特征選擇的切入角度,將特征選擇總體上分為局部特征和全面特征,又根據(jù)匯編操作碼的抽象形式不同細(xì)化的分為文本特征和圖像特征。N-Gram算法在處理語法和語音分析方面具有獨特的優(yōu)勢能夠最大程度展現(xiàn)詞與詞之間的關(guān)聯(lián)程度可以作為文本特征的選取方式,而針對圖像特征,灰度圖像可以直觀的從色彩、灰度級和灰度圖本身所具有的一些參數(shù)來輔助分析惡意代碼抽象化后的圖像特征,圖2-3是第一種方案的設(shè)計流程圖。第二種方案利用B2M算法將惡意代碼的轉(zhuǎn)化為灰度圖像,然后設(shè)計一個卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),實現(xiàn)數(shù)據(jù)的自動訓(xùn)練和特征挖掘最終輸出分類結(jié)果如圖2-2所示。圖2-2灰度圖像+卷積神經(jīng)網(wǎng)絡(luò)
多特征+隨機(jī)森林算法
【參考文獻(xiàn)】:
期刊論文
[1]基于交叉驗證網(wǎng)格尋優(yōu)隨機(jī)森林的黑產(chǎn)用戶識別方法[J]. 章文俊,韓曉龍. 科技視界. 2019(28)
[2]基于N-gram的惡意代碼分類系統(tǒng)設(shè)計研究[J]. 蘇晗舶,黃迎春. 網(wǎng)絡(luò)安全技術(shù)與應(yīng)用. 2019(07)
[3]基于矩陣分解與隨機(jī)森林的多準(zhǔn)則推薦算法[J]. 林栢全,肖菁. 華南師范大學(xué)學(xué)報(自然科學(xué)版). 2019(02)
[4]基于大樣本的隨機(jī)森林惡意代碼檢測與分類算法[J]. 李雪虎,王發(fā)明,戰(zhàn)凱. 信息技術(shù)與網(wǎng)絡(luò)安全. 2018(07)
[5]基于隨機(jī)森林的惡意代碼檢測[J]. 戴逸輝,殷旭東. 網(wǎng)絡(luò)空間安全. 2018(02)
[6]機(jī)器學(xué)習(xí)中的特征選擇方法研究及展望[J]. 崔鴻雁,徐帥,張利鋒,Roy E.Welsch,Berthold K.P.Horn. 北京郵電大學(xué)學(xué)報. 2018(01)
[7]基于N-Gram與加權(quán)分類器集成的惡意代碼檢測[J]. 王衛(wèi)紅,朱雨辰. 浙江工業(yè)大學(xué)學(xué)報. 2017(06)
[8]基于改進(jìn)隨機(jī)森林算法的Android惡意軟件檢測[J]. 楊宏宇,徐晉. 通信學(xué)報. 2017(04)
[9]熵可視化方法在惡意代碼分類中的應(yīng)用[J]. 任卓君,陳光. 計算機(jī)工程. 2017(09)
[10]基于詞素特征的輕量級域名檢測算法[J]. 張維維,龔儉,劉茜,劉尚東,胡曉艷. 軟件學(xué)報. 2016(09)
碩士論文
[1]基于灰度共生矩陣木材表面紋理模式識別方法的研究[D]. 王輝.東北林業(yè)大學(xué) 2007
本文編號:3063783
本文鏈接:http://www.sikaile.net/guanlilunwen/ydhl/3063783.html
最近更新
教材專著