基于統(tǒng)計(jì)方法與深度學(xué)習(xí)的Webshell檢測模型研究與實(shí)現(xiàn)
發(fā)布時間:2021-10-02 08:19
隨著互聯(lián)網(wǎng)的高速發(fā)展,新興產(chǎn)業(yè)迅速崛起,Web系統(tǒng)廣泛應(yīng)用于社交和銀行等重要業(yè)務(wù)。但是,Web系統(tǒng)容易遭受攻擊,嚴(yán)重影響經(jīng)濟(jì)安全和社會穩(wěn)定。惡意代碼攻擊是主要的Web攻擊手段之一,因此,惡意代碼的檢測研究是當(dāng)前信息安全領(lǐng)域的研究熱點(diǎn)。Webshell是一種典型的惡意代碼,它是一種基于Web服務(wù)器的后門程序,具有隱蔽性高、危害性大的特點(diǎn);赪ebshell的典型攻擊方式、逃逸手段和現(xiàn)有檢測方法,本文提出一種綜合統(tǒng)計(jì)方法和深度學(xué)習(xí)的Webshell檢測模型,特征向量包括語法特征和語義特征。在統(tǒng)計(jì)方法中,以關(guān)鍵詞、特殊函數(shù)、最長單詞等為語法特征,以Webshell代碼的操作碼序列的詞頻作為語義特征。在深度學(xué)習(xí)時,使用詞向量編碼方式對Webshell代碼的操作碼序列進(jìn)行編碼,將序列中的每個操作碼編碼成固定維度的特征向量。統(tǒng)計(jì)方法選擇隨機(jī)森林算法進(jìn)行檢測,深度學(xué)習(xí)選擇長短期記憶網(wǎng)絡(luò)(lstm)算法進(jìn)行訓(xùn)練。從github上收集正常PHP文件和Webshell共五千多個樣本集,實(shí)驗(yàn)表明,將兩種模型融合后,檢測效果更佳。
【文章來源】:江西師范大學(xué)江西省
【文章頁數(shù)】:51 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 背景分析
1.1.1 Web安全
1.2 研究現(xiàn)狀
1.3 主要研究內(nèi)容
1.4 論文的結(jié)構(gòu)
2 相關(guān)技術(shù)
2.1 Webshell
2.1.1 Webshell的特點(diǎn)
2.1.2 Webshell的分類
2.1.3 Webshell功能
2.1.4 Webshell攻擊原理
2.2 Webshell的檢測與逃逸技術(shù)
2.2.1 Webshell的檢測思路
2.2.2 代碼反檢測技術(shù)
2.3 數(shù)據(jù)流分析
2.3.1 控制流程圖
2.3.2 抽象語法樹(AST)
2.3.3 Opcode
2.4 機(jī)器學(xué)習(xí)算法
2.4.1 分類器
2.4.2 集成分類器
2.4.3 LSTM
2.5 特征提取
3 Webshell檢測模型
3.1 總體架構(gòu)
3.2 數(shù)據(jù)預(yù)處理
3.3 統(tǒng)計(jì)模型
3.3.1 語義特征提取與選擇
3.3.2 語法特征的選擇
3.4.深度學(xué)習(xí)模型
3.4.1 模型訓(xùn)練
3.4.2 模型檢測
3.5 模型融合
3.6 模型評價指標(biāo)
4 Webshell檢測模型的實(shí)現(xiàn)
4.1 統(tǒng)計(jì)檢測模型
4.1.1 操作碼序列詞頻特征
4.1.2 統(tǒng)計(jì)分類方法
4.1.3 統(tǒng)計(jì)模型實(shí)現(xiàn)
4.2 深度學(xué)習(xí)檢測模型
4.3 模型融合
5 系統(tǒng)的測試與評價
5.1 系統(tǒng)運(yùn)行環(huán)境
5.2 實(shí)驗(yàn)過程
5.2.1 基于語法特征匹配
5.2.2 基于操作碼序列詞頻
5.2.3 深度學(xué)習(xí)檢測
5.2.4 統(tǒng)計(jì)檢測模型
5.2.5 融合模型方法
5.2.6 融合模型
6 總結(jié)
參考文獻(xiàn)
致謝
在讀期間公開發(fā)表論文(著)及科研情況
本文編號:3418319
【文章來源】:江西師范大學(xué)江西省
【文章頁數(shù)】:51 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 背景分析
1.1.1 Web安全
1.2 研究現(xiàn)狀
1.3 主要研究內(nèi)容
1.4 論文的結(jié)構(gòu)
2 相關(guān)技術(shù)
2.1 Webshell
2.1.1 Webshell的特點(diǎn)
2.1.2 Webshell的分類
2.1.3 Webshell功能
2.1.4 Webshell攻擊原理
2.2 Webshell的檢測與逃逸技術(shù)
2.2.1 Webshell的檢測思路
2.2.2 代碼反檢測技術(shù)
2.3 數(shù)據(jù)流分析
2.3.1 控制流程圖
2.3.2 抽象語法樹(AST)
2.3.3 Opcode
2.4 機(jī)器學(xué)習(xí)算法
2.4.1 分類器
2.4.2 集成分類器
2.4.3 LSTM
2.5 特征提取
3 Webshell檢測模型
3.1 總體架構(gòu)
3.2 數(shù)據(jù)預(yù)處理
3.3 統(tǒng)計(jì)模型
3.3.1 語義特征提取與選擇
3.3.2 語法特征的選擇
3.4.深度學(xué)習(xí)模型
3.4.1 模型訓(xùn)練
3.4.2 模型檢測
3.5 模型融合
3.6 模型評價指標(biāo)
4 Webshell檢測模型的實(shí)現(xiàn)
4.1 統(tǒng)計(jì)檢測模型
4.1.1 操作碼序列詞頻特征
4.1.2 統(tǒng)計(jì)分類方法
4.1.3 統(tǒng)計(jì)模型實(shí)現(xiàn)
4.2 深度學(xué)習(xí)檢測模型
4.3 模型融合
5 系統(tǒng)的測試與評價
5.1 系統(tǒng)運(yùn)行環(huán)境
5.2 實(shí)驗(yàn)過程
5.2.1 基于語法特征匹配
5.2.2 基于操作碼序列詞頻
5.2.3 深度學(xué)習(xí)檢測
5.2.4 統(tǒng)計(jì)檢測模型
5.2.5 融合模型方法
5.2.6 融合模型
6 總結(jié)
參考文獻(xiàn)
致謝
在讀期間公開發(fā)表論文(著)及科研情況
本文編號:3418319
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/3418319.html
最近更新
教材專著