因特網(wǎng)流量類(lèi)不平衡特性與分類(lèi)方法的研究
發(fā)布時(shí)間:2021-11-18 21:13
因特網(wǎng)(Internet)流量分類(lèi)是實(shí)施網(wǎng)絡(luò)管理、服務(wù)質(zhì)量保障、網(wǎng)絡(luò)計(jì)費(fèi)以及網(wǎng)絡(luò)安全等的重要基礎(chǔ)。傳統(tǒng)的流量分類(lèi)方法難以適應(yīng)因特網(wǎng)應(yīng)用的快速發(fā)展,基于機(jī)器學(xué)習(xí)的流量分類(lèi)方法具有良好的應(yīng)用前景。但是,這類(lèi)方法通常以獲得高總體分類(lèi)準(zhǔn)確率為優(yōu)化目標(biāo),尚未顧及因特網(wǎng)流量數(shù)據(jù)所具有的多類(lèi)不平衡特性,致使分類(lèi)性能往往偏向大類(lèi),而忽略小類(lèi)。在因特網(wǎng)流量中,某些小類(lèi)應(yīng)用多涉及命令流、實(shí)時(shí)通信流等,其分類(lèi)性能關(guān)乎通信的可靠性或用戶體驗(yàn),有的小類(lèi)屬于重量級(jí)應(yīng)用,其分類(lèi)性能關(guān)乎網(wǎng)絡(luò)規(guī)劃或帶寬資源分配等。目前,因特網(wǎng)流量的類(lèi)不平衡特性及分類(lèi)方法缺乏系統(tǒng)研究。論文針對(duì)因特網(wǎng)流量數(shù)據(jù)集,就選定的特征空間,觀察分析網(wǎng)絡(luò)流樣本的類(lèi)分布特性,分析其特點(diǎn),從數(shù)據(jù)重采樣、特征選擇和分類(lèi)算法三個(gè)方面展開(kāi)因特網(wǎng)流量分類(lèi)方法的研究。論文的主要貢獻(xiàn)如下:(1)因特網(wǎng)流量數(shù)據(jù)的類(lèi)不平衡特性。論文從表象和內(nèi)在兩個(gè)方面剖析流量數(shù)據(jù)存在的類(lèi)不平衡特性。比較各類(lèi)別的網(wǎng)絡(luò)流數(shù)目和字節(jié)數(shù)目,發(fā)現(xiàn)流量數(shù)據(jù)往往包括多個(gè)大類(lèi)和多個(gè)小類(lèi),大類(lèi)與小類(lèi)之間的流數(shù)目差距顯著,小類(lèi)可能擁有較大比例的字節(jié)數(shù),類(lèi)內(nèi)還可能存在大流與小流之間的顯著不平衡。觀察分析網(wǎng)絡(luò)...
【文章來(lái)源】:華南理工大學(xué)廣東省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:134 頁(yè)
【學(xué)位級(jí)別】:博士
【文章目錄】:
摘要
Abstract
目錄
表目錄
圖目錄
縮略語(yǔ)對(duì)照表
術(shù)語(yǔ)說(shuō)明
第一章 緒論
1.1. 研究背景
1.2. 面臨的挑戰(zhàn)
1.3. 研究目的與意義
1.4. 研究?jī)?nèi)容
1.5. 論文結(jié)構(gòu)
第二章 因特網(wǎng)流量分類(lèi)與類(lèi)不平衡研究現(xiàn)狀
2.1. 因特網(wǎng)流量分類(lèi)研究現(xiàn)狀
2.1.1 基于規(guī)則匹配的流量分類(lèi)方法
2.1.2 基于機(jī)器學(xué)習(xí)的流量分類(lèi)方法
2.1.3 類(lèi)不平衡問(wèn)題
2.2. 類(lèi)不平衡研究現(xiàn)狀
2.2.1 類(lèi)不平衡相關(guān)因素分析
2.2.2 數(shù)據(jù)重采樣方法
2.2.3 特征選擇方法
2.2.4 分類(lèi)算法
2.3. 因特網(wǎng)流量分類(lèi)性能評(píng)估指標(biāo)
2.4. 共享的因特網(wǎng)流量數(shù)據(jù)集
2.5. 本章小結(jié)
第三章 因特網(wǎng)流量數(shù)據(jù)的類(lèi)不平衡特性
3.1. 因特網(wǎng)流量數(shù)據(jù)的表象不平衡特性
3.1.1 流不平衡特性
3.1.2 字節(jié)不平衡特性
3.2. 因特網(wǎng)流量數(shù)據(jù)的內(nèi)在不平衡特性
3.2.1 網(wǎng)絡(luò)流特性
3.2.2 網(wǎng)絡(luò)流樣本在特征空間的分布
3.3. 類(lèi)不平衡解決方案的探討
3.3.1 重采樣與代價(jià)敏感學(xué)習(xí)方法
3.3.2 因特網(wǎng)流量分類(lèi)性能
3.3.3 類(lèi)不平衡特性與流量分類(lèi)性能的關(guān)系
3.4. 適合因特網(wǎng)流量多小類(lèi)特性的代價(jià)敏感學(xué)習(xí)算法
3.4.1 錯(cuò)分代價(jià)矩陣分析
3.4.2 加權(quán)錯(cuò)分代價(jià)矩陣
3.4.3 實(shí)驗(yàn)驗(yàn)證
3.5. 本章小結(jié)
第四章 因特網(wǎng)流量數(shù)據(jù)的重采樣方法
4.1. 重采樣方法 PSC
4.1.1 基于 k-均值的流量數(shù)據(jù)劃分
4.1.2 SMOTE 過(guò)采樣算法
4.1.3 啟發(fā)式欠采樣算法
4.2. PSC 方法的理論分析
4.2.1 基于誤差平方和的類(lèi)內(nèi)散度分析
4.2.2 基于 N2 的數(shù)據(jù)復(fù)雜度分析
4.3. 實(shí)驗(yàn)結(jié)果與分析
4.3.1 實(shí)驗(yàn)設(shè)計(jì)與參數(shù)設(shè)置
4.3.2 PSC 的流量分類(lèi)性能
4.3.3 多種重采樣方法比較
4.4. 本章小結(jié)
第五章 因特網(wǎng)流量統(tǒng)計(jì)特征的選擇算法
5.1. 過(guò)濾式特征選擇算法
5.1.1 評(píng)估模型
5.1.2 搜索模型
5.2. 特征選擇算法 BFS
5.2.1 基于信息熵的局部評(píng)估模型
5.2.2 基于對(duì)稱不確定性的全局評(píng)估模型
5.2.3 搜索模型
5.2.4 BFS 算法流程
5.3. 實(shí)驗(yàn)結(jié)果與分析
5.3.1 實(shí)驗(yàn)設(shè)計(jì)與參數(shù)設(shè)置
5.3.2 特征選擇結(jié)果
5.3.3 因特網(wǎng)流量總體分類(lèi)性能
5.3.4 小類(lèi)分類(lèi)性能
5.3.5 特征選擇算法的運(yùn)行時(shí)間
5.3.6 因特網(wǎng)流量分類(lèi)穩(wěn)定性與實(shí)際應(yīng)用討論
5.4. 本章小結(jié)
第六章 因特網(wǎng)重型流分類(lèi)方法
6.1. 重型流分布特點(diǎn)與分類(lèi)問(wèn)題
6.1.1 報(bào)文/字節(jié)累計(jì)分布
6.1.2 重型流分類(lèi)問(wèn)題
6.2. 重型流分類(lèi)方法
6.2.1 基于信息增益率的流尺度模塊化方法
6.2.2 集成學(xué)習(xí)方法
6.3. 實(shí)驗(yàn)結(jié)果與分析
6.3.1 實(shí)驗(yàn)設(shè)計(jì)與參數(shù)設(shè)置
6.3.2 流尺度模塊化方法的流量分類(lèi)性能
6.3.3 集成學(xué)習(xí)的流量分類(lèi)性能
6.3.4 重型流分類(lèi)方法的子流分類(lèi)性能
6.3.5 重型流分類(lèi)方法橫向比較
6.3.6 主要參數(shù)討論
6.4. 本章小結(jié)
總結(jié)與展望
工作總結(jié)
研究展望
參考文獻(xiàn)
攻讀博士學(xué)位期間取得的研究成果
致謝
答辯委員會(huì)對(duì)論文的評(píng)定意見(jiàn)
【參考文獻(xiàn)】:
期刊論文
[1]分類(lèi)不平衡協(xié)議流的機(jī)器學(xué)習(xí)算法評(píng)估與比較[J]. 張宏莉,魯剛. 軟件學(xué)報(bào). 2012(06)
[2]基于機(jī)器學(xué)習(xí)的IP流量分類(lèi)研究[J]. 劉瓊,劉珍,黃敏. 計(jì)算機(jī)科學(xué). 2010(12)
[3]基于C4.5決策樹(shù)的流量分類(lèi)方法[J]. 徐鵬,林森. 軟件學(xué)報(bào). 2009(10)
[4]基于支持向量機(jī)的Internet流量分類(lèi)研究[J]. 徐鵬,劉瓊,林森. 計(jì)算機(jī)研究與發(fā)展. 2009(03)
[5]基于流統(tǒng)計(jì)特性的網(wǎng)絡(luò)流量分類(lèi)算法[J]. 林平,余循宜,劉芳,雷振明. 北京郵電大學(xué)學(xué)報(bào). 2008(02)
[6]Peer-to-Peer文件共享系統(tǒng)的測(cè)量研究[J]. 劉瓊,徐鵬,楊海濤,彭蕓. 軟件學(xué)報(bào). 2006(10)
博士論文
[1]IP網(wǎng)絡(luò)業(yè)務(wù)識(shí)別關(guān)鍵技術(shù)研究[D]. 王攀.南京郵電大學(xué) 2013
[2]互聯(lián)網(wǎng)流量識(shí)別技術(shù)研究[D]. 田旭.北京郵電大學(xué) 2012
[3]網(wǎng)絡(luò)流量的離線分析[D]. 林平.北京郵電大學(xué) 2010
本文編號(hào):3503619
【文章來(lái)源】:華南理工大學(xué)廣東省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:134 頁(yè)
【學(xué)位級(jí)別】:博士
【文章目錄】:
摘要
Abstract
目錄
表目錄
圖目錄
縮略語(yǔ)對(duì)照表
術(shù)語(yǔ)說(shuō)明
第一章 緒論
1.1. 研究背景
1.2. 面臨的挑戰(zhàn)
1.3. 研究目的與意義
1.4. 研究?jī)?nèi)容
1.5. 論文結(jié)構(gòu)
第二章 因特網(wǎng)流量分類(lèi)與類(lèi)不平衡研究現(xiàn)狀
2.1. 因特網(wǎng)流量分類(lèi)研究現(xiàn)狀
2.1.1 基于規(guī)則匹配的流量分類(lèi)方法
2.1.2 基于機(jī)器學(xué)習(xí)的流量分類(lèi)方法
2.1.3 類(lèi)不平衡問(wèn)題
2.2. 類(lèi)不平衡研究現(xiàn)狀
2.2.1 類(lèi)不平衡相關(guān)因素分析
2.2.2 數(shù)據(jù)重采樣方法
2.2.3 特征選擇方法
2.2.4 分類(lèi)算法
2.3. 因特網(wǎng)流量分類(lèi)性能評(píng)估指標(biāo)
2.4. 共享的因特網(wǎng)流量數(shù)據(jù)集
2.5. 本章小結(jié)
第三章 因特網(wǎng)流量數(shù)據(jù)的類(lèi)不平衡特性
3.1. 因特網(wǎng)流量數(shù)據(jù)的表象不平衡特性
3.1.1 流不平衡特性
3.1.2 字節(jié)不平衡特性
3.2. 因特網(wǎng)流量數(shù)據(jù)的內(nèi)在不平衡特性
3.2.1 網(wǎng)絡(luò)流特性
3.2.2 網(wǎng)絡(luò)流樣本在特征空間的分布
3.3. 類(lèi)不平衡解決方案的探討
3.3.1 重采樣與代價(jià)敏感學(xué)習(xí)方法
3.3.2 因特網(wǎng)流量分類(lèi)性能
3.3.3 類(lèi)不平衡特性與流量分類(lèi)性能的關(guān)系
3.4. 適合因特網(wǎng)流量多小類(lèi)特性的代價(jià)敏感學(xué)習(xí)算法
3.4.1 錯(cuò)分代價(jià)矩陣分析
3.4.2 加權(quán)錯(cuò)分代價(jià)矩陣
3.4.3 實(shí)驗(yàn)驗(yàn)證
3.5. 本章小結(jié)
第四章 因特網(wǎng)流量數(shù)據(jù)的重采樣方法
4.1. 重采樣方法 PSC
4.1.1 基于 k-均值的流量數(shù)據(jù)劃分
4.1.2 SMOTE 過(guò)采樣算法
4.1.3 啟發(fā)式欠采樣算法
4.2. PSC 方法的理論分析
4.2.1 基于誤差平方和的類(lèi)內(nèi)散度分析
4.2.2 基于 N2 的數(shù)據(jù)復(fù)雜度分析
4.3. 實(shí)驗(yàn)結(jié)果與分析
4.3.1 實(shí)驗(yàn)設(shè)計(jì)與參數(shù)設(shè)置
4.3.2 PSC 的流量分類(lèi)性能
4.3.3 多種重采樣方法比較
4.4. 本章小結(jié)
第五章 因特網(wǎng)流量統(tǒng)計(jì)特征的選擇算法
5.1. 過(guò)濾式特征選擇算法
5.1.1 評(píng)估模型
5.1.2 搜索模型
5.2. 特征選擇算法 BFS
5.2.1 基于信息熵的局部評(píng)估模型
5.2.2 基于對(duì)稱不確定性的全局評(píng)估模型
5.2.3 搜索模型
5.2.4 BFS 算法流程
5.3. 實(shí)驗(yàn)結(jié)果與分析
5.3.1 實(shí)驗(yàn)設(shè)計(jì)與參數(shù)設(shè)置
5.3.2 特征選擇結(jié)果
5.3.3 因特網(wǎng)流量總體分類(lèi)性能
5.3.4 小類(lèi)分類(lèi)性能
5.3.5 特征選擇算法的運(yùn)行時(shí)間
5.3.6 因特網(wǎng)流量分類(lèi)穩(wěn)定性與實(shí)際應(yīng)用討論
5.4. 本章小結(jié)
第六章 因特網(wǎng)重型流分類(lèi)方法
6.1. 重型流分布特點(diǎn)與分類(lèi)問(wèn)題
6.1.1 報(bào)文/字節(jié)累計(jì)分布
6.1.2 重型流分類(lèi)問(wèn)題
6.2. 重型流分類(lèi)方法
6.2.1 基于信息增益率的流尺度模塊化方法
6.2.2 集成學(xué)習(xí)方法
6.3. 實(shí)驗(yàn)結(jié)果與分析
6.3.1 實(shí)驗(yàn)設(shè)計(jì)與參數(shù)設(shè)置
6.3.2 流尺度模塊化方法的流量分類(lèi)性能
6.3.3 集成學(xué)習(xí)的流量分類(lèi)性能
6.3.4 重型流分類(lèi)方法的子流分類(lèi)性能
6.3.5 重型流分類(lèi)方法橫向比較
6.3.6 主要參數(shù)討論
6.4. 本章小結(jié)
總結(jié)與展望
工作總結(jié)
研究展望
參考文獻(xiàn)
攻讀博士學(xué)位期間取得的研究成果
致謝
答辯委員會(huì)對(duì)論文的評(píng)定意見(jiàn)
【參考文獻(xiàn)】:
期刊論文
[1]分類(lèi)不平衡協(xié)議流的機(jī)器學(xué)習(xí)算法評(píng)估與比較[J]. 張宏莉,魯剛. 軟件學(xué)報(bào). 2012(06)
[2]基于機(jī)器學(xué)習(xí)的IP流量分類(lèi)研究[J]. 劉瓊,劉珍,黃敏. 計(jì)算機(jī)科學(xué). 2010(12)
[3]基于C4.5決策樹(shù)的流量分類(lèi)方法[J]. 徐鵬,林森. 軟件學(xué)報(bào). 2009(10)
[4]基于支持向量機(jī)的Internet流量分類(lèi)研究[J]. 徐鵬,劉瓊,林森. 計(jì)算機(jī)研究與發(fā)展. 2009(03)
[5]基于流統(tǒng)計(jì)特性的網(wǎng)絡(luò)流量分類(lèi)算法[J]. 林平,余循宜,劉芳,雷振明. 北京郵電大學(xué)學(xué)報(bào). 2008(02)
[6]Peer-to-Peer文件共享系統(tǒng)的測(cè)量研究[J]. 劉瓊,徐鵬,楊海濤,彭蕓. 軟件學(xué)報(bào). 2006(10)
博士論文
[1]IP網(wǎng)絡(luò)業(yè)務(wù)識(shí)別關(guān)鍵技術(shù)研究[D]. 王攀.南京郵電大學(xué) 2013
[2]互聯(lián)網(wǎng)流量識(shí)別技術(shù)研究[D]. 田旭.北京郵電大學(xué) 2012
[3]網(wǎng)絡(luò)流量的離線分析[D]. 林平.北京郵電大學(xué) 2010
本文編號(hào):3503619
本文鏈接:http://www.sikaile.net/guanlilunwen/ydhl/3503619.html
最近更新
教材專著