天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于機(jī)器學(xué)習(xí)的P2P流量識(shí)別算法研究

發(fā)布時(shí)間:2018-06-07 19:07

  本文選題:P2P + 流量識(shí)別。 參考:《河南理工大學(xué)》2014年碩士論文


【摘要】:P2P技術(shù)的快速發(fā)展使得P2P流量在網(wǎng)絡(luò)流量中的比重越來(lái)越大,到目前為止,P2P流量成為網(wǎng)絡(luò)中所占比重最大的流量,這對(duì)網(wǎng)絡(luò)管理造成了巨大的困難,對(duì)流量監(jiān)控技術(shù)提出了更高的要求。與此同時(shí),P2P應(yīng)用為了躲避檢測(cè),正在向可以隨機(jī)選擇端口號(hào)進(jìn)行通信和對(duì)應(yīng)用層數(shù)據(jù)加密的方向發(fā)展,因此,造成早期的流量識(shí)別技術(shù)對(duì)P2P流量的識(shí)別準(zhǔn)確率降低,無(wú)法達(dá)到預(yù)期的要求,目前機(jī)器學(xué)習(xí)的方法逐漸興起,在流量識(shí)別中的應(yīng)用由于具有不依賴端口號(hào)與負(fù)載信息的優(yōu)勢(shì),得到了研究界的廣泛關(guān)注。本文對(duì)首先P2P技術(shù)進(jìn)行了分析,包括P2P技術(shù)的定義、網(wǎng)絡(luò)結(jié)構(gòu)、特點(diǎn)以及應(yīng)用類(lèi)型,對(duì)現(xiàn)階段的P2P流量識(shí)別技術(shù)進(jìn)行了總結(jié),并重點(diǎn)分析研究了在P2P流量識(shí)別中的機(jī)器學(xué)習(xí)算法。接下來(lái)深入研究了機(jī)器學(xué)習(xí)中的K均值與決策樹(shù)算法,針對(duì)決策樹(shù)模型在標(biāo)簽樣本稀少的情況下識(shí)別準(zhǔn)確率不高的問(wèn)題,提出一種基于K均值與決策樹(shù)的P2P流量識(shí)別算法。為提高K均值聚類(lèi)的準(zhǔn)確性,為決策樹(shù)訓(xùn)練提供準(zhǔn)確的標(biāo)簽樣本,首先提出一種改進(jìn)的K均值半監(jiān)督聚類(lèi),通過(guò)用標(biāo)簽樣本與貪心算法對(duì)初始聚類(lèi)中心進(jìn)行選定,然后對(duì)樣本數(shù)據(jù)聚類(lèi),采用最大似然估計(jì)對(duì)聚類(lèi)結(jié)果和實(shí)際網(wǎng)絡(luò)應(yīng)用類(lèi)型進(jìn)行匹配,提高了K均值算法的聚類(lèi)性能。然后采用改進(jìn)的K均值半監(jiān)督聚類(lèi)算法對(duì)含有大量無(wú)標(biāo)簽樣本和少量標(biāo)簽樣本的訓(xùn)練數(shù)據(jù)集進(jìn)行預(yù)處理,用得到的含有大量標(biāo)簽樣本的新訓(xùn)練集構(gòu)建決策樹(shù)分類(lèi)模型。最后的實(shí)驗(yàn)結(jié)果表明,在標(biāo)記樣本較少的情況下,新算法對(duì)P2P流量的識(shí)別能力較好。
[Abstract]:The rapid development of P2P technology makes the proportion of P2P traffic in network traffic more and more large, so far, P2P traffic has become the largest volume of traffic in the network, which has caused great difficulties for network management and higher requirements for traffic monitoring technology. In the same time, P2P applications are going to be random in order to avoid detection. The port number is selected for communication and the direction of encryption of the application layer data is developed. Therefore, the early flow recognition technology reduces the recognition accuracy of the P2P traffic and can not meet the expected requirements. At present, the method of machine learning is gradually rising, and the application in traffic recognition is based on the advantages of not relying on port number and load information. This paper analyzes the first P2P technology, including the definition of P2P technology, network structure, characteristics and application types, summarizes the current P2P flow recognition technology, and focuses on the machine learning algorithm in P2P traffic identification. Then, the K in machine learning is studied in depth. In order to improve the accuracy of the K mean and the decision tree, an improved P2P mean semi supervised clustering algorithm is proposed to improve the accuracy of the K mean clustering, and a modified K mean semi supervised clustering algorithm is proposed. Class, by selecting the initial clustering center with the label sample and the greedy algorithm, then clustering the sample data, using the maximum likelihood estimation to match the clustering results and the actual network application types, the clustering performance of the K mean algorithm is improved. Then the improved K mean semi supervised clustering algorithm is used to contain a large number of unlabeled samples. The training data set is preprocessed with a small number of label samples, and a decision tree classification model is constructed with the new training set containing a large number of label samples. The final experimental results show that the new algorithm has better recognition ability for P2P traffic under the case of fewer marked samples.
【學(xué)位授予單位】:河南理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2014
【分類(lèi)號(hào)】:TP393.06

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 楊錚;李國(guó)元;左敏;;一個(gè)嵌入式網(wǎng)絡(luò)流量識(shí)別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)系統(tǒng)應(yīng)用;2008年06期

2 辛峰;於建華;;互聯(lián)網(wǎng)流量識(shí)別技術(shù)的研究及實(shí)現(xiàn)[J];廣東通信技術(shù);2008年03期

3 李晗;劉瀧;;應(yīng)用層流量識(shí)別方法的研究[J];廣東通信技術(shù);2008年04期

4 梁偉;李晗;;網(wǎng)絡(luò)流量識(shí)別方法研究[J];通信技術(shù);2008年11期

5 張玲;李君;孫雁飛;;快速應(yīng)用層流量識(shí)別方法的研究與實(shí)現(xiàn)[J];電信快報(bào);2009年10期

6 葛體富;;網(wǎng)絡(luò)流量識(shí)別技術(shù)以及實(shí)現(xiàn)方案淺議[J];電腦知識(shí)與技術(shù);2011年22期

7 侯艷;;基于深度包和流的流量識(shí)別系統(tǒng)設(shè)計(jì)[J];電子設(shè)計(jì)工程;2013年22期

8 馬保雷;宋穎慧;劉亞維;;基于概念漂移檢測(cè)的自適應(yīng)流量識(shí)別的研究[J];智能計(jì)算機(jī)與應(yīng)用;2013年06期

9 張眾;楊建華;謝高崗;;高效可擴(kuò)展的應(yīng)用層流量識(shí)別架構(gòu)[J];通信學(xué)報(bào);2008年12期

10 吳震;劉興彬;童曉民;;基于信息熵的流量識(shí)別方法[J];計(jì)算機(jī)工程;2009年20期

相關(guān)會(huì)議論文 前7條

1 馬永立;壽國(guó)礎(chǔ);胡怡紅;錢(qián)宗玨;區(qū)海平;;新型網(wǎng)絡(luò)流量識(shí)別分析系統(tǒng)及其性能評(píng)估[A];第六屆全國(guó)信息獲取與處理學(xué)術(shù)會(huì)議論文集(2)[C];2008年

2 張娜娜;;P2P流量識(shí)別方法研究[A];江蘇省電子學(xué)會(huì)2010年學(xué)術(shù)年會(huì)論文集[C];2010年

3 高長(zhǎng)喜;辛陽(yáng);鈕心忻;楊義先;;基于行為特征分析的P2P流量識(shí)別技術(shù)的研究[A];第一屆中國(guó)高校通信類(lèi)院系學(xué)術(shù)研討會(huì)論文集[C];2007年

4 許劉兵;;基于人工神經(jīng)網(wǎng)絡(luò)的P2P流量識(shí)別模型的研究[A];中國(guó)電子學(xué)會(huì)第十五屆信息論學(xué)術(shù)年會(huì)暨第一屆全國(guó)網(wǎng)絡(luò)編碼學(xué)術(shù)年會(huì)論文集(上冊(cè))[C];2008年

5 賈波;鄒園萍;;基于無(wú)監(jiān)督學(xué)習(xí)的P2P流量識(shí)別[A];浙江省信號(hào)處理學(xué)會(huì)2011學(xué)術(shù)年會(huì)論文集[C];2011年

6 王波;周曉光;蘇志遠(yuǎn);;基于節(jié)點(diǎn)狀態(tài)的P2P流量識(shí)別系統(tǒng)[A];中國(guó)電子學(xué)會(huì)第十五屆信息論學(xué)術(shù)年會(huì)暨第一屆全國(guó)網(wǎng)絡(luò)編碼學(xué)術(shù)年會(huì)論文集(下冊(cè))[C];2008年

7 王波;周曉光;蘇志遠(yuǎn);;基于節(jié)點(diǎn)狀態(tài)的P2P流量識(shí)別系統(tǒng)[A];2008通信理論與技術(shù)新發(fā)展——第十三屆全國(guó)青年通信學(xué)術(shù)會(huì)議論文集(下)[C];2008年

相關(guān)博士學(xué)位論文 前6條

1 林冠洲;網(wǎng)絡(luò)流量識(shí)別關(guān)鍵技術(shù)研究[D];北京郵電大學(xué);2011年

2 田旭;互聯(lián)網(wǎng)流量識(shí)別技術(shù)研究[D];北京郵電大學(xué);2012年

3 彭建芬;P2P流量識(shí)別關(guān)鍵技術(shù)研究[D];北京郵電大學(xué);2011年

4 張劍;寬帶接入網(wǎng)流量識(shí)別關(guān)鍵技術(shù)研究[D];北京郵電大學(xué);2011年

5 李冰;VoIP和P2P IPTV流量的識(shí)別與測(cè)量研究[D];天津大學(xué);2010年

6 郭振濱;互聯(lián)網(wǎng)測(cè)量與建模研究[D];北京交通大學(xué);2012年

相關(guān)碩士學(xué)位論文 前10條

1 王曉明;家庭網(wǎng)絡(luò)流量識(shí)別與QoS控制[D];山東大學(xué);2015年

2 石林;基于DPI的流量識(shí)別方法研究與應(yīng)用[D];江西理工大學(xué);2015年

3 武光達(dá);基于DPI的流量識(shí)別系統(tǒng)設(shè)計(jì)[D];貴州大學(xué);2015年

4 羅平;網(wǎng)絡(luò)層流量識(shí)別與關(guān)鍵內(nèi)容提取系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2014年

5 白宇;基于馬爾可夫鏈的加密流識(shí)別系統(tǒng)研究與實(shí)現(xiàn)[D];北京理工大學(xué);2015年

6 譚靜;基于機(jī)器學(xué)習(xí)的P2P流量識(shí)別算法研究[D];河南理工大學(xué);2014年

7 練琪;基于聚類(lèi)分析的應(yīng)用層流量識(shí)別研究[D];湖南大學(xué);2010年

8 朱欣;基于數(shù)據(jù)流挖掘技術(shù)的流量識(shí)別[D];蘇州大學(xué);2011年

9 張波;基于流特征的加密流量識(shí)別技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2012年

10 孫海霞;基于關(guān)聯(lián)規(guī)則的流量識(shí)別方法研究[D];合肥工業(yè)大學(xué);2009年



本文編號(hào):1992444

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/guanlilunwen/ydhl/1992444.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶8ea66***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com