天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 管理論文 > 移動網絡論文 >

P2P內容監(jiān)管中的關鍵技術研究

發(fā)布時間:2018-11-15 20:22
【摘要】:近年來,以P2P文件共享類應用和P2P流媒體類應用為代表的P2P網絡應用迅速發(fā)展,然而與此同時,一些違規(guī)的網絡資源也借助P2P類網絡應用快速傳播,并引發(fā)了諸多網絡和社會問題。如何對P2P內容和信息進行有效監(jiān)管已經成為目前P2P研究領域中一個亟待解決的關鍵問題。 P2P內容監(jiān)管行為包括三個關鍵步驟,即資源和節(jié)點信息的采集,管理目標的選擇以及對違規(guī)資源傳播的控制。資源和節(jié)點信息的采集是指依據監(jiān)管目標,對目標P2P系統(tǒng)中的資源及其發(fā)布信息和節(jié)點信息等數據進行采集,當前采用的主動實現(xiàn)方式之一是爬蟲。管理目標的選擇過程是指根據內容管理的目標和范圍,在資源和節(jié)點信息采集的基礎上,分辨正常資源和違規(guī)資源的過程。違規(guī)資源傳播控制是指通過技術和非技術手段,實現(xiàn)對選擇的目標資源的傳播進行管理的行為,當前的主要管理策略集中在降低索引準確性上,并通過爬蟲系統(tǒng)在待管理P2P系統(tǒng)中發(fā)布錯誤的索引信息的方式實現(xiàn)。然而現(xiàn)有技術還存在以下問題:1)隨著P2P技術的發(fā)展,一些原有的數據采集技術已經不能完成數據采集的任務,比如傳統(tǒng)的基于端口的管理方法等;此外,在對基于如DHT等新型體系結構的P2P系統(tǒng)進行數據采集時,現(xiàn)有的采集策略中存在較明顯缺陷,比如全面性不佳和效率低下等問題;2)僅依靠資源的發(fā)布信息作為判斷資源是否違規(guī)的依據,忽略了資源的真實可用性和不同資源間關注程度的差異對監(jiān)管效果帶來的影響;3)目前的通過降低索引準確性的資源傳播控制策略效果較差,多數偽造條目可以通過內容特征和節(jié)點特征進行判斷。 針對上述問題,本文通過分析P2P系統(tǒng)中資源的分布特征以及內容監(jiān)管技術的研究現(xiàn)狀,重點研究P2P資源發(fā)布信息的采集策略、資源可用性判別方法和內容傳播、控制的原理和機制,論文的主要研究結果如下: 第一,針對使用映射類型索引的P2P文件共享應用中的資源發(fā)布信息的采集,本文提出一種基于名稱間家族相似性的名稱采集策略。利用名稱間部分相似的組織方式,通過使用已知名稱中的未知部分作為下次迭代初始條件,,以及控制預先設定的搜索詞向量,該采集策略能夠在很大程度上完成目標系統(tǒng)中的資源發(fā)布信息的快照。實驗在一基于DHT體系結構的實際P2P系統(tǒng)中,以一搜索詞為初始向量,搜索得到約1000萬個發(fā)布信息,間接驗證了該策略的可行性。 第二,針對目前P2P內容監(jiān)管過程中,僅通過名稱判斷內容情況的局限性,本文提出一種基于統(tǒng)計推斷的內容可用性判別方式,用以通過樣本的可用性情況分析整體的可用性水平。區(qū)別于傳統(tǒng)通過比較內容與其發(fā)布名稱是否相符,本文用與一個內容關聯(lián)的不同含義的名稱數量作為衡量其可用性水平的指標,顯然關聯(lián)名稱數量越多,內容的可用性越差。進而使用統(tǒng)計推斷方法判斷該類內容總體的可用性水平。相比于傳統(tǒng)的通過名稱判斷資源實際內容的做法,本文提出的內容可用性的判定方式,1)能夠有效減少監(jiān)管系統(tǒng)中錯誤目標的數量,2)能夠在此基礎上,實現(xiàn)在名稱和可用性維度上的基于學習算法的監(jiān)管目標選擇。 第三,針對目前違規(guī)資源傳播管理策略的局限性,即僅通過改變可用內容占一次搜索中全部內容比例的局限性,本文基于信息論,將一次內容搜索過程描述成內容經過其發(fā)布信息,從信源向信宿傳播的信道,并基于此信道模型給出了兩種管理策略:1)即通過目前的添加版本和副本的策略,改變信源概率分布;2)通過改變內容和節(jié)點特征等信道特征,來影響正常用戶在判斷搜索內容是否可用時的決策。二者都以減小平均互信息量為最終目標,進而達到減小內容成功傳播概率的目的。最后,實驗在一個實際P2P系統(tǒng)中通過多元線性規(guī)劃和方差分析等統(tǒng)計方法分析了影響用戶決策過程的關鍵因素。通過該基于信息理論的分析,一方面為內容傳播控制找到了理論依據,另一方面也擴展了現(xiàn)有的僅針對信源的管理策略。
[Abstract]:......
【學位授予單位】:北京工業(yè)大學
【學位級別】:博士
【學位授予年份】:2014
【分類號】:TP393.02

【參考文獻】

相關期刊論文 前7條

1 范國兵;;一種估計Logistic模型參數的方法及應用實例[J];經濟數學;2010年01期

2 孫知信;宮婧;;一種基于流特性描述的P2P流量模糊識別方法[J];計算機學報;2008年07期

3 黃道穎;張安琳;黃建華;李建春;;P2P網絡Gnutella 0.6模型研究[J];計算機應用與軟件;2008年06期

4 劉祥濤;龔才春;劉悅;白碩;;Kad網絡節(jié)點資源探測分析[J];中文信息學報;2010年06期

5 王凱東;建設具有中國特色的社會主義網絡文化[J];西安電子科技大學學報(社會科學版);2000年04期

6 尚新,李剛;范疇化理論的誤區(qū):家族相似性[J];徐州師范大學學報;2004年06期

7 李海芬,茆詩松;Pareto分布的檢驗[J];徐州師范大學學報(自然科學版);2004年03期

相關博士學位論文 前2條

1 張立;網絡輿論傳播中若干算法的研究[D];北京交通大學;2009年

2 趙旭;廣義Pareto分布的統(tǒng)計推斷[D];北京工業(yè)大學;2012年



本文編號:2334350

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/guanlilunwen/ydhl/2334350.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶0ef5b***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com