天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 社科論文 > 社會學論文 >

面向社交網(wǎng)絡數(shù)據(jù)的廣度優(yōu)先與深度優(yōu)先抽樣策略研究

發(fā)布時間:2021-08-24 08:51
  現(xiàn)代社會信息技術的迅猛發(fā)展為一切信息數(shù)據(jù)化提供了基礎,龐大的數(shù)據(jù)涵蓋著生活中的方方面面。數(shù)據(jù)產(chǎn)生有許多種渠道,社交網(wǎng)絡便是如今大數(shù)據(jù)的一個重要來源。同時,社交網(wǎng)絡也早已成為一種全球性的交流模式,月活躍用戶數(shù)多則十幾億,少則幾億。社交網(wǎng)絡產(chǎn)生的數(shù)據(jù)具備“大數(shù)據(jù)”數(shù)據(jù)量大(Volume)、類型繁多(Variety)、價值密度低(Value)以及速度快時效高(Velocity)的4V特性。除此之外,社交網(wǎng)絡數(shù)據(jù)也具備著小世界,無標度以及社區(qū)結構性等復雜網(wǎng)絡特性。如何能有效對如此數(shù)據(jù)進行分析,傳統(tǒng)的抽樣方式是否適用,能否獲得較好的樣本網(wǎng)絡對原始網(wǎng)絡進行較為準確的統(tǒng)計推斷等等問題都亟待解決。本文正是在此背景下面向社交網(wǎng)絡數(shù)據(jù),通過廣度優(yōu)先抽樣和深度優(yōu)先抽樣的兩種抽樣策略,獲取數(shù)據(jù),得到樣本網(wǎng)絡,并將兩種抽樣策略對原始網(wǎng)絡的估計效果進行比較。一方面通過構建三種網(wǎng)絡模型進行模擬實驗,另一方面通過現(xiàn)實中豆瓣社交網(wǎng)絡的實證數(shù)據(jù)實證分析。分別從度分布、平均度和聚類系數(shù)等社交網(wǎng)絡統(tǒng)計特征量出發(fā)比較了兩種抽樣策略的效果。結合本文的模擬實驗和實證分析,得出了以下結論:1.廣度優(yōu)先抽樣和深度優(yōu)先抽樣具有較好的樣本... 

【文章來源】:山西財經(jīng)大學山西省

【文章頁數(shù)】:68 頁

【學位級別】:碩士

【部分圖文】:

面向社交網(wǎng)絡數(shù)據(jù)的廣度優(yōu)先與深度優(yōu)先抽樣策略研究


ER隨機網(wǎng)絡模型的度分布(N=10000,p=0.1)

網(wǎng)絡模型


者使用 Python3.0 繪制。圖 2-6 WS 網(wǎng)絡模型的度分布(N=10000,K=4,p=0.3模型模型和 ER 隨機網(wǎng)絡模型這兩種模型而言,其度的而在研究不斷深入的過程中,人們發(fā)現(xiàn)真實網(wǎng)絡中萬維網(wǎng),電力網(wǎng)絡以及代謝網(wǎng)絡等的度分布可以用這種節(jié)點度沒有明顯特征長度,分布符合冪律分布性稱為無標度特性。絡模型的構造算法如下:給定節(jié)點數(shù)為 m0的連通網(wǎng)絡,每次引入一個新節(jié)點點,要求 。:新引入的節(jié)點與已有節(jié)點 i 相連的概率 ( )與 i

主方程,近似描述,冪律,冪指數(shù)


由作者使用 Python3.0 繪制。圖 2-7 BA 無標度網(wǎng)絡(n=10,m=2) 無標度網(wǎng)絡中度的分布理論研究較多,主要有:速程法三種方法。這三種方法得到的漸進結果相同,價,本文采用了主方程法,該網(wǎng)絡的度分布函數(shù)如 ( ) )( ) ,冪指數(shù)為 3 的冪律函數(shù)能夠近似描述 BA 網(wǎng)絡的10000,初始給定節(jié)點為 3,新增一點后的連接點為況。


本文編號:3359680

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/shekelunwen/shgj/3359680.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶41468***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com