天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 軟件論文 >

基于網絡結構和節(jié)點語義信息的社區(qū)發(fā)現研究

發(fā)布時間:2024-02-25 15:50
  隨著網絡數據規(guī)模的日益增大,各種類型的網絡變得越來越復雜,傳統(tǒng)網絡中的社區(qū)發(fā)現方法面臨著巨大的挑戰(zhàn),往往難以解決高維網絡空間的社區(qū)劃分問題。為了能夠更準確的發(fā)現大規(guī)模網絡中的社區(qū)結構,本文將機器學習中相關算法融合到社區(qū)發(fā)現中,提出了一種基于網絡結構和節(jié)點內容屬性的重疊社區(qū)發(fā)現方法。在基于網絡結構的社區(qū)發(fā)現方法過程中,本文首先選取DeepWalk網絡表示學習方法將網絡圖中節(jié)點表示成低維向量,每個節(jié)點的低維向量表示從某種程度上反應了該節(jié)點在網絡中的連接情況。此時,我們便可以將每個節(jié)點看作是一個樣本,向量的每個維度都可以看做一個特征,將樣本數據輸入到變分高斯混合聚類模型中訓練。從而得到網絡中每個節(jié)點的聚類結果,此處的類相當于網絡中的社區(qū)。此外,該過程中得到的聚類個數可進一步作為基于內容建模的輸入。在基于節(jié)點內容屬性進行社區(qū)發(fā)現過程中,本文使用主題模型對節(jié)點內容進行多維屬性建模,從而得到節(jié)點的多重社區(qū)歸屬分布問題。算法進一步考慮到網絡中節(jié)點內容短小在主題建模過程中導致的數據稀疏問題,在LDA主題模型中引入Spike and Slab prior方法輔助實現變量選擇和參數估計,有效地解決節(jié)點上社...

【文章頁數】:62 頁

【學位級別】:碩士

【部分圖文】:

;圖4.1LDA模型;

;圖4.1LDA模型;

圖4.1LDA模型過程,從圖中我們可以看到w是檔-主題分布,為主題-詞分hyperparameter)為的先驗分中每個詞的過程如下:程表示對于語料庫中每一篇文檔式分布,該分布的先驗分布是超),生成文檔m中詞n的主題,這一過程表示對于文檔m....


圖4.1LDA模型

圖4.1LDA模型

圖4.1LDA模型過程,從圖中我們可以看到w是檔-主題分布,為主題-詞分hyperparameter)為的先驗分中每個詞的過程如下:程表示對于語料庫中每一篇文檔式分布,該分布的先驗分布是超),生成文檔m中詞n的主題,這一過程表示對于文檔m....


圖5.1樣本聚類圖

圖5.1樣本聚類圖

了小數據集進行向量表示,給出社區(qū)劃分示例。該數據集中共有272個節(jié)點,可社區(qū)。在實驗中我們將其表示成二維向量,然后分別采用高斯混合聚類模型以及合模型對樣本集合聚類。在這兩個模型中,我們均設置初始類的個數k為5,下兩種模型中樣本數據相對應的聚類標簽。表5.1樣本數據聚....


圖5.2游走次數和滑動窗口大小參數選擇下F1值曲線

圖5.2游走次數和滑動窗口大小參數選擇下F1值曲線

1模型參數的影響本章節(jié)實驗分為兩個階段,第一個階段將網絡中節(jié)點表示成向量,該階段主要Walk網絡表示學習算法,涉及到的參數選擇共有四個,分別為每個節(jié)點生成隨機游長度t、每個節(jié)點隨機游走次數、節(jié)點表示維度的大小d以及滑動窗口大小w。第根據節(jié)點的向量表示進行聚類,然后分....



本文編號:3910541

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/3910541.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶b8d79***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com