鏈接數(shù)據(jù)社團演化分析系統(tǒng)的設(shè)計與實現(xiàn)
發(fā)布時間:2020-12-25 03:51
在網(wǎng)絡(luò)中緊密連接的節(jié)點構(gòu)成社團,社團能夠反映網(wǎng)絡(luò)的結(jié)構(gòu)特性,對實現(xiàn)網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)化、理解網(wǎng)絡(luò)的功能以及發(fā)現(xiàn)網(wǎng)絡(luò)中隱藏規(guī)律等有很大的幫助。然而,目前對于鏈接數(shù)據(jù)的社團挖掘以及相關(guān)研究的工作較少。鏈接數(shù)據(jù)多模式多維度的復(fù)雜結(jié)構(gòu)對鏈接數(shù)據(jù)中的社團發(fā)現(xiàn)工作帶來障礙。在復(fù)雜網(wǎng)絡(luò)分析領(lǐng)域,在動態(tài)網(wǎng)絡(luò)中開展社團分析是一個研究熱點。通常,鏈接數(shù)據(jù)中包含豐富的時間信息,這為動態(tài)地研究鏈接數(shù)據(jù)提供基礎(chǔ)。本文借鑒復(fù)雜網(wǎng)絡(luò)中動態(tài)網(wǎng)絡(luò)研究方法并結(jié)合鏈接數(shù)據(jù)的特點,實現(xiàn)了鏈接數(shù)據(jù)社團演化分析系統(tǒng)。首先,通過對鏈接數(shù)據(jù)中結(jié)構(gòu)化以及無結(jié)構(gòu)化時間信息的抽取,從時間維度上對鏈接數(shù)據(jù)進行建模。其次,將協(xié)作網(wǎng)絡(luò)思想推廣至鏈接數(shù)據(jù),提出鏈接數(shù)據(jù)ARC模型,并基于此模型提出不同時間窗口協(xié)作網(wǎng)絡(luò)的構(gòu)建方法。除此之外,本文給出了一種基于鏈接數(shù)據(jù)張量分解的實體距離度量方法,并結(jié)合基于中心度的社團發(fā)現(xiàn)算法,高效地完成社團發(fā)現(xiàn)工作。對于鏈接數(shù)據(jù)社團演化行為的分析,提出了一種更合理的演化事件定義與檢測方法。最后,基于社團發(fā)現(xiàn)以及社團演化事件的檢測結(jié)果以可視化的方式展示給用戶,幫助用戶直觀地了解鏈接數(shù)據(jù)挖掘結(jié)果,并作進一步的研究。通過本文系統(tǒng)可以...
【文章來源】:東南大學江蘇省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:66 頁
【學位級別】:碩士
【部分圖文】:
網(wǎng)絡(luò)中的社團
如圖2-1 所示。社團演化事件與動態(tài)網(wǎng)絡(luò)的社團發(fā)現(xiàn)關(guān)系密切,為了研究這些演化事件,比較直接的想法就是基于每個快照社團發(fā)現(xiàn)結(jié)果上,比較不同時刻的社團從而檢測出與社團相關(guān)的一系列事件。Asur 等人通過位操作的形式實現(xiàn)定義相鄰快照檢測出的社團之間的關(guān)鍵事件[46]。然而,這些事件并不涵蓋特定的社區(qū)所有可能發(fā)生的變化。Takaffoli 等人[47]提供了一個基于事件的框架來捕獲連續(xù)兩次快照之間的所有變化社團。在他們以后的工作文獻[48]中,事件定義公式被改進以追蹤而不是整個觀察時間的社區(qū)變化而不僅只在兩個連續(xù)的快照之間。Kim 等人將了經(jīng)典混合模型拓展至時間維度,提出了時間混合多項式模型 TMM[49],用以發(fā)現(xiàn)社團之間的生成、分裂,并追溯社團的源頭。除了檢測社團的演化事件,為了表征演化事件發(fā)生的速度,文獻[50]中給出了相應(yīng)的公式定義。更全面地,Spiliopoulou 在文獻[51]給出了社團演化過程中對于各種演變過程的指標,如反映社團規(guī)模變化的 size transition
為人工指定的嵌入的維度,其過程如圖3-5 所示。通過計算矩陣 和 來解決公式(3.2),(3.3),(3.4)中的最優(yōu)化問題,其中公式(3.2)中的 ( )是正則項,防止出現(xiàn)過度擬合。 (3.1) ( ) ( ) (3.2) ( ) ◎ (3.3) ( ) ◎ (3.4)本文使用 RESCAL[67]作為張量分解工具來生成鏈接數(shù)據(jù)中實體的嵌入。對于 中兩個實體 和 ,通過矩陣 獲得其 維嵌入表示 和 。實體 和 之間的嵌入距離由公式(3.5)計算,其中 ( )是 和 的余弦相似性,若實體 和 距離越近
【參考文獻】:
期刊論文
[1]標簽傳播算法理論及其應(yīng)用研究綜述[J]. 張俊麗,常艷麗,師文. 計算機應(yīng)用研究. 2013(01)
[2]基于K-medoids聚類算法的研究與實現(xiàn)[J]. 王忠強,李貴,韓子揚,鄭新錄. 硅谷. 2011(02)
[3]關(guān)聯(lián)數(shù)據(jù)及其應(yīng)用現(xiàn)狀綜述[J]. 沈志宏,張曉林. 現(xiàn)代圖書情報技術(shù). 2010(11)
[4]復(fù)雜網(wǎng)絡(luò)聚類方法[J]. 楊博,劉大有,金弟,馬海賓. 軟件學報. 2009(01)
本文編號:2936905
【文章來源】:東南大學江蘇省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:66 頁
【學位級別】:碩士
【部分圖文】:
網(wǎng)絡(luò)中的社團
如圖2-1 所示。社團演化事件與動態(tài)網(wǎng)絡(luò)的社團發(fā)現(xiàn)關(guān)系密切,為了研究這些演化事件,比較直接的想法就是基于每個快照社團發(fā)現(xiàn)結(jié)果上,比較不同時刻的社團從而檢測出與社團相關(guān)的一系列事件。Asur 等人通過位操作的形式實現(xiàn)定義相鄰快照檢測出的社團之間的關(guān)鍵事件[46]。然而,這些事件并不涵蓋特定的社區(qū)所有可能發(fā)生的變化。Takaffoli 等人[47]提供了一個基于事件的框架來捕獲連續(xù)兩次快照之間的所有變化社團。在他們以后的工作文獻[48]中,事件定義公式被改進以追蹤而不是整個觀察時間的社區(qū)變化而不僅只在兩個連續(xù)的快照之間。Kim 等人將了經(jīng)典混合模型拓展至時間維度,提出了時間混合多項式模型 TMM[49],用以發(fā)現(xiàn)社團之間的生成、分裂,并追溯社團的源頭。除了檢測社團的演化事件,為了表征演化事件發(fā)生的速度,文獻[50]中給出了相應(yīng)的公式定義。更全面地,Spiliopoulou 在文獻[51]給出了社團演化過程中對于各種演變過程的指標,如反映社團規(guī)模變化的 size transition
為人工指定的嵌入的維度,其過程如圖3-5 所示。通過計算矩陣 和 來解決公式(3.2),(3.3),(3.4)中的最優(yōu)化問題,其中公式(3.2)中的 ( )是正則項,防止出現(xiàn)過度擬合。 (3.1) ( ) ( ) (3.2) ( ) ◎ (3.3) ( ) ◎ (3.4)本文使用 RESCAL[67]作為張量分解工具來生成鏈接數(shù)據(jù)中實體的嵌入。對于 中兩個實體 和 ,通過矩陣 獲得其 維嵌入表示 和 。實體 和 之間的嵌入距離由公式(3.5)計算,其中 ( )是 和 的余弦相似性,若實體 和 距離越近
【參考文獻】:
期刊論文
[1]標簽傳播算法理論及其應(yīng)用研究綜述[J]. 張俊麗,常艷麗,師文. 計算機應(yīng)用研究. 2013(01)
[2]基于K-medoids聚類算法的研究與實現(xiàn)[J]. 王忠強,李貴,韓子揚,鄭新錄. 硅谷. 2011(02)
[3]關(guān)聯(lián)數(shù)據(jù)及其應(yīng)用現(xiàn)狀綜述[J]. 沈志宏,張曉林. 現(xiàn)代圖書情報技術(shù). 2010(11)
[4]復(fù)雜網(wǎng)絡(luò)聚類方法[J]. 楊博,劉大有,金弟,馬海賓. 軟件學報. 2009(01)
本文編號:2936905
本文鏈接:http://www.sikaile.net/kejilunwen/yysx/2936905.html
最近更新
教材專著