基于概率模型的社會網(wǎng)絡鏈接預測研究
本文關鍵詞:基于概率模型的社會網(wǎng)絡鏈接預測研究,,由筆耕文化傳播整理發(fā)布。
【摘要】:鏈接預測作為社會網(wǎng)絡分析領域的一個研究方向,目的在于預測不相連節(jié)點對之間存在鏈接的可能性。其在社會學、生物信息學和電子商務等鄰域具有重要的理論研究價值和廣泛的應用價值。目前,已有的鏈接預測算法大部分基于網(wǎng)絡的拓撲結構定義相似性指標(如:CN、AA和LHN-II等)來構造,該類算法模型簡單,無法刻畫挖掘網(wǎng)絡深層次結構信息。因此,本文以簡單無權網(wǎng)絡為研究基礎,從下面兩個主要方面探討這一問題:第一,針對樸素貝葉斯模型中獨立性假設的薄弱環(huán)節(jié),引入隱樸素貝葉斯模型;并將隱樸素貝葉斯的特點與鏈接節(jié)點對共鄰節(jié)點所組成的網(wǎng)絡進行結合,通過引入互信息強化二者之間的聯(lián)系,得到了基于隱貝葉斯模型的社會網(wǎng)絡鏈接預測算法。在四個真實社會網(wǎng)絡數(shù)據(jù)集Ca-GrQr、Facebook、Eron和Advogato上的實驗結果表明:與樸素貝葉斯鏈接預測模型相比,基于隱貝葉斯的鏈接預測模型具有更高的AUC和Precision。第二,從定性的角度,對相似性指標進行具體的分析,結合實際將這些指標歸為網(wǎng)絡中鏈接的結構特征。受這些特征的啟發(fā),構造出了新的結構特征Cohesion指標,通過對比實驗說明了該特征的有效性。在此基礎上,從機器學習的角度,對這些特征進行選擇,并建立基于分類器效果評價指標的特征選擇性能評價體系。在特征選擇與效果評價的過程中,通過先用KMEANS聚類,再按聚類結果抽樣的策略,解決其中所涉及的不平衡性問題。在Twitter、Facebook、Jazz和Email四個數(shù)據(jù)集上進行實驗,實驗結果顯示本文所提出的方法和模型是有效的,在評價體系中的ACC、REC、PPV、F1-score和AUC五個指標整體上有更優(yōu)的表現(xiàn),并有較好的拓展性。此外,基于上述研究,本文把樸素貝葉斯鏈接預測模型向加權網(wǎng)絡進行了拓展。這種拓展主要是建立在社會網(wǎng)絡鏈接結構特征選擇模型框架的基礎之上,介紹了含權特征;并重點研究了在包括含權特征情況時,不同分類器的性能表現(xiàn)。實驗顯示本次拓展工作存在一定的可行性。
【關鍵詞】:社會網(wǎng)絡 鏈接預測 隱樸素貝葉斯 特征選擇 不平衡問題
【學位授予單位】:華南理工大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:O212.8;TP181
【目錄】:
- 摘要5-6
- Abstract6-11
- 第一章 緒論11-16
- 1.1 研究背景及其意義11-12
- 1.2 國內(nèi)外研究現(xiàn)狀12-14
- 1.2.1 基于節(jié)點屬性的鏈接預測12-13
- 1.2.2 基于相似性的鏈接預測13-14
- 1.3 本文研究目標14
- 1.4 本文的組織結構14-16
- 第二章 相關概念與理論16-27
- 2.1 社會網(wǎng)絡簡介16-17
- 2.2 鏈接預測17-20
- 2.2.1 問題描述17-19
- 2.2.2 算法性能評價指標19-20
- 2.3 相關模型20-26
- 2.3.1 基于相似性指標的模型20-21
- 2.3.2 本文涉及的機器學習算法21-26
- 2.4 本章小結26-27
- 第三章 隱樸素貝葉斯模型的鏈接預測27-37
- 3.1 相關工作27
- 3.2 樸素貝葉斯鏈接預測模型27-29
- 3.3 隱貝葉斯鏈接預測模型29-33
- 3.3.1 Hidden Na?ve Bayesian Model29
- 3.3.2 基于隱貝葉斯的鏈接預測模型(HNB)29-31
- 3.3.3 模型推廣31-32
- 3.3.4 算法框架32-33
- 3.4 實驗結果33-35
- 3.4.1 實驗準備33
- 3.4.2 結果說明33-35
- 3.5 本章小結35-37
- 第四章 社會網(wǎng)絡鏈接結構特征選擇37-53
- 4.1 相關工作37-39
- 4.1.1 不平衡分類問題37-38
- 4.1.2 特征選擇38-39
- 4.2 社會網(wǎng)絡鏈接結構特征選擇模型39-45
- 4.2.1 問題分析39-40
- 4.2.2 特征評價40-43
- 4.2.3 社會網(wǎng)絡鏈接結構特征選擇模型43-44
- 4.2.4 算法框架44-45
- 4.3 實驗結果45-51
- 4.3.1 實驗準備45-46
- 4.3.2 結果說明46-51
- 4.4 本章小結51-53
- 第五章 基于含權特征的社會網(wǎng)絡鏈接預測53-60
- 5.1 加權網(wǎng)絡簡介53-56
- 5.1.1 加權網(wǎng)絡表示方法53-54
- 5.1.2 含權特征54-56
- 5.2 基于含權特征的社會網(wǎng)絡鏈接預測模型56-57
- 5.2.1 分析與準備56
- 5.2.2 基于含權特征的社會網(wǎng)絡鏈接預測模型56-57
- 5.2.3 算法框架57
- 5.3 實驗結果57-59
- 5.3.1 實驗準備57
- 5.3.2 結果說明57-59
- 5.4 本章小結59-60
- 總結與展望60-62
- 參考文獻62-66
- 攻讀碩士學位期間取得的研究成果66-67
- 致謝67-68
- 附件68
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前2條
1 關玉蓉;伍明星;;基于DLL和API的Internet鏈接器設計[J];科技廣場;2008年10期
2 ;[J];;年期
中國重要報紙全文數(shù)據(jù)庫 前8條
1 趙福軍;網(wǎng)絡鏈接:徘徊在共享與違法的邊緣[N];中國文化報;2005年
2 劉 勇;網(wǎng)絡鏈接中侵權行為的界定[N];人民法院報;2005年
3 北京市海淀區(qū)人民法院法官 楊德嘉 陳敏;網(wǎng)絡鏈接服務能否為侵權“免單”[N];中國新聞出版報;2011年
4 Softer;為何不能建立網(wǎng)絡鏈接[N];電腦報;2004年
5 周彩云;法院認定:未經(jīng)授權提供鏈接也屬侵權[N];中國新聞出版報;2004年
6 本報記者撰述;青少年愛酷 零售商攻心[N];亞太經(jīng)濟時報;2005年
7 楊德嘉 陳敏;怎樣判斷網(wǎng)絡鏈接是否侵權[N];中國藝術報;2010年
8 邵薇 譯;Simply Accounting Pro:財務軟件[N];北京科技報;2002年
中國博士學位論文全文數(shù)據(jù)庫 前1條
1 段宇鋒;網(wǎng)絡鏈接分析與網(wǎng)站評價研究[D];武漢大學;2004年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 羅泳詩;論網(wǎng)絡鏈接的著作權侵權判定標準[D];華南理工大學;2015年
2 徐宏;基于概率模型的社會網(wǎng)絡鏈接預測研究[D];華南理工大學;2016年
3 仇天成;網(wǎng)絡鏈接引發(fā)的商標侵權法律責任研究[D];蘇州大學;2014年
4 金磊;關于網(wǎng)絡鏈接的法律問題分析[D];北京大學;2006年
5 夏韜;在線社交網(wǎng)絡信息傳播對網(wǎng)絡鏈接形成的影響研究[D];北京郵電大學;2013年
6 陳智麗;網(wǎng)絡鏈接行為侵權責任研究[D];上海交通大學;2009年
7 衛(wèi)蕾;網(wǎng)絡鏈接法律問題研究[D];山東大學;2012年
8 補嘉;基于LDA的社交網(wǎng)絡鏈接預測模型研究[D];西南大學;2012年
9 何敏;網(wǎng)絡鏈接濫用引發(fā)的知識產(chǎn)權問題研究[D];復旦大學;2009年
10 禹貴軍;網(wǎng)絡鏈接服務提供商的民事責任研究[D];內(nèi)蒙古大學;2010年
本文關鍵詞:基于概率模型的社會網(wǎng)絡鏈接預測研究,由筆耕文化傳播整理發(fā)布。
本文編號:456198
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/456198.html