基于機(jī)器學(xué)習(xí)的社交網(wǎng)絡(luò)用戶(hù)特征分析
本文關(guān)鍵詞:基于機(jī)器學(xué)習(xí)的社交網(wǎng)絡(luò)用戶(hù)特征分析
更多相關(guān)文章: 用戶(hù)特征分析 機(jī)器學(xué)習(xí) 譜聚類(lèi) 復(fù)雜網(wǎng)絡(luò) 信息傳播
【摘要】:Web2.0時(shí)代的到來(lái)使得社交網(wǎng)絡(luò)日益普及,社交網(wǎng)絡(luò)中的海量數(shù)據(jù)蘊(yùn)藏了無(wú)限寶藏等待挖掘。社交網(wǎng)絡(luò)形態(tài)多樣且技術(shù)日新月異,大數(shù)據(jù)趨勢(shì)成為必然,運(yùn)用先進(jìn)技術(shù)手段對(duì)網(wǎng)絡(luò)中的數(shù)據(jù)進(jìn)行訓(xùn)練學(xué)習(xí)是現(xiàn)實(shí)的要求。 由于社交網(wǎng)絡(luò)發(fā)展迅猛,傳統(tǒng)的網(wǎng)絡(luò)研究方法、成果等不再適用。在對(duì)社交網(wǎng)絡(luò)用戶(hù)進(jìn)行分析時(shí),大多數(shù)研究?jī)H集中于用戶(hù)某一方面的特征,如行為時(shí)間間隔特征等。鑒于此,本文著眼于個(gè)體用戶(hù)的屬性、信息、關(guān)系三方面特征對(duì)社交網(wǎng)絡(luò)中的用戶(hù)特征進(jìn)行了全面的分析。進(jìn)一步借助機(jī)器學(xué)習(xí)中較為先進(jìn)的譜聚類(lèi)算法對(duì)所采集的微博實(shí)際數(shù)據(jù)進(jìn)行了無(wú)監(jiān)督學(xué)習(xí)。 論文基于社交網(wǎng)絡(luò)研究多學(xué)科交叉結(jié)合的特點(diǎn),采用機(jī)器學(xué)習(xí)、文本處理等手段對(duì)以微博為代表的社交網(wǎng)絡(luò)平臺(tái)整體特性、用戶(hù)信息傳播特征、用戶(hù)行為特征、屬性特征、關(guān)系特征、文本特征進(jìn)行綜合研究。可視化分析是大數(shù)據(jù)時(shí)代對(duì)數(shù)據(jù)進(jìn)行分析的必然要求,本文對(duì)社交網(wǎng)絡(luò)用戶(hù)特征分析時(shí)實(shí)現(xiàn)了網(wǎng)絡(luò)特性的可視化。 論文完成的主要工作包括:在圖論、復(fù)雜網(wǎng)絡(luò)研究、經(jīng)典病毒傳播模型、人類(lèi)動(dòng)力學(xué)傳播模型等理論基礎(chǔ)上研究了社交網(wǎng)絡(luò)特性;利用Gephi實(shí)現(xiàn)了社交網(wǎng)絡(luò)特征可視化;建立了SEIR微博信息傳播模型;為微博用戶(hù)建立了興趣驅(qū)動(dòng)的用戶(hù)交互動(dòng)力學(xué)模型;同時(shí),論文采集了微博平臺(tái)中用戶(hù)的實(shí)際數(shù)據(jù),利用LDA主題向量模型對(duì)采集的數(shù)據(jù)進(jìn)行了處理,再進(jìn)一步得到了用戶(hù)之間的相似矩陣,在此基礎(chǔ)上利用優(yōu)于K-means聚類(lèi)等傳統(tǒng)聚類(lèi)方法的譜聚類(lèi)算法對(duì)樣本數(shù)據(jù)進(jìn)行了興趣社區(qū)挖掘。通過(guò)理論推導(dǎo)和實(shí)證分析,論文全面地分析了微博社交平臺(tái)中用戶(hù)信息、屬性、關(guān)系、行為特征,對(duì)采集到的樣本用戶(hù)進(jìn)行了基于興趣相似度的聚類(lèi),采用譜聚類(lèi)對(duì)用戶(hù)相似興趣進(jìn)行聚類(lèi)時(shí)取得了較好的聚類(lèi)效果。
【關(guān)鍵詞】:用戶(hù)特征分析 機(jī)器學(xué)習(xí) 譜聚類(lèi) 復(fù)雜網(wǎng)絡(luò) 信息傳播
【學(xué)位授予單位】:北京交通大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類(lèi)號(hào)】:TP393.09;TP181
【目錄】:
- 致謝5-6
- 摘要6-7
- ABSTRACT7-11
- 1 引言11-15
- 1.1 研究背景11
- 1.2 選題意義11-12
- 1.3 本論文的主要工作12-13
- 1.4 本論文的組成結(jié)構(gòu)13-15
- 2 相關(guān)理論基礎(chǔ)及國(guó)內(nèi)外研究現(xiàn)狀15-27
- 2.1 復(fù)雜網(wǎng)絡(luò)15-19
- 2.1.1 小世界特性15-18
- 2.1.2 無(wú)標(biāo)度特性18-19
- 2.2 社交網(wǎng)絡(luò)分析19-21
- 2.2.1 社交網(wǎng)絡(luò)19
- 2.2.2 社交網(wǎng)絡(luò)研究的主要領(lǐng)域19-21
- 2.3 社交網(wǎng)絡(luò)研究現(xiàn)狀21-23
- 2.3.1 社交網(wǎng)絡(luò)信息研究現(xiàn)狀21-22
- 2.3.2 社交網(wǎng)絡(luò)用戶(hù)研究現(xiàn)狀22-23
- 2.4 機(jī)器學(xué)習(xí)23-25
- 2.4.1 機(jī)器學(xué)習(xí)概念23-24
- 2.4.2 監(jiān)督學(xué)習(xí)24-25
- 2.4.3 無(wú)監(jiān)督學(xué)習(xí)25
- 2.5 聚類(lèi)及譜聚類(lèi)算法研究現(xiàn)狀25-26
- 2.6 本章小結(jié)26-27
- 3 社交網(wǎng)絡(luò)整體特征及信息傳播分析27-46
- 3.1 社交網(wǎng)絡(luò)整體特性及相關(guān)概念27-29
- 3.2 社交網(wǎng)絡(luò)信息及經(jīng)典信息傳播模型29-33
- 3.2.1 微博信息特性29-31
- 3.2.2 經(jīng)典信息傳播模型31-33
- 3.3 信息傳播動(dòng)力學(xué)模型改進(jìn)33-40
- 3.3.1 微博平臺(tái)簡(jiǎn)介34-35
- 3.3.2 單信息傳播模型改進(jìn)分析35-37
- 3.3.3 單信息傳播模型改進(jìn)37
- 3.3.4 改進(jìn)后的信息傳播動(dòng)力學(xué)SEIR模型37-39
- 3.3.5 改進(jìn)后SEIR模型參數(shù)計(jì)算39-40
- 3.4 社交網(wǎng)絡(luò)信息特性可視化分析40-45
- 3.5 本章小結(jié)45-46
- 4 微博平臺(tái)用戶(hù)特征分析46-57
- 4.1 微博用戶(hù)行為特征研究46-47
- 4.2 微博用戶(hù)行為動(dòng)力學(xué)模型47-53
- 4.2.1 任務(wù)隊(duì)列模型47-48
- 4.2.2 興趣驅(qū)動(dòng)模型48-49
- 4.2.3 基于社會(huì)交互的模型49-50
- 4.2.4 興趣驅(qū)動(dòng)的用戶(hù)交互模型50-53
- 4.3 用戶(hù)微博文本特征53-54
- 4.3.1 詞向量54
- 4.3.2 詞向量的訓(xùn)練54
- 4.4 微博用戶(hù)關(guān)系特征54-56
- 4.5 本章小結(jié)56-57
- 5. 基于相似性的用戶(hù)譜聚類(lèi)分析57-70
- 5.1 譜聚類(lèi)57-59
- 5.2 微博實(shí)證研究數(shù)據(jù)采集和預(yù)處理59-60
- 5.3 用戶(hù)相似矩陣構(gòu)造60-63
- 5.3.1 微博用戶(hù)文本LDA主題生成60-62
- 5.3.2 相似性度量62-63
- 5.4 基于相似度矩陣的譜聚類(lèi)實(shí)現(xiàn)63-67
- 5.5 用戶(hù)譜聚類(lèi)效果分析67-68
- 5.6 譜聚類(lèi)意義探討68-69
- 5.7 本章小結(jié)69-70
- 6 總結(jié)與展望70-72
- 參考文獻(xiàn)72-75
- 索引75-77
- 作者簡(jiǎn)歷77-79
- 學(xué)位論文數(shù)據(jù)集7
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 李林容;;社交網(wǎng)絡(luò)的特性及其發(fā)展趨勢(shì)[J];新聞界;2010年05期
2 陳琛;沙昊;;社交網(wǎng)絡(luò)的開(kāi)放融合圖譜[J];通信世界;2010年48期
3 楊宇良;;網(wǎng)絡(luò)讓我們更遠(yuǎn)還是更近[J];互聯(lián)網(wǎng)天地;2011年01期
4 陳昱;;社交網(wǎng)絡(luò)革命與國(guó)家安全關(guān)系[J];情報(bào)雜志;2011年S2期
5 勞倫·考克斯;;請(qǐng)?jiān)诠ぷ鲿r(shí)更新你的狀態(tài)[J];科技創(chuàng)業(yè);2011年05期
6 斯蒂芬·卡斯;;在線社區(qū)能否解決隱私問(wèn)題[J];科技創(chuàng)業(yè);2011年08期
7 陳云鵬;;電子商務(wù)引領(lǐng)社交網(wǎng)絡(luò)走進(jìn)2.0時(shí)代[J];上海信息化;2012年01期
8 馬文剛;;智慧的物聯(lián)社交網(wǎng)絡(luò)[J];上海信息化;2012年03期
9 朱乾龍;張倩;杜娟;;我國(guó)社交網(wǎng)絡(luò)繁榮背后面臨深層次問(wèn)題困擾[J];世界電信;2012年06期
10 劉華;;社交網(wǎng)絡(luò)的融合之路[J];軟件工程師;2012年07期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條
1 趙云龍;李艷兵;;社交網(wǎng)絡(luò)用戶(hù)的人格預(yù)測(cè)與關(guān)系強(qiáng)度研究[A];第七屆(2012)中國(guó)管理學(xué)年會(huì)商務(wù)智能分會(huì)場(chǎng)論文集(選編)[C];2012年
2 宮廣宇;李開(kāi)軍;;對(duì)社交網(wǎng)絡(luò)中信息傳播的分析和思考——以人人網(wǎng)為例[A];首屆華中地區(qū)新聞與傳播學(xué)科研究生學(xué)術(shù)論壇獲獎(jiǎng)?wù)撐腫C];2010年
3 楊子鵬;喬麗娟;王夢(mèng)思;楊雪迎;孟子冰;張禹;;社交網(wǎng)絡(luò)與大學(xué)生焦慮緩解[A];心理學(xué)與創(chuàng)新能力提升——第十六屆全國(guó)心理學(xué)學(xué)術(shù)會(huì)議論文集[C];2013年
4 畢雪梅;;體育虛擬社區(qū)中的體育社交網(wǎng)絡(luò)解析[A];第九屆全國(guó)體育科學(xué)大會(huì)論文摘要匯編(4)[C];2011年
5 杜p,
本文編號(hào):1083810
本文鏈接:http://www.sikaile.net/guanlilunwen/ydhl/1083810.html