微博網(wǎng)絡(luò)中的重疊社區(qū)發(fā)現(xiàn)算法研究
本文關(guān)鍵詞:微博網(wǎng)絡(luò)中的重疊社區(qū)發(fā)現(xiàn)算法研究,,由筆耕文化傳播整理發(fā)布。
【摘要】:隨著互聯(lián)網(wǎng)和移動(dòng)通信技術(shù)的快速發(fā)展,越來越多的用戶開始使用社交系統(tǒng)進(jìn)行信息交換和共享,形成了越來越龐大的社交網(wǎng)絡(luò)。這種形成于物理網(wǎng)絡(luò)之上的邏輯網(wǎng)絡(luò)反映了人們的偏好和社會(huì)關(guān)系,如何發(fā)現(xiàn)社交網(wǎng)絡(luò)的特征和潛在價(jià)值已成為研究者們廣泛關(guān)注的問題。作為網(wǎng)絡(luò)(特別是社交網(wǎng)絡(luò))研究的內(nèi)容之一社區(qū)發(fā)現(xiàn)對(duì)于研究網(wǎng)絡(luò)內(nèi)部的結(jié)構(gòu)特征有著十分重要的意義。本文以微博網(wǎng)絡(luò)為對(duì)象,研究具有重疊結(jié)構(gòu)的網(wǎng)絡(luò),并提出了一種重疊社區(qū)發(fā)現(xiàn)算法。論文的主要工作包括以下幾個(gè)方面:· 從三個(gè)方面入手,研究了社區(qū)發(fā)現(xiàn)方法的發(fā)展與現(xiàn)狀:從復(fù)雜網(wǎng)絡(luò)理論的角度出發(fā),分析討論了傳統(tǒng)的復(fù)雜網(wǎng)絡(luò)框架下的社區(qū)發(fā)現(xiàn)算法的原理、特點(diǎn)和優(yōu)劣;分析歸納了微博網(wǎng)絡(luò)的特性,并總結(jié)了利用該類特性進(jìn)行傳統(tǒng)社區(qū)發(fā)現(xiàn)算法改進(jìn)的各類算法和方案;概括總結(jié)了復(fù)雜網(wǎng)絡(luò)中利用遺傳算法進(jìn)行社區(qū)發(fā)現(xiàn)的關(guān)鍵技術(shù)。· 提出了一種基于遺傳算法的重疊社區(qū)發(fā)現(xiàn)算法(Overlapping Community Detection based on GA for Weighting Weibo Network, WOGA)。WOGA算法主要分兩大部分:微博網(wǎng)絡(luò)的加權(quán)算法(Weibo Network Weighting Method,WNWM);基于遺傳算法的重疊社區(qū)發(fā)現(xiàn)(Overlapping Community Detection based on GA, OCDGA)。WNWM綜合考慮微博用戶間顯性關(guān)系、交互頻率、主題興趣相似度、用戶標(biāo)簽相似度等因素,建立了一個(gè)用戶關(guān)系強(qiáng)度評(píng)價(jià)模型,進(jìn)而對(duì)微博網(wǎng)絡(luò)中用戶間的連接邊進(jìn)行加權(quán)。OCDGA通過改進(jìn)自適應(yīng)遷移策略的多種群遺傳算法原有的矩陣編碼方案,對(duì)個(gè)體進(jìn)行編碼;利用加權(quán)網(wǎng)絡(luò)改進(jìn)重疊模塊度函數(shù),用作個(gè)體適應(yīng)度函數(shù);建立了基于節(jié)點(diǎn)中心性原則和節(jié)點(diǎn)相似度原則的種群初始化方案;構(gòu)建了基于重疊社區(qū)和矩陣編碼方式的交叉和變異運(yùn)算,并設(shè)計(jì)了部分精英保留策略的選擇算法。此外,OCDGA還引入了自適應(yīng)種群遷移策略以保證算法執(zhí)行效率的同時(shí)提高其準(zhǔn)確度!そo出了基于MapReduce的WNWM算法和OCDGA算法的分布式實(shí)現(xiàn)方案。在OCDGA算法的分布式實(shí)現(xiàn)過程中,提出使用粗粒度-粗粒度的層次PGA (Parallel Genetic Algorithms,并行遺傳算法)模型來設(shè)計(jì)種群間的遷移規(guī)則。本文分別在人工網(wǎng)絡(luò)、經(jīng)典的真實(shí)網(wǎng)絡(luò)和微博網(wǎng)絡(luò)三種類型的網(wǎng)絡(luò)上測(cè)試了WOGA算法的實(shí)驗(yàn)結(jié)果,并與傳統(tǒng)的社區(qū)發(fā)現(xiàn)算法進(jìn)行比較。實(shí)驗(yàn)結(jié)果證明了本文提出的算法具有較高的準(zhǔn)確度,特別是在微博網(wǎng)絡(luò)的用戶交互行為和網(wǎng)絡(luò)結(jié)構(gòu)的分析中,WOGA算法有較好的效果。
【關(guān)鍵詞】:復(fù)雜網(wǎng)絡(luò) 微博網(wǎng)絡(luò) 重疊社區(qū)發(fā)現(xiàn) 加權(quán)策略 多種群遺傳算法 MapReduce
【學(xué)位授予單位】:北京交通大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:O157.5;TP393.092
【目錄】:
- 致謝5-6
- 摘要6-8
- ABSTRACT8-13
- 1 緒論13-19
- 1.1 研究背景與意義13-15
- 1.2 論文研究?jī)?nèi)容15-16
- 1.3 論文結(jié)構(gòu)安排16-19
- 2 復(fù)雜網(wǎng)絡(luò)與社區(qū)發(fā)現(xiàn)19-33
- 2.1 引言19
- 2.2 復(fù)雜網(wǎng)絡(luò)19-22
- 2.2.1 復(fù)雜網(wǎng)絡(luò)的概念與表示方法19-20
- 2.2.2 復(fù)雜網(wǎng)絡(luò)的特征度量20-21
- 2.2.3 復(fù)雜網(wǎng)絡(luò)的特性21-22
- 2.3 社區(qū)發(fā)現(xiàn)22-25
- 2.3.1 復(fù)雜網(wǎng)絡(luò)的社區(qū)結(jié)構(gòu)22-23
- 2.3.2 社區(qū)結(jié)構(gòu)評(píng)價(jià)函數(shù)23-24
- 2.3.3 復(fù)雜網(wǎng)絡(luò)的社區(qū)發(fā)現(xiàn)算法24-25
- 2.4 微博網(wǎng)絡(luò)的社區(qū)發(fā)現(xiàn)25-29
- 2.4.1 基于微博主題的社區(qū)發(fā)現(xiàn)25-26
- 2.4.2 基于用戶屬性的社區(qū)發(fā)現(xiàn)26-27
- 2.4.3 基于交互行為的社區(qū)發(fā)現(xiàn)27-29
- 2.5 遺傳算法29-32
- 2.5.1 遺傳算法原理29-30
- 2.5.2 遺傳算法在社區(qū)發(fā)現(xiàn)中的應(yīng)用30-32
- 2.6 本章小結(jié)32-33
- 3 微博網(wǎng)絡(luò)的用戶關(guān)系評(píng)估33-43
- 3.1 引言33
- 3.2 基于用戶顯性關(guān)系的靜態(tài)拓?fù)浣Y(jié)構(gòu)33-34
- 3.3 基于交互信息的用戶關(guān)系評(píng)價(jià)34-36
- 3.4 基于主題興趣的用戶關(guān)系評(píng)價(jià)36-39
- 3.4.1 中文分詞與特征詞提取36-37
- 3.4.2 基于微博的用戶關(guān)系評(píng)價(jià)37-38
- 3.4.3 基于標(biāo)簽的用戶關(guān)系評(píng)價(jià)38-39
- 3.5 微博用戶關(guān)系強(qiáng)度評(píng)估模型39-41
- 3.6 本章小結(jié)41-43
- 4 基于遺傳算法的重疊社區(qū)發(fā)現(xiàn)43-57
- 4.1 引言43
- 4.2 編碼方式與個(gè)體適應(yīng)度函數(shù)43-45
- 4.3 種群初始化45-49
- 4.3.1 社區(qū)中心節(jié)點(diǎn)的生成46-47
- 4.3.2 初始社區(qū)的生成47-49
- 4.4 交叉算子49-51
- 4.5 變異算子51-52
- 4.6 選擇算子52-53
- 4.7 種群遷移策略53-55
- 4.8 算法整體描述55-56
- 4.9 本章小結(jié)56-57
- 5 大數(shù)據(jù)環(huán)境下算法的分布式實(shí)現(xiàn)57-71
- 5.1 引言57
- 5.2 HADOOP分布式計(jì)算框架57-60
- 5.2.1 MapReduce分布式計(jì)算模型57-59
- 5.2.2 Hadoop分布式運(yùn)行環(huán)境59-60
- 5.3 微博網(wǎng)絡(luò)加權(quán)策略的分布式實(shí)現(xiàn)60-63
- 5.4 多種群遺傳算法的分布式實(shí)現(xiàn)63-69
- 5.4.1 并行遺傳算法63-65
- 5.4.2 OCDGA算法的分布式實(shí)現(xiàn)65-69
- 5.5 本章小結(jié)69-71
- 6 實(shí)驗(yàn)結(jié)果與分析71-81
- 6.1 引言71-72
- 6.2 人工網(wǎng)絡(luò)結(jié)果分析72-73
- 6.3 經(jīng)典真實(shí)網(wǎng)絡(luò)結(jié)果分析73-75
- 6.4 微博網(wǎng)絡(luò)結(jié)果與分析75-80
- 6.4.1 微博網(wǎng)絡(luò)數(shù)據(jù)的采集75-76
- 6.4.2 社區(qū)發(fā)現(xiàn)結(jié)果與分析76-80
- 6.5 本章小結(jié)80-81
- 7 總結(jié)與展望81-83
- 7.1 總結(jié)81-82
- 7.2 展望82-83
- 參考文獻(xiàn)83-87
- 作者簡(jiǎn)歷及攻讀碩士學(xué)位期間取得的研究成果87-91
- 學(xué)位論文數(shù)據(jù)集91
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 胡洪林;;截?cái)嗨枷朐谒惴ǚ治鲋械膽?yīng)用[J];科技風(fēng);2012年12期
2 陳際平;算法分析與優(yōu)化程序的研究[J];西北大學(xué)學(xué)報(bào)(自然科學(xué)版);1994年05期
3 梁彥杰;徐堅(jiān);;算法分析中概率變化與圖形生成[J];云南大學(xué)學(xué)報(bào)(自然科學(xué)版);2009年S2期
4 劉寧;邵曉艷;;算法分析與設(shè)計(jì)課程中多媒體技術(shù)的應(yīng)用[J];科技風(fēng);2009年18期
5 海亞;張永平;;算法對(duì)學(xué)生解決問題能力的培養(yǎng)[J];黑龍江科技信息;2008年10期
6 李冰穎,夏利民,舒遠(yuǎn)仲;學(xué)分制模式下網(wǎng)上選課系統(tǒng)的算法探析[J];江西科學(xué);2004年05期
7 Anany Levitin;Maria Levitin;;算法謎題[J];中國(guó)科技信息;2014年08期
8 杜剛;陸黎明;;一修路問題的算法解決分析[J];太原師范學(xué)院學(xué)報(bào)(自然科學(xué)版);2006年02期
9 許之民;;砝碼稱重問題的多種算法分析與探究[J];合肥學(xué)院學(xué)報(bào)(自然科學(xué)版);2011年01期
10 李亞楠;;菌群優(yōu)化算法分析[J];貴州大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年02期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條
1 俞洋;田亞菲;;一種新的變步長(zhǎng)LMS算法及其仿真[A];通信理論與信號(hào)處理新進(jìn)展——2005年通信理論與信號(hào)處理年會(huì)論文集[C];2005年
2 周顥;劉振華;趙保華;;構(gòu)造型的D~2FA生成算法[A];中國(guó)通信學(xué)會(huì)通信軟件技術(shù)委員會(huì)2009年學(xué)術(shù)會(huì)議論文集[C];2009年
3 賴桃桃;馮少榮;張東站;;一種基于劃分和密度的快速聚類算法[A];第二十五屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(一)[C];2008年
4 劉遠(yuǎn)新;鄧飛其;羅艷輝;舒添慧;;ERP柔性平臺(tái)下物流運(yùn)輸配送系統(tǒng)算法分析[A];第二十六屆中國(guó)控制會(huì)議論文集[C];2007年
5 王樹西;白碩;姜吉發(fā);;模式合一的“減首去尾”算法[A];第二屆全國(guó)學(xué)生計(jì)算語言學(xué)研討會(huì)論文集[C];2004年
6 王萬青;張曉輝;;改進(jìn)的A~*算法的高效實(shí)現(xiàn)[A];2009全國(guó)測(cè)繪科技信息交流會(huì)暨首屆測(cè)繪博客征文頒獎(jiǎng)?wù)撐募痆C];2009年
7 孫煥良;邱菲;劉俊嶺;朱葉麗;;IncSNN——一種基于密度的增量聚類算法[A];第二十三屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2006年
8 韓建民;岑婷婷;于娟;;實(shí)現(xiàn)敏感屬性l-多樣性的l-MDAV算法[A];第二十七屆中國(guó)控制會(huì)議論文集[C];2008年
9 張悅;尤楓;趙瑞蓮;;利用蟻群算法實(shí)現(xiàn)基于程序結(jié)構(gòu)的主變?cè)治鯷A];第五屆中國(guó)測(cè)試學(xué)術(shù)會(huì)議論文集[C];2008年
10 王旭東;劉渝;鄧振淼;;正弦波頻率估計(jì)的修正Rife算法及其FPGA實(shí)現(xiàn)[A];全國(guó)第十屆信號(hào)與信息處理、第四屆DSP應(yīng)用技術(shù)聯(lián)合學(xué)術(shù)會(huì)議論文集[C];2006年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前1條
1 科文;VIXD算法分析Web異常[N];中國(guó)計(jì)算機(jī)報(bào);2008年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 魏哲學(xué);樣本斷點(diǎn)距離問題的算法與復(fù)雜性研究[D];山東大學(xué);2015年
2 劉春明;基于增強(qiáng)學(xué)習(xí)和車輛動(dòng)力學(xué)的高速公路自主駕駛研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2014年
3 張敏霞;生物地理學(xué)優(yōu)化算法及其在應(yīng)急交通規(guī)劃中的應(yīng)用研究[D];浙江工業(yè)大學(xué);2015年
4 李紅;流程挖掘算法研究[D];云南大學(xué);2015年
5 盛歆漪;粒子群優(yōu)化算法及其應(yīng)用研究[D];江南大學(xué);2015年
6 黃磊;高動(dòng)態(tài)環(huán)境捷聯(lián)慣導(dǎo)信號(hào)處理及高精度姿態(tài)速度算法研究[D];南京航空航天大學(xué);2015年
7 劉新旺;多核學(xué)習(xí)算法研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2013年
8 于濱;城市公交系統(tǒng)模型與算法研究[D];大連理工大學(xué);2006年
9 曾國(guó)強(qiáng);改進(jìn)的極值優(yōu)化算法及其在組合優(yōu)化問題中的應(yīng)用研究[D];浙江大學(xué);2011年
10 肖永豪;蜂群算法及在圖像處理中的應(yīng)用研究[D];華南理工大學(xué);2011年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 黃廈;基于改進(jìn)蟻群算法的柔性作業(yè)車間調(diào)度問題研究[D];昆明理工大學(xué);2015年
2 李平;基于Hadoop的信息爬取與輿情檢測(cè)算法研究[D];昆明理工大學(xué);2015年
3 趙官寶;基于位表的關(guān)聯(lián)規(guī)則挖掘算法研究[D];昆明理工大學(xué);2015年
4 殷文華;移動(dòng)容遲網(wǎng)絡(luò)中基于社會(huì)感知的多播分發(fā)算法研究[D];內(nèi)蒙古大學(xué);2015年
5 徐翔燕;人工魚群優(yōu)化算法及其應(yīng)用研究[D];西南交通大學(xué);2015年
6 李德福;基于小世界模型的啟發(fā)式尋路算法研究[D];華中師范大學(xué);2015年
7 鄭海彬;一種面向MAPREDUCE的DATASHUFFLE的優(yōu)化方法[D];蘇州大學(xué);2015年
8 趙曉寒;輪換步長(zhǎng)PSO算法及SMVSC參數(shù)優(yōu)化[D];沈陽理工大學(xué);2015年
9 安豐洋;基于無線網(wǎng)絡(luò)的廣播算法研究[D];曲阜師范大學(xué);2015年
10 李智明;基于改進(jìn)FastICA算法的混合語音盲分離[D];上海交通大學(xué);2015年
本文關(guān)鍵詞:微博網(wǎng)絡(luò)中的重疊社區(qū)發(fā)現(xiàn)算法研究,由筆耕文化傳播整理發(fā)布。
本文編號(hào):378448
本文鏈接:http://www.sikaile.net/guanlilunwen/ydhl/378448.html