社交網(wǎng)絡(luò)信息傳播建模與節(jié)點(diǎn)影響力研究
本文關(guān)鍵詞:社交網(wǎng)絡(luò)信息傳播建模與節(jié)點(diǎn)影響力研究,由筆耕文化傳播整理發(fā)布。
【摘要】:人類(lèi)正邁入信息化時(shí)代,信息正成為重要的社會(huì)財(cái)富。隨著微博等社交網(wǎng)絡(luò)的飛速發(fā)展,其在網(wǎng)絡(luò)輿情監(jiān)控以及廣告投放效果評(píng)估領(lǐng)域應(yīng)用得越來(lái)越廣泛。越來(lái)越多的學(xué)者開(kāi)始關(guān)注和研究微博網(wǎng)絡(luò),微博網(wǎng)絡(luò)中的信息傳播機(jī)制研究和影響力評(píng)估逐漸成為研究中的熱點(diǎn)。本文選取社交網(wǎng)絡(luò)中使用最為廣泛的新浪微博為研究對(duì)象,首先利用網(wǎng)絡(luò)爬蟲(chóng)抓取原始數(shù)據(jù),并從中提取出影響用戶轉(zhuǎn)發(fā)行為因素和用戶節(jié)點(diǎn)影響力評(píng)估指標(biāo)相關(guān)的數(shù)據(jù),得到期望數(shù)據(jù)集;接著在抓取到的數(shù)據(jù)基礎(chǔ)上建立微博消息傳播模型——基于轉(zhuǎn)發(fā)行為概率預(yù)測(cè)的加權(quán)有向拓?fù)淠P?最后在建立微博消息傳播模型的基礎(chǔ)上,基于改進(jìn)Page Rank算法對(duì)微博網(wǎng)絡(luò)中的用戶節(jié)點(diǎn)進(jìn)行影響力評(píng)估研究。數(shù)據(jù)的抓取是整個(gè)研究的基礎(chǔ)。在比較各種網(wǎng)頁(yè)數(shù)據(jù)抓取方式的特點(diǎn)之后,選取能夠很方便的按照自定義需求進(jìn)行數(shù)據(jù)抓取的基于網(wǎng)頁(yè)爬蟲(chóng)的抓取方式。在抓取到指定規(guī)模的原始數(shù)據(jù)后,根據(jù)需要將數(shù)據(jù)分為微博用戶屬性和微博內(nèi)容屬性。其中微博用戶屬性包括用戶ID、關(guān)注數(shù)、粉絲數(shù)、微博數(shù)量以及是否為認(rèn)證用戶等;微博內(nèi)容屬性包括創(chuàng)建時(shí)間、是否包含特殊符號(hào)、轉(zhuǎn)發(fā)數(shù)、評(píng)論數(shù)等。最后還對(duì)數(shù)據(jù)抓取過(guò)程中的關(guān)鍵問(wèn)題特別是反爬策略等問(wèn)題進(jìn)行了分析和解決。在抓取到的數(shù)據(jù)集的基礎(chǔ)上,對(duì)微博信息傳播機(jī)制和傳播規(guī)律進(jìn)行研究,并建立基于轉(zhuǎn)發(fā)行為預(yù)測(cè)的微博消息傳播模型。針對(duì)當(dāng)前社交網(wǎng)絡(luò)信息傳播的研究側(cè)重于從微觀層面出發(fā),對(duì)單個(gè)用戶的轉(zhuǎn)發(fā)行為進(jìn)行分析,而少有從拓?fù)鋵用鎸?duì)整個(gè)社交網(wǎng)絡(luò)中的信息傳播過(guò)程建模的研究。本文首先確定了影響轉(zhuǎn)發(fā)行為的特征因素——主要是微博內(nèi)容與用戶興趣、微博用戶的社會(huì)關(guān)系、微博文本與用戶屬性以及受激活次數(shù)這四個(gè)方面。在對(duì)這四大類(lèi)特征因素進(jìn)行分析的基礎(chǔ)上,利用邏輯斯蒂回歸模型二分類(lèi)得到節(jié)點(diǎn)間的信息轉(zhuǎn)發(fā)概率,進(jìn)而建立基于轉(zhuǎn)發(fā)預(yù)測(cè)的加權(quán)有向拓?fù)湫畔鞑ツP?給出模型的生長(zhǎng)演化過(guò)程,并在采集到數(shù)據(jù)集上進(jìn)行驗(yàn)證實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果證明所構(gòu)建的模型能夠很好的反映微博網(wǎng)絡(luò)的網(wǎng)絡(luò)結(jié)構(gòu),能夠較好的模擬微博網(wǎng)絡(luò)中的信息傳播過(guò)程。在構(gòu)建微博消息傳播模型的基礎(chǔ)上,本文還對(duì)微博網(wǎng)絡(luò)中用戶節(jié)點(diǎn)的影響力評(píng)估進(jìn)行了研究,改進(jìn)網(wǎng)頁(yè)重要性評(píng)估算法Page Rank以適應(yīng)微博網(wǎng)絡(luò)的特點(diǎn),特別是針對(duì)算法中投票階段和縮放機(jī)制存在的問(wèn)題進(jìn)行了改進(jìn)。現(xiàn)有的影響力評(píng)估研究,一般只簡(jiǎn)單地考慮微博的轉(zhuǎn)發(fā)數(shù)和評(píng)論數(shù)這兩個(gè)指標(biāo)的影響,但微博作為新興的社交媒體,僅考慮微博轉(zhuǎn)發(fā)數(shù)和評(píng)論數(shù)已經(jīng)不能準(zhǔn)確的評(píng)估消息影響力,因此我們需要對(duì)微博網(wǎng)絡(luò)中消息的傳播進(jìn)行進(jìn)一步分析,提取更多的特征因素以更好的評(píng)估用戶節(jié)點(diǎn)的影響力。在確定影響力大小衡量指標(biāo)——主要是信息傳播度、傳播活躍程度以及傳播受眾廣度后,對(duì)Page Rank算法進(jìn)行改進(jìn),主要是針對(duì)其投票階段的平均分配權(quán)值的方式忽略了個(gè)體重要性差異進(jìn)行改進(jìn),并確定按傳播活躍程度和傳播度的數(shù)值化乘積作為分配PR值的權(quán)值,以達(dá)到讓傳播能力強(qiáng)的節(jié)點(diǎn)獲得更多的投票的目的。最后在數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明改進(jìn)后的算法比原始Page Rank具有更好的命中比例。
【關(guān)鍵詞】:微博 信息傳播 影響力 Page Rank
【學(xué)位授予單位】:東華大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類(lèi)號(hào)】:TP393.092
【目錄】:
- 摘要4-6
- ABSTRACT6-10
- 第一章 緒論10-17
- 1.1 研究背景與意義10-12
- 1.2 研究現(xiàn)狀分析12-15
- 1.2.1 社交網(wǎng)絡(luò)研究現(xiàn)狀概述12-14
- 1.2.2 社交網(wǎng)絡(luò)研究現(xiàn)狀問(wèn)題分析14-15
- 1.3 研究目標(biāo)與主要內(nèi)容15-17
- 1.3.1 本文研究目標(biāo)15
- 1.3.2 本文主要內(nèi)容15-16
- 1.3.3 本文章節(jié)安排16-17
- 第二章 數(shù)據(jù)集獲取17-27
- 2.1 引言17
- 2.2 現(xiàn)有抓取方式及分析17-21
- 2.2.1 基于網(wǎng)絡(luò)爬蟲(chóng)的微博數(shù)據(jù)抓取17-19
- 2.2.2 基于新浪API的微博數(shù)據(jù)抓取19-21
- 2.3 數(shù)據(jù)抓取關(guān)鍵問(wèn)題解決21-23
- 2.4 數(shù)據(jù)采集具體實(shí)現(xiàn)23-25
- 2.5 數(shù)據(jù)采集結(jié)果描述25
- 2.6 本章小結(jié)25-27
- 第三章 社交網(wǎng)絡(luò)信息傳播建模27-41
- 3.1 引言27
- 3.2 社交網(wǎng)絡(luò)拓?fù)渑c信息傳播關(guān)系分析27-30
- 3.2.1 網(wǎng)絡(luò)節(jié)點(diǎn)出度與信息傳播28-29
- 3.2.2 網(wǎng)絡(luò)節(jié)點(diǎn)入度與信息傳播29-30
- 3.3 社交網(wǎng)絡(luò)用戶轉(zhuǎn)發(fā)因素分析30-33
- 3.3.1 特征因素提取30-31
- 3.3.2 特征因素分析31-33
- 3.4 社交網(wǎng)絡(luò)信息轉(zhuǎn)發(fā)預(yù)測(cè)模型建立33-35
- 3.4.1 模型初始化33
- 3.4.2 模型的生長(zhǎng)演化33-35
- 3.5 社交網(wǎng)絡(luò)信息傳播結(jié)果分析35-39
- 3.5.1 外部參數(shù)對(duì)網(wǎng)絡(luò)結(jié)構(gòu)的影響35-36
- 3.5.2 網(wǎng)絡(luò)節(jié)點(diǎn)度分布36-37
- 3.5.3 網(wǎng)絡(luò)節(jié)點(diǎn)勢(shì)分布37-38
- 3.5.4 網(wǎng)絡(luò)節(jié)點(diǎn)度-勢(shì)相關(guān)性38
- 3.5.5 網(wǎng)絡(luò)聚集特性38-39
- 3.6 本章小結(jié)39-41
- 第四章 基于PageRank算法改進(jìn)的用戶影響力度量研究41-58
- 4.1 引言41
- 4.2 用戶影響力分析41-44
- 4.2.1 影響力定義41-42
- 4.2.2 用戶影響力關(guān)鍵因素分析42-44
- 4.3 PageRank算法分析44-50
- 4.3.1 收縮機(jī)制存在問(wèn)題46-49
- 4.3.2 投票階段存在問(wèn)題49-50
- 4.4 改進(jìn)算法的提出50-53
- 4.4.1 PR值分配比例計(jì)算50-51
- 4.4.2 收縮機(jī)制的改進(jìn)51
- 4.4.3 鄰居節(jié)點(diǎn)差異性的改進(jìn)51-53
- 4.5 算法實(shí)驗(yàn)結(jié)果分析53-57
- 4.5.1 實(shí)驗(yàn)數(shù)據(jù)集描述54
- 4.5.2 實(shí)驗(yàn)結(jié)果與分析54-57
- 4.6 本章小結(jié)57-58
- 第五章 結(jié)束語(yǔ)58-60
- 5.1 結(jié)論58-59
- 5.2 本文的創(chuàng)新點(diǎn)59
- 5.3 下一步研究工作展望59-60
- 致謝60-61
- 研究生期間參加的科研工作及成果61-62
- 參考文獻(xiàn)62-63
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 劉耀;王錦貴;;網(wǎng)絡(luò)信息傳播的技術(shù)控制:模式與評(píng)價(jià)研究[J];情報(bào)資料工作;2006年01期
2 金鎮(zhèn);畢強(qiáng);;作為一門(mén)學(xué)科的網(wǎng)絡(luò)信息傳播[J];情報(bào)資料工作;2006年03期
3 張繼蘭;金鎮(zhèn);;網(wǎng)絡(luò)信息傳播與和諧大連建設(shè)研究[J];大連海事大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版);2006年04期
4 王振新;吳新年;;我國(guó)網(wǎng)絡(luò)信息傳播新環(huán)境風(fēng)險(xiǎn)分析及對(duì)策建議[J];現(xiàn)代情報(bào);2007年01期
5 劉耀;王錦貴;;網(wǎng)絡(luò)信息傳播的技術(shù)控制模式研究[J];情報(bào)理論與實(shí)踐;2007年02期
6 金鎮(zhèn);;論網(wǎng)絡(luò)信息傳播的跨學(xué)科研究[J];現(xiàn)代情報(bào);2007年07期
7 孟慶蘭;;網(wǎng)絡(luò)信息傳播效果分析[J];圖書(shū)館學(xué)研究;2007年11期
8 許艷;;網(wǎng)絡(luò)信息傳播與知識(shí)創(chuàng)新關(guān)系研究[J];商場(chǎng)現(xiàn)代化;2008年35期
9 袁淑艷;李永先;;網(wǎng)絡(luò)信息傳播保障體系的構(gòu)建[J];情報(bào)科學(xué);2008年04期
10 邱均平;陳遠(yuǎn);倪超群;;論網(wǎng)絡(luò)信息傳播的價(jià)值[J];山東社會(huì)科學(xué);2009年01期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條
1 謝金林;;控制,引導(dǎo)還是對(duì)話:網(wǎng)絡(luò)輿論的政府治理[A];“中國(guó)特色社會(huì)主義行政管理體制”研討會(huì)暨中國(guó)行政管理學(xué)會(huì)第20屆年會(huì)論文集[C];2010年
2 嚴(yán)耕;;網(wǎng)絡(luò)信息的意識(shí)形態(tài)沖突與社會(huì)和諧[A];和諧·創(chuàng)新·發(fā)展——首屆北京中青年社科理論人才“百人工程”學(xué)者論壇文集[C];2007年
3 賀筱媛;胡曉峰;;危機(jī)條件下的網(wǎng)絡(luò)信息傳播行為建模方法研究[A];第五屆全國(guó)復(fù)雜網(wǎng)絡(luò)學(xué)術(shù)會(huì)議論文(摘要)匯集[C];2009年
4 韋路;謝點(diǎn);;全球網(wǎng)絡(luò)信息傳播格局透視——基于世界各國(guó)宏觀數(shù)據(jù)的實(shí)證分析[A];2014中國(guó)傳播論壇:“國(guó)際話語(yǔ)體系與國(guó)際傳播能力建設(shè)”研討會(huì)會(huì)議論文集[C];2014年
5 殷俊;柴櫻芝;;民族地區(qū)突發(fā)事件的信息傳播與輿論引導(dǎo)——從“玉樹(shù)地震”網(wǎng)絡(luò)信息傳播看網(wǎng)絡(luò)輿論引導(dǎo)力的提升[A];中國(guó)少數(shù)民族地區(qū)信息傳播與社會(huì)發(fā)展論叢(2010年刊)[C];2010年
6 毛牧然;范卿瑞;;論遼寧省網(wǎng)絡(luò)輿論正負(fù)向價(jià)值的引導(dǎo)與管控[A];第十屆沈陽(yáng)科學(xué)學(xué)術(shù)年會(huì)論文集(經(jīng)濟(jì)管理與人文科學(xué)分冊(cè))[C];2013年
7 郭華;齊淑娟;;網(wǎng)絡(luò)環(huán)境下更要注重創(chuàng)新[A];第五屆全國(guó)核心期刊與期刊國(guó)際化、網(wǎng)絡(luò)化研討會(huì)論文集[C];2007年
8 帥慶;;論網(wǎng)絡(luò)中女性的權(quán)益保護(hù)[A];2009年中國(guó)社會(huì)學(xué)年會(huì)“中國(guó)社會(huì)變遷與女性發(fā)展”論壇論文集[C];2009年
9 王燁;;論網(wǎng)絡(luò)信息的意識(shí)形態(tài)屬性對(duì)現(xiàn)實(shí)社會(huì)的影響[A];吉林省行政管理學(xué)會(huì)“政府管理創(chuàng)新與轉(zhuǎn)變經(jīng)濟(jì)發(fā)展方式”學(xué)術(shù)年會(huì)論文集(《吉林政報(bào)》2010·?2)[C];2011年
10 陳燁;凌秀麗;;網(wǎng)絡(luò)環(huán)境下的圖書(shū)館信息傳播[A];公共文化服務(wù)與圖書(shū)館實(shí)踐的創(chuàng)新——浙江省圖書(shū)館學(xué)會(huì)第十次學(xué)術(shù)研討會(huì)論文集[C];2006年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前10條
1 汪磊 廣州大學(xué)人文學(xué)院教授;網(wǎng)絡(luò)語(yǔ)言熱的冷思考[N];中國(guó)社會(huì)科學(xué)報(bào);2010年
2 特約撰稿 江蘇省連云港市司法局法制處 吳學(xué)安;影視劇呼喚法律保護(hù)網(wǎng)絡(luò)信息傳播權(quán)[N];民主與法制時(shí)報(bào);2014年
3 本報(bào)記者 姜錦銘 實(shí)習(xí)生 唐牛;網(wǎng)絡(luò)假新聞多,是缺少競(jìng)爭(zhēng)所致?[N];新華每日電訊;2009年
4 華東政法大學(xué) 閆艷;網(wǎng)絡(luò)法的價(jià)值追求[N];檢察日?qǐng)?bào);2010年
5 王晨;發(fā)展健康向上的網(wǎng)絡(luò)文化[N];人民日?qǐng)?bào);2011年
6 本報(bào)記者 李?lèi)偞?發(fā)展健康向上的網(wǎng)絡(luò)文化[N];云南日?qǐng)?bào);2011年
7 張玉勝;網(wǎng)絡(luò)執(zhí)政能力當(dāng)為官員“必修課”[N];中國(guó)新聞出版報(bào);2012年
8 記者 李川 實(shí)習(xí)生 楊彬馳;營(yíng)造安全穩(wěn)定可靠有序的網(wǎng)絡(luò)環(huán)境[N];天津日?qǐng)?bào);2014年
9 科學(xué)導(dǎo)報(bào)評(píng)論員 高樂(lè)樂(lè);讓網(wǎng)絡(luò)醫(yī)療信息有法可依[N];科學(xué)導(dǎo)報(bào);2014年
10 本報(bào)記者 顧汶;網(wǎng)絡(luò)媒體路在何方[N];中國(guó)高新技術(shù)產(chǎn)業(yè)導(dǎo)報(bào);2001年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前4條
1 胡青青;網(wǎng)絡(luò)熱詞的倫理研究[D];湖南師范大學(xué);2015年
2 唐朝生;在線社交網(wǎng)絡(luò)信息傳播建模及轉(zhuǎn)發(fā)預(yù)測(cè)研究[D];燕山大學(xué);2014年
3 李超;基于多維屬性的社會(huì)網(wǎng)絡(luò)信息傳播模型研究[D];中國(guó)科學(xué)院深圳先進(jìn)技術(shù)研究院;2014年
4 羅莉;網(wǎng)絡(luò)信息傳播中的法律問(wèn)題研究[D];中國(guó)政法大學(xué);2001年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 陳靖;網(wǎng)絡(luò)道德建設(shè)的問(wèn)題與出路[D];山東師范大學(xué);2007年
2 王振新;網(wǎng)絡(luò)信息傳播風(fēng)險(xiǎn)分析及對(duì)策研究[D];中國(guó)科學(xué)院研究生院(文獻(xiàn)情報(bào)中心);2007年
3 張馳;完善網(wǎng)絡(luò)信息傳播監(jiān)管機(jī)制研究[D];中國(guó)社會(huì)科學(xué)院研究生院;2012年
4 張偉;大規(guī)模復(fù)雜網(wǎng)絡(luò)信息傳播平臺(tái)關(guān)鍵技術(shù)研究[D];河北師范大學(xué);2015年
5 李亮;我國(guó)網(wǎng)絡(luò)文學(xué)實(shí)體出版中的問(wèn)題研究[D];河北大學(xué);2015年
6 吳嵩倩;網(wǎng)絡(luò)時(shí)代的社會(huì)控制[D];南京信息工程大學(xué);2015年
7 黃丹麗;論網(wǎng)絡(luò)輿論對(duì)大學(xué)生思想觀念的影響及應(yīng)對(duì)策略[D];南京信息工程大學(xué);2015年
8 孫冉;網(wǎng)絡(luò)時(shí)代中國(guó)共產(chǎn)黨黨群溝通研究[D];蘭州大學(xué);2015年
9 劉思慧;網(wǎng)絡(luò)時(shí)代條件下執(zhí)政黨建設(shè)研究[D];鄭州大學(xué);2015年
10 閆淼;網(wǎng)絡(luò)圍觀的成因及傳播特征探析[D];山東大學(xué);2015年
本文關(guān)鍵詞:社交網(wǎng)絡(luò)信息傳播建模與節(jié)點(diǎn)影響力研究,,由筆耕文化傳播整理發(fā)布。
本文編號(hào):339789
本文鏈接:http://www.sikaile.net/guanlilunwen/ydhl/339789.html