社交網(wǎng)絡(luò)用戶影響力關(guān)鍵技術(shù)研究
本文選題:微博數(shù)據(jù)采集 切入點(diǎn):Phantomjs 出處:《上海交通大學(xué)》2014年碩士論文 論文類型:學(xué)位論文
【摘要】:隨著互聯(lián)網(wǎng)的發(fā)展,社交網(wǎng)絡(luò)日益成熟,微博作為社交網(wǎng)絡(luò)中的典型代表近年來(lái)廣受學(xué)術(shù)界的關(guān)注。在微博中的每個(gè)用戶影響他人的能力作為微博研究的一個(gè)熱點(diǎn),對(duì)于微博中信息的傳播、整合與推廣以及微博中輿論監(jiān)控與導(dǎo)向有著重要的理論與實(shí)踐意義。本文以新浪微博為例,首先研究了一種全新的微博數(shù)據(jù)采集方法,為研究微博用戶影響力提供數(shù)據(jù)采集方面的支持,然后提出了一種微博用戶影響力的計(jì)算方法,來(lái)衡量微博中的用戶影響力。 對(duì)于新浪微博的數(shù)據(jù)采集,本文首先分析了新浪微博中需要采集的數(shù)據(jù),然后分析了新浪微博API數(shù)據(jù)采集的缺點(diǎn),,從而提出了一種新的基于Phantomjs的新浪微博數(shù)據(jù)采集方法并詳細(xì)的介紹了相關(guān)的采集技術(shù)與存儲(chǔ)采集內(nèi)容的數(shù)據(jù)結(jié)構(gòu),最終通過(guò)與新浪微博API數(shù)據(jù)采集比較取長(zhǎng)補(bǔ)短設(shè)計(jì)了一種新的新浪微博數(shù)據(jù)采集方案并根據(jù)該方案設(shè)計(jì)了新浪微博數(shù)據(jù)采集系統(tǒng),通過(guò)實(shí)驗(yàn)該系統(tǒng)可以高效的進(jìn)行新浪微博數(shù)據(jù)采集。 對(duì)于新浪微博用戶影響力,本文參考PageRank算法分析了用戶影響力的構(gòu)成,提出了用戶自身影響力與用戶被影響力的概念,得出了用戶影響力是由用戶粉絲的自身影響力乘以其被影響力加上用戶自身影響力構(gòu)成的,并且分析得出了用戶自身影響力與用戶被影響力的計(jì)算公式,最終通過(guò)實(shí)驗(yàn)證明用戶影響力的計(jì)算方法能夠較好的體現(xiàn)用戶影響力。
[Abstract]:With the development of Internet, social network is becoming more and more mature. Weibo, as a typical representative of social network, has attracted much attention from academic circles in recent years. It has important theoretical and practical significance for the dissemination, integration and promotion of information in Weibo, as well as the supervision and guidance of public opinion in Weibo. This paper provides data acquisition support for studying Weibo's user influence, and then proposes a method to calculate the user's influence to measure the user's influence in Weibo. For the data collection of Sina Weibo, this paper first analyzes the data that need to be collected in Sina Weibo, and then analyzes the shortcomings of the data collection of API. A new data acquisition method of Sina Weibo based on Phantomjs is put forward, and the relevant acquisition technology and data structure of storing collected content are introduced in detail. Finally, by comparing data acquisition with Sina Weibo API, a new Sina Weibo data acquisition scheme is designed, and according to this scheme, Sina Weibo data acquisition system is designed. Through the experiment this system can carry on the Sina Weibo data collection efficiently. For user influence of Sina Weibo, this paper analyzes the composition of user influence with reference to PageRank algorithm, and puts forward the concept of user's own influence and user's influence. It is concluded that user influence is made up of the influence of the user fan multiplied by the influence of the user and the influence of the user, and the calculation formula of the influence of the user itself and the influence of the user is obtained. Finally, it is proved by experiments that the calculation method of user influence can better reflect the influence of user.
【學(xué)位授予單位】:上海交通大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2014
【分類號(hào)】:TP393.092
【參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 劉麗清;;微博雖“微”足值道爾——微博特性之淺析[J];東南傳播;2009年11期
2 周立柱,林玲;聚焦爬蟲(chóng)技術(shù)研究綜述[J];計(jì)算機(jī)應(yīng)用;2005年09期
3 閆幸;常亞平;;微博研究綜述[J];情報(bào)雜志;2011年09期
4 歐健文,董守斌,蔡斌;模板化網(wǎng)頁(yè)主題信息的提取方法[J];清華大學(xué)學(xué)報(bào)(自然科學(xué)版);2005年S1期
5 趙麗;袁睿翕;管曉宏;賈慶山;;博客網(wǎng)絡(luò)中具有突發(fā)性的話題傳播模型[J];軟件學(xué)報(bào);2009年05期
6 王曉光;;微博客用戶行為特征與關(guān)系特征實(shí)證分析——以“新浪微博”為例[J];圖書(shū)情報(bào)工作;2010年14期
7 趙思佳;尹婷;;基于規(guī)則引擎的個(gè)性化主題網(wǎng)頁(yè)爬蟲(chóng)的研究[J];計(jì)算機(jī)技術(shù)與發(fā)展;2011年03期
8 盧金珠;;微博客傳播特性及盈利模式分析[J];現(xiàn)代傳播(中國(guó)傳媒大學(xué)學(xué)報(bào));2010年04期
9 劉淑梅;夏亮;許南山;;主題搜索引擎網(wǎng)絡(luò)爬蟲(chóng)搜索策略的研究與實(shí)現(xiàn)[J];計(jì)算機(jī)系統(tǒng)應(yīng)用;2010年03期
10 石磊;張聰;衛(wèi)琳;;引入活躍指數(shù)的微博用戶排名機(jī)制[J];小型微型計(jì)算機(jī)系統(tǒng);2012年01期
本文編號(hào):1629424
本文鏈接:http://www.sikaile.net/guanlilunwen/ydhl/1629424.html