天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 社科論文 > 新聞傳播論文 >

微博網(wǎng)絡(luò)中基于時間和代價的競爭種集選取研究

發(fā)布時間:2020-03-18 16:39
【摘要】:隨著互聯(lián)網(wǎng)模式的不斷創(chuàng)新,線上線下服務(wù)的融合加速以及移動互聯(lián)網(wǎng)服務(wù)場景不斷豐富,移動互聯(lián)網(wǎng)產(chǎn)品成為人們獲取信息的主要途徑。微博由于其信息更新速度快、信息來源多樣,事件和話題的發(fā)展脈絡(luò)清晰等特點,受到了廣大用戶的歡迎,也成為近幾年眾多學(xué)者的研究熱點。其中微博網(wǎng)絡(luò)中的影響力傳播問題是近幾年學(xué)者們的研究熱點,在影響最大化問題中尋找種子節(jié)點集合是其中一個重要的分支,其在信息傳播和病毒營銷方面都有著廣泛的應(yīng)用。本文針對兩種競爭信息在微博網(wǎng)絡(luò)中的傳播,從時間和代價兩個方面綜合考慮,提出了一種基于時間和最小代價的競爭種集選取算法。該算法為后進(jìn)入網(wǎng)絡(luò)的信息B選取付出最小代價的競爭種集,使得信息最終的傳播影響范圍超過競爭信息的影響范圍,即獲取競爭勝利。該算法分為兩個部分:信息A單獨傳播部分、信息A和信息B同時傳播部分。信息A單獨傳播部分,單個信息利用獨立級聯(lián)模型進(jìn)行傳播,本文根據(jù)信息B進(jìn)入微博網(wǎng)絡(luò)中的時間,計算該時間內(nèi)信息A獨自傳播的影響力;兩種競爭信息同時傳播部分,信息B進(jìn)入微博網(wǎng)絡(luò)后,兩種競爭信息同時傳播,本文根據(jù)時間和最小代價的競爭種集選取算法計算花費最小代價的信息B的初始節(jié)點,使得信息B的影響范圍大于信息A的影響范圍。為了證明該算法的可行性和正確性,本文采用真實的微博數(shù)據(jù)對算法進(jìn)行實證。首先實驗對算法本身進(jìn)行分析,發(fā)現(xiàn)后者信息在不同時間進(jìn)入網(wǎng)絡(luò)所需的代價不同,選取的競爭種集也不同。并且若進(jìn)入時間超過一定的范圍,后者信息將不能取得競爭勝利。然后將CELF算法和基于最小代價的CELF算法進(jìn)行對比,發(fā)現(xiàn)基于最小代價的CELF算法得出的競爭種集所需要的總代價更小。本文的創(chuàng)新點主要有兩點:第一,本文在兩種競爭信息同時傳播的基礎(chǔ)上進(jìn)行改進(jìn),考慮兩種競爭信息進(jìn)入網(wǎng)絡(luò)的時間差,選取花費最小代價的競爭種集,使得后者信息獲得競爭勝利。第二,為了方便計算前者信息在微博網(wǎng)絡(luò)中單獨傳播的影響范圍,本文選用基于擴(kuò)展獨立級聯(lián)模型的CELF算法,先選取可能圖再計算影響范圍。本文也存在一些不足。為了保證實驗效果,本文選取了 CELF算法作為基礎(chǔ)算法,但是最終結(jié)果顯示,該算法的時間復(fù)雜度較高,本文下一步的研究需要改進(jìn)競爭種集選取算法,減少時間復(fù)雜度,使其更加適合運用在大型的社交網(wǎng)絡(luò)中。
【圖文】:

用戶信息,主程序,粉絲,信息


微博網(wǎng)絡(luò)中基于時間和代價的競爭種集選取研宄逡逑據(jù)。利用python語言編寫爬蟲程序,爬蟲程序的整體框架和主程序如下圖4-1逡逑和圖4-2所示。通過模擬用戶登錄新浪微博,從種子用戶開始抓取用戶網(wǎng)頁內(nèi)容逡逑并進(jìn)行解析,獲取用戶的基本信息(get_USer_info)。然后獲取該用戶的粉絲列表逡逑和關(guān)注列表(icLgenemtor),放入待爬隊列。之后按照順序爬取待爬隊列中的粉逡逑絲(關(guān)注)用戶的基本信息,再把他們的粉絲(關(guān)注)用戶放入待爬隊列。一直逡逑循環(huán)爬取,直到爬取到指定深度停止。逡逑-■si逡逑圖4-3爬蟲主程序逡逑通過這種爬蟲方法,本文獲取了一萬多條用戶信息,以及對應(yīng)的關(guān)注信息。逡逑最終將爬蟲數(shù)據(jù)存儲在mysql數(shù)據(jù)庫里面。主要包含下面三個表:用戶信息表,逡逑粉絲關(guān)系表

分布圖,出度,粉絲


(1)對上面數(shù)據(jù)預(yù)處理得到的用戶之間的交互關(guān)系數(shù)據(jù)進(jìn)行處理。計算個用戶的出度數(shù)(用戶的粉絲數(shù))。得到一張包含用戶編號USER_ID和用絲數(shù)FLLOWER_NUM的表。逡逑(2)針對步驟(1)得到的表,將重復(fù)的用戶出度進(jìn)行合并,計算每個出的用戶數(shù),得到一張包含用戶出度數(shù)(用戶粉絲數(shù))FLLOWER_NUM和用USER_NUM的表。逡逑(3)分別對用戶出度數(shù)(用戶粉絲數(shù))和用戶個數(shù)取對數(shù),并利用pytho碼,得到用戶出度和用戶數(shù)的關(guān)系圖,如下圖4-5所示。逡逑圖4-5描述的是1607個微博用戶和52872條用戶之間的邊構(gòu)成的微博網(wǎng),用戶的粉絲數(shù)和用戶人數(shù)之間的雙對數(shù)分布圖。其中圖中的橫坐標(biāo)表示用度數(shù)The邋number邋of邋out-degree,縱坐標(biāo)表不用戶人數(shù)The邋number邋of邋users。統(tǒng)計的微博用戶數(shù)較少,,加上微博的反爬蟲策略,所畫出的圖存在一定的誤差了圖中前面幾個點零星的分布誤差,圖中大部分點所構(gòu)成的圖形還是近似一線。這說明本文爬取的微博網(wǎng)絡(luò)還是能較為真實的反映微博社交網(wǎng)絡(luò)的情況章后續(xù)的實驗均以該實驗網(wǎng)絡(luò)作為基本的實驗數(shù)據(jù)集。逡逑-
【學(xué)位授予單位】:中南財經(jīng)政法大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:F274;G206

【參考文獻(xiàn)】

相關(guān)期刊論文 前7條

1 郭景峰;呂加國;;基于信息偏好的影響最大化算法研究[J];計算機(jī)研究與發(fā)展;2015年02期

2 郭靜;張鵬;方濱興;周川;曹亞男;郭莉;;基于LT模型的個性化關(guān)鍵傳播用戶挖掘[J];計算機(jī)學(xué)報;2014年04期

3 郭進(jìn)時;湯紅波;吳凱;楊森;;基于社區(qū)結(jié)構(gòu)的影響力最大化算法[J];計算機(jī)應(yīng)用;2013年09期

4 張振華;劉瑞芳;;微博社交網(wǎng)絡(luò)中面向機(jī)構(gòu)的用戶挖掘[J];軟件;2013年01期

5 陳浩;王軼彤;;基于閾值的社交網(wǎng)絡(luò)影響力最大化算法[J];計算機(jī)研究與發(fā)展;2012年10期

6 田家堂;王軼彤;馮小軍;;一種新型的社會網(wǎng)絡(luò)影響最大化算法[J];計算機(jī)學(xué)報;2011年10期

7 冀進(jìn)朝;韓笑;王U

本文編號:2588930


資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/xinwenchuanbolunwen/2588930.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶47755***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com