天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于主動(dòng)學(xué)習(xí)的微博流行度預(yù)測(cè)方法

發(fā)布時(shí)間:2020-04-14 08:52
【摘要】:微博的出現(xiàn)進(jìn)一步推動(dòng)了社交網(wǎng)絡(luò)的發(fā)展。微博擁有大量的用戶,這些用戶通過微博進(jìn)行信息共享,與其他用戶溝通交流,使其成為信息傳播的重要途經(jīng)之一。微博平臺(tái)每天產(chǎn)生大量的信息,通過微博進(jìn)行消息的傳播與共享,給人們帶來便利的同時(shí)也有很多挑戰(zhàn)。因此,微博等社交網(wǎng)絡(luò)流行度預(yù)測(cè)也備受廣大學(xué)者關(guān)注。能夠及時(shí)準(zhǔn)確的預(yù)測(cè)微博流行度,對(duì)于個(gè)性化的消息推薦,突發(fā)新聞檢測(cè)和輿情分析等有重要意義。首先,針對(duì)傳統(tǒng)的基于SVM的主動(dòng)學(xué)習(xí)方法選擇距離超平面最近的那些樣本點(diǎn),僅考慮了樣本的不確定性,致使查詢出的未標(biāo)注樣本集存在冗余性和異常值問題,本文提出一種基于SVM的主動(dòng)學(xué)習(xí)方法。該方法不僅僅考慮那些不確定的未標(biāo)注樣本,還考慮多樣性和代表性,并通過實(shí)驗(yàn)驗(yàn)證其在收斂速度、數(shù)據(jù)標(biāo)注量以及準(zhǔn)確率曲線穩(wěn)定性等性能優(yōu)勢(shì)。其次,針對(duì)以往在研究影響微博流行度的相關(guān)因素中,忽略了部分對(duì)微博發(fā)布一小時(shí)內(nèi)的轉(zhuǎn)發(fā)結(jié)構(gòu)相關(guān)特征和時(shí)間特征。本文新增加了基于一小時(shí)轉(zhuǎn)發(fā)用戶建立結(jié)構(gòu)圖中的弱關(guān)系用戶的比例、平均深度、Wiener指數(shù)、Randi′c指數(shù)及時(shí)間特征對(duì)微博流行度預(yù)測(cè)的影響。通過微博數(shù)據(jù)集進(jìn)行實(shí)驗(yàn),驗(yàn)證了通過綜合考慮這些特征,有效提高了微博流行度的預(yù)測(cè)性能。最后,針對(duì)傳統(tǒng)的基于機(jī)器學(xué)習(xí)的微博流行度預(yù)測(cè)方法中,存在需要大量標(biāo)注數(shù)據(jù)作為訓(xùn)練集,在實(shí)際應(yīng)用往往獲得大量標(biāo)注數(shù)據(jù)成本高,而獲取大量未標(biāo)注數(shù)據(jù)容易的問題,本文提出基于主動(dòng)學(xué)習(xí)的微博流行度預(yù)測(cè)方法。該方法在少量標(biāo)注數(shù)據(jù)和大量未標(biāo)注數(shù)據(jù)的前提下,結(jié)合發(fā)布者的用戶特征、微博內(nèi)容特征、一小時(shí)內(nèi)的轉(zhuǎn)發(fā)結(jié)構(gòu)特征以及時(shí)間特征,利用提出的一種基于SVM的主動(dòng)學(xué)習(xí)方法進(jìn)行模型訓(xùn)練,預(yù)測(cè)微博的流行度。通過實(shí)驗(yàn)驗(yàn)證了該方法不僅減少標(biāo)注成本,也提高模型預(yù)測(cè)效果,表現(xiàn)出良好的性能。
【圖文】:

示意圖,線性,示意圖,特征向量


圖 2.3 簡(jiǎn)單的線性 SVM 示意圖{( ) ( ) ( ) ( )}1 1 2 2 3 3=, , , , , ,... ,N N x y x y x y x y ,特征向量,,第 i 個(gè)特征向量用 ( =1, 2,3ix i 量機(jī)假設(shè)輸入空間和特征空間一一對(duì)應(yīng)要使用核技巧,將其轉(zhuǎn)換為向量進(jìn)行 )被定義為:f ( x ) = w x +b 重向量和偏置。能夠找到很多個(gè)將樣本只有一個(gè),就是與分類超平面距離最近間隔邊界的法向量被定義為*= ∈nw w R 能夠正確分離兩類樣本的最優(yōu)分類邊界的間隔最遠(yuǎn)。針對(duì)線性可分的數(shù)據(jù),能夠的卻只有一個(gè),可以通過最大間隔法,表示為:

樣本,核函數(shù),樣本圖


核函數(shù)使用 RBF 核函數(shù)。具體的實(shí)驗(yàn)結(jié)果如圖3.2、圖 3.3 及圖 3.4 所示。圖 3.2 每次選擇 100 個(gè)樣本圖 3.3 每次選擇 150 個(gè)樣本
【學(xué)位授予單位】:哈爾濱工程大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2019
【分類號(hào)】:TP393.092;TP18

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 禾木;;宅男“女神”[J];小溪流(成長(zhǎng)校園);2016年12期

2 朱琛剛;程光;;基于收視行為的互聯(lián)網(wǎng)電視節(jié)目流行度預(yù)測(cè)模型[J];電子與信息學(xué)報(bào);2017年10期

3 熊小兵;周剛;黃永忠;馬俊;;新浪微博話題流行度預(yù)測(cè)技術(shù)研究[J];信息工程大學(xué)學(xué)報(bào);2012年04期

4 萬(wàn)圣賢;郭嘉豐;蘭艷艷;程學(xué)旗;;基于傳播模擬的消息流行度預(yù)測(cè)[J];中文信息學(xué)報(bào);2014年03期

5 鮑鵬;徐昊;;基于圖注意力時(shí)空神經(jīng)網(wǎng)絡(luò)的在線內(nèi)容流行度預(yù)測(cè)[J];模式識(shí)別與人工智能;2019年11期

6 高金華;沈華偉;程學(xué)旗;劉悅;;基于相似消息的流行度預(yù)測(cè)方法[J];中文信息學(xué)報(bào);2018年11期

7 米樂;;鏈接流行度和鏈接分析[J];互聯(lián)網(wǎng)天地;2007年03期

8 余江;楊宗凱;杜旭;王泰;;基于兩點(diǎn)流行度的流媒體緩存算法[J];華中科技大學(xué)學(xué)報(bào)(自然科學(xué)版);2006年10期

9 王景欣;王鉞;李一鵬;袁堅(jiān);山秀明;馮振明;任勇;;基于資源流行度的對(duì)等網(wǎng)絡(luò)統(tǒng)計(jì)特征分析[J];物理學(xué)報(bào);2011年11期

10 孔慶超;毛文吉;;基于動(dòng)態(tài)演化的討論帖流行度預(yù)測(cè)[J];軟件學(xué)報(bào);2014年12期

相關(guān)會(huì)議論文 前1條

1 石磊;衛(wèi)琳;古志民;石云;;Web對(duì)象流行度模型研究[A];第一屆全國(guó)Web信息系統(tǒng)及其應(yīng)用會(huì)議(WISA2004)論文集[C];2004年

相關(guān)重要報(bào)紙文章 前3條

1 本報(bào)記者 史曉菲;健身神器流行度高[N];消費(fèi)日?qǐng)?bào);2014年

2 記者 王秀蘭;杜邦發(fā)布汽車顏色流行度報(bào)告[N];中國(guó)化工報(bào);2011年

3 ;太陽(yáng)鏡點(diǎn)燃眉梢[N];重慶商報(bào);2005年

相關(guān)博士學(xué)位論文 前4條

1 胡穎;社交網(wǎng)絡(luò)中流行度演化分析與預(yù)測(cè)問題研究[D];北京科技大學(xué);2019年

2 高帥;在線社會(huì)網(wǎng)絡(luò)中影響力度量和流行度預(yù)測(cè)問題研究[D];山東大學(xué);2015年

3 張果;面向可共享內(nèi)容的網(wǎng)內(nèi)緩存機(jī)制研究[D];解放軍信息工程大學(xué);2017年

4 付志鵬;結(jié)構(gòu)化P2P網(wǎng)絡(luò)抖動(dòng)的應(yīng)對(duì)策略研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2013年

相關(guān)碩士學(xué)位論文 前10條

1 徐美婷;基于主動(dòng)學(xué)習(xí)的微博流行度預(yù)測(cè)方法[D];哈爾濱工程大學(xué);2019年

2 張超;基于流行度預(yù)測(cè)的密集異構(gòu)網(wǎng)絡(luò)在線熱點(diǎn)視頻緩存更新策略[D];西南交通大學(xué);2019年

3 謝小秋;面向社交網(wǎng)絡(luò)的信息流行度預(yù)測(cè)研究[D];重慶郵電大學(xué);2019年

4 鄒晟;邊緣計(jì)算平臺(tái)中計(jì)算卸載與鏡像緩存方法研究與實(shí)現(xiàn)[D];北京郵電大學(xué);2019年

5 韓鳳娟;基于多任務(wù)學(xué)習(xí)和深度學(xué)習(xí)的微博預(yù)測(cè)流行度[D];河南大學(xué);2018年

6 趙命燕;基于流行度的視頻發(fā)布系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];貴州大學(xué);2018年

7 馬妙麗;霧無線接入網(wǎng)內(nèi)容流行度預(yù)測(cè)與邊緣緩存方法研究[D];東南大學(xué);2018年

8 李美京;手機(jī)APP的口碑影響機(jī)制—考慮類別和流行度的實(shí)證研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2017年

9 張志偉;基站環(huán)境下媒體流行度預(yù)測(cè)與緩存策略研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2016年

10 董美姣;基于流行度預(yù)測(cè)的內(nèi)容中心網(wǎng)絡(luò)緩存技術(shù)研究[D];北京郵電大學(xué);2015年



本文編號(hào):2627124

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/guanlilunwen/ydhl/2627124.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶91dd0***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com