天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 管理論文 > 移動網絡論文 >

基于深度學習的微博轉發(fā)預測系統(tǒng)

發(fā)布時間:2020-06-06 05:10
【摘要】:社交媒體是近些年發(fā)展迅速的互聯(lián)網領域之一,每天都有大量的用戶在社交媒體網絡上進行信息共享和狀態(tài)分發(fā)。微博作為起步最早發(fā)展速度較快的社交媒體網絡平臺,吸引了大量的用戶注冊和使用。轉發(fā)是微博實現(xiàn)信息傳播的一個重要機制,用戶接收其他用戶分享的信息之后,可以將信息轉發(fā)到自己的社交媒體平臺上,從而將信息分享給更多的用戶。而且隨著移動互聯(lián)網的興起,如4G網絡,Wi-Fi網絡的大規(guī)模覆蓋,智能手機的迅速普及,進一步吸引了更多用戶使用微博。基于這樣的應用場景,對微博轉發(fā)過程進行分析就具有非凡的意義。對于公司而言,預測微博轉發(fā)數(shù)量可以幫助公司進行流量監(jiān)控和設備調整,從而提高用戶體驗。對于政府而言,輿情分析的重要組成部分就是設法得到當前社交媒體用戶關注的焦點,而微博轉發(fā)預測可以在一定程度上幫助政府及時應對由于信息爆發(fā)性傳播而產生的群體事件。本文主要通過三個角度描述微博轉發(fā)過程的特征,即用戶社交網絡結構,用戶轉發(fā)微博時序間隔和微博文本自然語言特征,利用深度學習框架,預測一條給定微博的轉發(fā)數(shù)量。本論文的研究內容主要由兩部分組成:其一在給定用戶的社交媒體網絡結構的基礎上,利用圖嵌入方法提取每一位用戶的網絡結構特征,其基本思想是將由節(jié)點和連接邊構成的圖向量化,從而達到降維和提取信息的目的。網絡結構特征可以在一定程度上反映用戶所在在線社交社區(qū)的特點(如社區(qū)用戶之間連接是否緊密,不同用戶的相似性高低),從而為微博轉發(fā)預測提供信息;其二是通過使用遞歸神經網絡,整合用戶的網絡結構特征,用戶轉發(fā)微博的時間間隔和規(guī)律以及微博文本的自然語言特征,得到一條給定微博的深度學習模型的轉發(fā)預測特征,之后即可利用深度學習網絡訓練得到的轉發(fā)預測特征進行微博轉發(fā)數(shù)量預測。本論文提出了基于社交網絡一階相似性和二階相似性的Fast Line圖嵌入算法和基于遞歸神經網絡的微博轉發(fā)預測系統(tǒng),Fast Line和微博預測系統(tǒng)均是吸取了近幾年最先進的算法的優(yōu)點,并對先進算法存在的缺陷和不足進行改進。本論文的Fast Line圖嵌入算法利用近似優(yōu)化目標方程的方法,使得參數(shù)訓練速度相比較基線方法提高了一倍以上,同時圖嵌入結果的準確度與基線方法持平。本論文的微博預測系統(tǒng)與DeepCas方法的預測結果相比可以提高30%的預測準確率。
【圖文】:

圖嵌入,隨機游走,示例,技術


大量語料庫中句子的分析,我們就可以得到一種語言或者對應語料庫的分布和特征。同樣的,對于隨機游走產生的大量節(jié)點序列的分析,我們可以得到對應原始網絡圖的結構分布和特征信息。如圖2.3的給出的示例。圖 2.3 基于隨機游走的圖嵌入技術示例Fig. 2.3 The example of Graph embedding algorithm based on random walk.DeepWalk[31]是典型的使用隨機游走對網絡進行采樣的圖嵌入算法。DeepWalk一大亮點在于將語言模型Word2Vec[32,33]用于網絡表示學習,將隨機游走的路程視作語言模型中的句子,隨機游走的節(jié)點視作句子中的單詞。語言模型中的優(yōu)化目標是,給定一個單詞,預測其鄰居單詞,即最大化給定單詞的鄰居單詞的出現(xiàn)概率。應用于網絡表示學習中,在圖結構上進行隨機游走,隨機游走的路徑類比為語言模型中的句子,給定圖節(jié)點的表示特征,最大化游走中鄰居節(jié)點的概率。Word2Vec使用一個包含輸入層,一層隱藏層和輸入層的深度學習網絡求解單詞的低維嵌入表示,Word2Vec輸入網絡的數(shù)據(jù)每個單詞對應的One-Hot向量表示(只有一個位置為1

均勻分布,隨機游走,示例


遼寧科技大學碩士畢業(yè)論文下文,也就是節(jié)點的鄰域。NLP中,單詞的上下文是當前單詞周圍的字,DeepWalk用隨機游走得到網絡中節(jié)點的鄰域。都是給定一個中心節(jié)點的數(shù)據(jù),調整參數(shù),也就是節(jié)點的圖嵌入表示向量,,使得中心節(jié)點周圍的上下文出現(xiàn)的概率最大。因為在原始框架中,優(yōu)化以上提出的目標方程時間消耗和空間消耗很大,所以一般采用Hierarchy Softmax和負采樣等方法近似求解最優(yōu)值,加速深度神經網絡參數(shù)學習過程。我們將會在第三章給出關于這兩個加速算法的更多細節(jié)。2.1.5 Node2VecNode2vec是DeepWalk的改進方法。在DeepWalk中,隨機游走的轉換概率一般遵循均勻分布,即與節(jié)點的度成反比關系。Node2Vec認為DeepWalk的隨機游走策略會偏向于深度優(yōu)先搜索,而節(jié)點鄰域的信息可能無法得到有效的采樣。因此,Node2Vec改進了隨機游走的策略,從而使得隨機游走得到的節(jié)點序列可以保持廣度優(yōu)先和深度優(yōu)先的所有特征,同時考慮到局部和宏觀的信息,以達到很高的適用性。圖2.4 給出Node2Vec隨機游走的示例。
【學位授予單位】:遼寧科技大學
【學位級別】:碩士
【學位授予年份】:2019
【分類號】:TP393.092;TP18

【參考文獻】

相關期刊論文 前6條

1 黃英來;孫曉芳;劉鎮(zhèn)波;高萌;;微博轉發(fā)預測算法評測系統(tǒng)的建立及性能比較[J];哈爾濱理工大學學報;2013年04期

2 李英樂;于洪濤;劉力雄;;基于SVM的微博轉發(fā)規(guī)模預測方法[J];計算機應用研究;2013年09期

3 謝婧;劉功申;蘇波;孟魁;;社交網絡中的用戶轉發(fā)行為預測[J];上海交通大學學報;2013年04期

4 吳凱;季新生;劉彩霞;;基于行為預測的微博網絡信息傳播建模[J];計算機應用研究;2013年06期

5 張e

本文編號:2699209


資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/guanlilunwen/ydhl/2699209.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶ac1a1***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com