天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于VOLDA主題模型和ESG預測模型的話題熱度預測研究

發(fā)布時間:2021-11-27 19:28
  隨著互聯(lián)網(wǎng)的普及,web2.0社交媒體對人們的日常生活產(chǎn)生了巨大的影響,同時生成了海量的網(wǎng)絡輿情文本。這些輿情文本如論壇帖子,實時反映當前網(wǎng)絡輿情的熱點話題,具有豐富的話題內(nèi)容信息。因此,如何對輿情文本進行在線主題建模,實時挖掘出話題信息并進行話題熱度計算與預測具有重要的研究意義。然而現(xiàn)有研究對話題的熱度計算中忽略了輿情文本的主題組成情況并且現(xiàn)有的預測模型對話題熱度的預測能力較差,因此本文提出了一種基于VOLDA主題模型和ESG預測模型的話題熱度預測方法。本文首先研究了在線主題模型與時間序列預測方法的相關理論,將其作為本文的研究基礎。其次在OLDA模型中引入主題相似度矩陣來去除非相關時間片主題影響,構建了可變在線LDA模型(Variable Online-LDA,簡稱VOLDA)。此外考慮到時間序列一般由多個時間序列模塊組成,本文提出了ESG(EEMD-SVM-GMDH)預測模型用于時間序列分解預測。之后,本文設計了基于上述兩個模型的話題熱度預測方法,提出了結合主題模型和熱度指標的話題熱度計算方法,利用VOLDA模型自動獲取話題及其熱度時間序列,并利用ESG模型對其進行預測。最后,本文... 

【文章來源】:南京航空航天大學江蘇省 211工程院校

【文章頁數(shù)】:63 頁

【學位級別】:碩士

【部分圖文】:

基于VOLDA主題模型和ESG預測模型的話題熱度預測研究


論壇數(shù)據(jù)存儲方式

困惑度,時間片,下模,權重矩陣


表 4.1(續(xù))時間窗口的大小 3初始演化權重矩陣 [0.3,0.3,0.4]文檔熱度點擊系數(shù) 1文檔熱度評論系數(shù) 1迭代次數(shù) I 1000主題數(shù)量 K 50初始 1初始 0.01時間片長額ts 12 小時相似度閾值 s 0.3下圖 4.3 為時間窗口的大小 3且初始演化權重矩陣 [0.3,0.3,0.4]時實驗結果。由于 VOLDA 模型,VOLDA-T 模型和 OLDA 模型的前三個時間窗口都采用相同的建模超參數(shù),因此本文從第 3 個時間片開始進行困惑度比較。

時間序列,困惑度,時間窗口


由于當時間窗口為5的時候,前5個時間片采用原始LDA模型進行訓練,實際基于VOL型的主題建模在第 6 個時間片開始,因此在進行困惑度的比較的時候忽略前 5 個時間惑度,僅比較后續(xù)時間片的困惑度。從上圖中可以看出,實際上各個時間窗口的困惑度接近,反映了相同的困惑度變化趨勢。其中,時間窗口為 2 時,在各個時間片的困惑度,時間窗口為 4 和 5 的時候困惑度都較大,因此在本研究語料中,時間窗口取值為 2 ,VOLDA 模型的建模效果最為理想,因此后續(xù)實驗都是在時間窗口大小為 2 的 VOLD的基礎上進行的。.5 話題熱度預測實驗及結果分析.5.1 實驗基本思路本文提出了基于 VOLDA 主題模型和 ESG 預測模型進行話題熱度預測的方法。進行度預測主要依靠基于 VOLDA 模型自動獲取話題熱度時間序列以及 ESG 預測模型進行度時間序列的預測,因此接下來主要對這兩個方面進行實驗驗證本文提出的話題熱度圖 4.4 不同時間窗口下困惑度對比

【參考文獻】:
期刊論文
[1]基于相關度的局部潛在語義分析算法研究[J]. 吳勇,劉鈺峰.  控制工程. 2017(08)
[2]融合PLSA和隨機游走模型的自動圖像標注[J]. 田東平.  小型微型計算機系統(tǒng). 2017(08)
[3]面向大數(shù)據(jù)的網(wǎng)絡輿情熱度動態(tài)預測模型研究[J]. 蘭月新,劉冰月,張鵬,夏一雪,李昊青.  情報雜志. 2017(06)
[4]一種基于改進PLSA和案例推理的行為識別算法[J]. 涂宏斌,岳艷艷,周新建,羅錕.  計算機科學. 2017(06)
[5]融合相關性與多樣性的學術論文推薦方法研究[J]. 李響,譚靜.  情報理論與實踐. 2017(06)
[6]基于改進的OLDA模型話題檢測及演化分析[J]. 余本功,張衛(wèi)春,王龍飛.  情報雜志. 2017(02)
[7]基于OLDA的熱點話題演化跟蹤模型[J]. 陳興蜀,高悅,江浩,杜敏,王海舟,何建云.  華南理工大學學報(自然科學版). 2016(05)
[8]基于PLSA主題模型的多標記文本分類[J]. 蔣銘初,潘志松,尤峻.  數(shù)據(jù)采集與處理. 2016(03)
[9]基于自激點過程的網(wǎng)絡熱點話題傳播模型[J]. 韓忠明,張夢,譚旭升,段大高,司慧琳.  計算機學報. 2016(04)
[10]基于小波分析與人工神經(jīng)網(wǎng)絡的網(wǎng)絡輿情預測[J]. 舒予,張黎俐.  情報科學. 2016(04)



本文編號:3522908

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/guanlilunwen/tongjijuecelunwen/3522908.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶07dec***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com