天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于TIN-LDA模型的微博推薦方法研究及應(yīng)用

發(fā)布時間:2020-10-11 23:19
   隨著時代的發(fā)展,微博作為網(wǎng)絡(luò)資源中共享、交流的社交與服務(wù)媒介平臺,逐漸融入到人們的日常生活中。微博平臺在為網(wǎng)絡(luò)用戶的自由言論與互動提供一個相對穩(wěn)定安全環(huán)境的同時,也為用戶提供一個資源互換的空間。微博用戶與用戶、資源之間產(chǎn)生了大量的顯性或隱性商業(yè)化的價值信息,可供用戶之間進行資源互換。商業(yè)用戶主要通過微博用戶的興趣標(biāo)簽、關(guān)注內(nèi)容等有價值的信息,挖掘微博用戶的興趣,從而達到準(zhǔn)確推薦商品的目的。在微博大數(shù)據(jù)環(huán)境影響下,如何根據(jù)用戶需求精確實現(xiàn)微博商品、博文推薦,已經(jīng)成為當(dāng)前互聯(lián)網(wǎng)大數(shù)據(jù)研究的熱點。商家在對用戶進行推薦時,通常使用主題模型、協(xié)同過濾等傳統(tǒng)的數(shù)據(jù)挖掘算法與推薦算法。但傳統(tǒng)的數(shù)據(jù)挖掘方法在進行挖掘有價值的微博信息時,常容易出現(xiàn)數(shù)據(jù)歧義、語義模糊、信息冗余等問題。為避免上述問題的發(fā)生,本文將微博交互信息作為基礎(chǔ)數(shù)據(jù)源,提出TIN-LDA模型與微博個性化混合推薦算法,以提高挖掘微博用戶興趣與微博推薦的準(zhǔn)確性。本文的主要研究內(nèi)容如下:(1)基于微博時效性與交互性特點,構(gòu)建TIN-LDA模型挖掘微博用戶興趣。由于用戶顯性興趣信息和隱性興趣信息之間存在交互性、相似性、時效性,因此在不同的環(huán)境與時間段下,微博用戶興趣信息呈現(xiàn)出不同的類型特點。為全面挖掘微博用戶興趣,本文根據(jù)微博的時效性推斷微博用戶動態(tài)興趣取向,根據(jù)微博交互性推斷微博用戶興趣層次取向,以此構(gòu)建TIN-LDA模型挖掘微博用戶擴展屬性上的興趣主題與主題詞,該方法展現(xiàn)了微博用戶潛在興趣的層次與動態(tài)變化。本文以主題質(zhì)量、困惑度為TIN-LDA模型的評價標(biāo)準(zhǔn),實驗結(jié)果表明TIN-LDA微博用戶興趣模型能更為精確的挖掘微博用戶的興趣。(2)基于傳統(tǒng)推薦算法,給出微博個性化混合推薦。由于微博興趣推薦時容易受到微博文本內(nèi)容稀疏性的影響,基于內(nèi)容的傳統(tǒng)推薦算法和協(xié)同過濾推薦算法難以實現(xiàn)微博的個性化推薦。因此本文基于挖掘微博文本信息中“多源相關(guān)信息有利于提升用戶推薦質(zhì)量”這一假設(shè),結(jié)合微博多源數(shù)據(jù)的多樣性特點,提出基于KTL推薦算法;結(jié)合微博多源數(shù)據(jù)的個性化特點,提出融合KTL與協(xié)同過濾的微博個性化混合推薦算法。通過F-measure實驗結(jié)果表明,相較于單一的基于內(nèi)容的微博推薦或單一的基于協(xié)同過濾的微博推薦,微博個性化混合推薦算法能夠獲取更好的效果。(3)構(gòu)建微博用戶興趣平臺,可視化展示微博推薦TOP-K。考慮海量數(shù)據(jù)的場景,使用SSM框架、redis和ngnix等技術(shù),實現(xiàn)微博用戶信息數(shù)據(jù)源的分布式、并發(fā)處理及可視化展示。同時,將微博個性化混合推薦算法與echart可視化界面相結(jié)合,應(yīng)用于微博用戶興趣與商業(yè)推薦的結(jié)果展現(xiàn)。通過構(gòu)建微博用戶興趣平臺展示推薦TOP-K,平臺的展示結(jié)果對于挖掘商業(yè)化的信息具有一定的價值。圖[20]表[6]參[84]
【學(xué)位單位】:安徽理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位年份】:2019
【中圖分類】:TP391.3;TP393.092
【部分圖文】:

模型圖,模型,主題,文檔


存在多個混合主體,而且文章中每個主題都有著對應(yīng)的詞的概率分布,可以借助于極大??值算法來完成PLSA模型的構(gòu)建。同時Hof?Maim也認(rèn)為,這便是真正意義層面的主題??模型,其模型如圖1所示。??該模型以數(shù)學(xué)統(tǒng)計為基礎(chǔ),對文檔中不同位置上的詞進行概率計算。在一個完整的??文檔集中,其每篇文檔d之下的每個詞V,分成三步來生成:(1)借助于iY必先驗概??率,擇選其中的一篇文檔A?(2)再借助于P問勿概率,得到主題二(3)再以??概率,得到單詞w。因此在‘文檔的第w篇中的詞的概率如下公式5所示:??尸卜K)?=?I?Z)*作?K))?=?m)?(5)??9??

模型圖,模型,主題,主題分布


現(xiàn)的概率也并非一致:不同文檔的主題概率,以及主題中的詞都屬于Dirichlet分布并呈??現(xiàn)出獨立性[7Q]。此為,LDA模型還引入了詞袋模型假定,即.?在具體模型之中,對詞匯??的次序不加考慮,僅僅注重他們出現(xiàn)頻次的分析,LDA模型如圖2所示。??LDA模型主要是使Gibbs抽樣對參數(shù)進行估計。Gibbs抽樣實現(xiàn)起來較為容易,且??在大規(guī)模預(yù)料中得到廣泛應(yīng)用。Gibbs的主要思想是不斷釆用條件分布來加以抽樣,使??得抽象結(jié)果更加與全概率分布相近。Gibbs在LDA模型中的抽樣公式如公式7所示:??P{zt?=?k?|?z,?W)?=?(?l'rai,?+ak)/(X,inkmJ?+ak))*{n'kJ?+/S,)/(^,(K,?+?fi,))?(7)??Gibbs抽樣是構(gòu)建LDA模型的重要基礎(chǔ)。LDA模型的訓(xùn)練過程,是借助于Gibbs抽??樣算式,對文檔中的每個詞的主題進行迭代抽樣,從而預(yù)測新文檔的主題分布[71]。該訓(xùn)??練流程的步驟為:??(1)

協(xié)同過濾,物品,用戶群


第2章相關(guān)技術(shù)與方法??使用了不同物品之間的相關(guān)性,而非不同用戶之間的相關(guān)性。基于物品的協(xié)同過濾如下??圖3所示:??n?^?0??物口口?1??用戶1?J??0?IT!?W??r ̄^l??I?用戶?3??J?J??LL??物品2??用戶2??圖3基于物品的協(xié)同過濾??Figure?3?Item-based?collaborative?filtering??在3圖中,如果1、2兩個用戶,對兩個物品,即物品1與物品2產(chǎn)生過行為。這??樣,就能將兩個物品納入相似物品。即所有對1物品有了行為的用戶,那么也會對2物??品產(chǎn)生行為。所以,如果用戶3對1物品產(chǎn)生行為,那么就能向其推薦物品2。??但協(xié)同過濾算法缺乏一定的個性化,其推薦結(jié)果主要是按照目標(biāo)用戶閱讀歷史數(shù)據(jù)??來進行,很難展現(xiàn)出同類用戶群、諸多目標(biāo)用戶群與類似用戶群興趣的差異,這就使得??推薦結(jié)果缺乏個性化。在構(gòu)筑相似用戶群之前,若A,B兩用戶所瀏覽微博內(nèi)容基本一??致,則A,B用戶便被納入到同一各類似用戶群,用戶群可以獲得一致的推薦結(jié)果。可??實際生活中他們興趣并不一致
【參考文獻】

相關(guān)期刊論文 前8條

1 張林;錢冠群;樊衛(wèi)國;華琨;張莉;;輕型評論的情感分析研究[J];軟件學(xué)報;2014年12期

2 高明;金澈清;錢衛(wèi)寧;王曉玲;周傲英;;面向微博系統(tǒng)的實時個性化推薦[J];計算機學(xué)報;2014年04期

3 謝昊;江紅;;一種面向微博主題挖掘的改進LDA模型[J];華東師范大學(xué)學(xué)報(自然科學(xué)版);2013年06期

4 楊長春;俞克非;葉施仁;嚴(yán)水歌;丁虹;楊晶;;一種新的中文微博社區(qū)博主影響力的評估方法[J];計算機工程與應(yīng)用;2012年25期

5 王愛國;李廉;楊靜;陳桂林;;一種基于Bayesian網(wǎng)絡(luò)的網(wǎng)頁推薦算法[J];山東大學(xué)學(xué)報(工學(xué)版);2011年04期

6 李濤;王建東;葉飛躍;馮新宇;張有東;;一種基于用戶聚類的協(xié)同過濾推薦算法[J];系統(tǒng)工程與電子技術(shù);2007年07期

7 蓋杰,王怡,武港山;潛在語義分析理論及其應(yīng)用[J];計算機應(yīng)用研究;2004年03期

8 李靜梅,孫麗華,張巧榮,張春生;一種文本處理中的樸素貝葉斯分類器[J];哈爾濱工程大學(xué)學(xué)報;2003年01期



本文編號:2837270

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/guanlilunwen/ydhl/2837270.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶00b51***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com