天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于用戶興趣轉(zhuǎn)移挖掘的流式推薦算法研究

發(fā)布時(shí)間:2021-07-26 12:43
  推薦系統(tǒng)是當(dāng)下解決信息超載問題的有效方法,在經(jīng)過學(xué)術(shù)界和工業(yè)界多年共同的研究和應(yīng)用后,取得了卓越的研究成果。但是在移動(dòng)互聯(lián)網(wǎng)的時(shí)代中,數(shù)據(jù)量呈現(xiàn)幾何式增長(zhǎng),傳統(tǒng)推薦系統(tǒng)同時(shí)面臨著可擴(kuò)展性和數(shù)據(jù)稀疏性的雙重考驗(yàn)。同時(shí),隨著時(shí)間的遷移,用戶的興趣偏好也在不斷發(fā)生變化,一個(gè)成功的推薦系統(tǒng)應(yīng)能捕捉并適應(yīng)這些變化。為了應(yīng)對(duì)上述挑戰(zhàn),本文提出了一種基于用戶興趣轉(zhuǎn)移挖掘的流式推薦算法,主要從矩陣預(yù)填充、流式推薦模型的構(gòu)建和遺忘機(jī)制三個(gè)方面展開研究并對(duì)其缺點(diǎn)進(jìn)行針對(duì)性的改進(jìn)。(1)帶有流行度懲罰項(xiàng)的矩陣預(yù)填充方法。傳統(tǒng)的協(xié)同過濾算法無法適應(yīng)過于稀疏的數(shù)據(jù),而矩陣預(yù)填充方法可以基于先驗(yàn)知識(shí)對(duì)缺失評(píng)分進(jìn)行估計(jì)和填充,能夠在一定程度上緩解數(shù)據(jù)的稀疏性問題。在對(duì)Enhanced SVD(ESVD)預(yù)填充方法的評(píng)分誤差進(jìn)行分析后,本文提出預(yù)填充評(píng)分的誤差與用戶活躍度及資源流行度之間具有正相關(guān)性的假設(shè),并基于ESVD方法設(shè)計(jì)了一種帶有流行度懲罰項(xiàng)的矩陣預(yù)填充方法ESVD-P,提高了預(yù)填充評(píng)分的精度,改善了模型后續(xù)的訓(xùn)練質(zhì)量。(2)基于種類信息構(gòu)建的改進(jìn)流式推薦算法。為了能夠及時(shí)應(yīng)對(duì)外界的變化,流式推薦算法大多采用... 

【文章來源】:武漢理工大學(xué)湖北省 211工程院校 教育部直屬院校

【文章頁(yè)數(shù)】:63 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于用戶興趣轉(zhuǎn)移挖掘的流式推薦算法研究


MovieLens1M數(shù)據(jù)集中電影評(píng)分?jǐn)?shù)量分布

數(shù)量分布,數(shù)量分布,數(shù)據(jù)集中,矩陣


武漢理工大學(xué)碩士學(xué)位論文1圖2-2MovieLens1M數(shù)據(jù)集中用戶評(píng)分?jǐn)?shù)量分布將上述挑選出的熱門資源子矩陣與活躍用戶子矩陣相結(jié)合,便得到最終的高密度子矩陣,以MovieLens1M數(shù)據(jù)集為例,如表2-1所示,前5%的活躍用戶與前5%的熱門資源構(gòu)成的子評(píng)分矩陣中一共包含41,900個(gè)已知評(píng)分,缺失評(píng)分?jǐn)?shù)量?jī)H為17,702個(gè),子矩陣的整體密度高達(dá)70.30%,要遠(yuǎn)遠(yuǎn)高于原始評(píng)分矩陣4.19%的密度。表2-1不同挑選比例下的子矩陣分析挑選比例評(píng)分?jǐn)?shù)量缺失評(píng)分?jǐn)?shù)量子矩陣密度5%41,90017,70270.30%10%128,813109,99553.94%15%226,243307,72742.37%20%322,887629,86533.89%2.3.2子矩陣缺失評(píng)分的預(yù)測(cè)由活躍用戶與熱門資源所組成的高密度子矩陣中包含豐富的數(shù)據(jù)信息,因此,使用基本的矩陣分解模型RegularizedSVD(RSVD)便能很好的學(xué)習(xí)到用戶與資源的特征,從而對(duì)其中的缺失項(xiàng)進(jìn)行預(yù)測(cè)。如式(2-1)所示,子矩陣將被分解成用戶特征矩陣和資源特征矩陣的乘積:

矩陣圖,矩陣,誤差,流行度


武漢理工大學(xué)碩士學(xué)位論文12.4.3實(shí)驗(yàn)結(jié)果為了評(píng)估在矩陣預(yù)填充階段,流行度懲罰項(xiàng)對(duì)于預(yù)填充評(píng)分精度的影響,本文在不同的活躍用戶和熱門資源的選擇比例下,對(duì)比了ESVD方法與本文提出的ESVD-P方法的填充評(píng)分精度的實(shí)驗(yàn)結(jié)果。如圖2-4(a)所示,在T8的實(shí)驗(yàn)設(shè)定下,當(dāng)活躍用戶和熱門資源的選擇比例在5%-20%范圍時(shí),本文提出的ESVD-P矩陣預(yù)填充算法(在圖中由藍(lán)色表示)在填充評(píng)分的RMSE指標(biāo)上要優(yōu)于ESVD矩陣預(yù)填充算法(在圖中由紅色表示)。圖中可以發(fā)現(xiàn),當(dāng)選擇比例繼續(xù)擴(kuò)大時(shí),對(duì)于挑選出的用戶和資源,整體上的用戶活躍度和資源流行度要更加趨于平均,因此流行度所帶來的影響也逐漸消失。如圖2-4(b)所示,本文提出的ESVD-P預(yù)填充算法在填充評(píng)分的MAE指標(biāo)上同樣要優(yōu)于ESVD方法,結(jié)合RMSE指標(biāo)進(jìn)行綜合分析,可以發(fā)現(xiàn)流行度懲罰項(xiàng)對(duì)于評(píng)分的平均誤差影響較小,但顯著降低了填充評(píng)分誤差的波動(dòng)幅度。(a)RMSE(b)MAE圖2-4T8實(shí)驗(yàn)設(shè)定下矩陣預(yù)填充誤差(a)RMSE(b)MAE圖2-5T9實(shí)驗(yàn)設(shè)定下矩陣預(yù)填充誤差如圖2-5所示,在T9的實(shí)驗(yàn)設(shè)定下?lián)碛邢嗨频膶?shí)驗(yàn)結(jié)果。當(dāng)選擇比例降低

【參考文獻(xiàn)】:
期刊論文
[1]語(yǔ)義分析與TF-IDF方法相結(jié)合的新聞推薦技術(shù)[J]. 周由,戴牡紅.  計(jì)算機(jī)科學(xué). 2013(S2)
[2]推薦系統(tǒng)評(píng)價(jià)指標(biāo)綜述[J]. 朱郁筱,呂琳媛.  電子科技大學(xué)學(xué)報(bào). 2012(02)
[3]流數(shù)據(jù)挖掘綜述[J]. 孫玉芬,盧炎生.  計(jì)算機(jī)科學(xué). 2007(01)



本文編號(hào):3303587

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3303587.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶2e532***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com