天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于特征工程的協(xié)同過濾算法研究

發(fā)布時間:2024-04-25 23:07
  協(xié)同過濾算法是目前應用最廣泛、最成功的推薦算法之一,通過分析用戶或項目特征計算相似度,生成最近鄰集合,最后預測對未知項目的評分生成推薦結果。用戶或項目特征在協(xié)同過濾算法中是至關重要的,其區(qū)分度和稀疏性會直接影響算法的預測準確度。無論是傳統(tǒng)協(xié)同過濾算法還是改進的協(xié)同過濾算法,二者都是將評分數(shù)據(jù)作為用戶或項目的特征,因此就有兩個方面的問題需要進一步探索和優(yōu)化:(1)用戶或項目特征的區(qū)分度不高。評分數(shù)據(jù)在很大程度上受到用戶個性化偏好、行為習慣等不可度量因素的影響,對于不同的用戶來說,相同評分會代表不同偏好,而不同評分卻可能代表相同的偏好。因此,將評分數(shù)據(jù)作為用戶或項目特征就會存在特征區(qū)分度不高的問題。為了得到區(qū)分度更高的特征,研究者們會使用不同的方法,例如:基于內容的方法引入各種用戶或項目特征、引入人口統(tǒng)計特征或結合自然語言處理技術等。(2)用戶或項目特征具有高稀疏性。隨著互聯(lián)網(wǎng)用戶規(guī)模的急速擴大和電子商務的普及,用戶評分的項目通常只占全部項目的很少一部分,評分數(shù)據(jù)極度稀疏。此時,將評分數(shù)據(jù)作為用戶或項目特征就會存在特征稀疏度高的問題。為了緩解稀疏性問題帶來的影響,研究者們創(chuàng)新出了多種控制填...

【文章頁數(shù)】:59 頁

【學位級別】:碩士

【部分圖文】:

圖1-1主流社交應用使用率

圖1-1主流社交應用使用率

第1章緒論第1章緒論.1研究背景及意義信息技術的高速發(fā)展,為人們日常生活中信息的獲取提供了便捷途徑,但不僅僅滿足于獲取信息,與此同時也在制造信息,傳播信息。中國互聯(lián)網(wǎng)絡中心預2018年8月發(fā)布的第42中國互聯(lián)網(wǎng)絡發(fā)展狀況統(tǒng)計報告[1]指出,截018年....


圖1-2網(wǎng)絡購物用戶規(guī)模

圖1-2網(wǎng)絡購物用戶規(guī)模

每日都會花費數(shù)個小時進行網(wǎng)絡即時通信、網(wǎng)絡購物、APP應用等統(tǒng)計共有544萬個網(wǎng)站和415萬款APP,半年間制造、傳播266億GB的信如,觀察圖1-1中數(shù)據(jù),隨著微信朋友圈、QQ空間和微博等主流社交應用的使用,網(wǎng)絡購物和手機購物的用戶規(guī)模與日俱增,如圖....


圖2-5基于矩陣分解模型的協(xié)同過濾算法

圖2-5基于矩陣分解模型的協(xié)同過濾算法

圖2-5基于矩陣分解模型的協(xié)同過濾算法為了訓練矩陣分解模型,需要最小化損失函數(shù),如下公式,然后可以使降等優(yōu)化算對參數(shù)進行學習。min,在模型訓練結束之后,通過公式還原評分矩陣。從矩陣中便可以得到對目的預測評分值。??=?(歸因理論海德(FritzHeider)于1....


圖2-6GBDT+LR模型

圖2-6GBDT+LR模型

圖2-6GBDT+LR模型2.4常用數(shù)據(jù)集及評價指標2.4.1常用數(shù)據(jù)集為評估文中提出的算法對準確度的提升程度,在三個Movielens[46]、Yahoo!WebscopeR4[47]、Filmtrust[48]。這究領域通用的數(shù)據(jù)集,采集的都是用戶對項目的....



本文編號:3964365

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3964365.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶709b2***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com