天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 軟件論文 >

基于稀疏數(shù)據(jù)的協(xié)同過濾推薦算法研究及實現(xiàn)

發(fā)布時間:2021-06-03 18:22
  協(xié)同過濾能夠根據(jù)個人先前的行為數(shù)據(jù)信息,準確預測個人將來所需的數(shù)據(jù)。隨著計算機科學技術(shù)的普及和應用,在互聯(lián)網(wǎng)中產(chǎn)生了大規(guī)模的數(shù)據(jù),給人們的選擇帶來了極大的困難。因此,研究協(xié)同過濾推薦具有理論意義和應用價值。本文在詳細分析協(xié)同過濾推薦現(xiàn)存問題的基礎上,針對稀疏數(shù)據(jù)問題進行研究,主要工作包括:第一,針對數(shù)據(jù)稀疏環(huán)境下相似性判斷策略失效的問題,本文提出基于用戶評分偏好的策略。首先,分析用戶間評分值信任關系,在皮爾遜相關系數(shù)的基礎上引入用戶評分值信任度,在計算用戶間相似性時使用評分值信任度加權(quán);其次,通過挖掘用戶評分值背后隱含的用戶真實偏好信息,找出高分人群和低分人群,構(gòu)建用戶評分偏好模型;最后,綜合改良相似性評判和評分估測方法,更加準確的評判用戶間的相似性,以得到更加緊湊的用戶類別和更加準確的估測結(jié)果。第二,針對稀疏數(shù)據(jù)問題和用戶興趣的模糊性問題,本文提出融合模糊聚類的策略。模糊C均值算法在進行歐氏距離計算時,僅僅考慮用戶對電影的評分數(shù)據(jù),這樣顯的過于片面。本文定義用戶間的屬性距離,把用戶間的屬性距離和評分值間的歐氏距離進行加權(quán)融合,計算用戶間的綜合距離;針對模糊C均值算法對孤立點很敏感,且... 

【文章來源】:重慶郵電大學重慶市

【文章頁數(shù)】:78 頁

【學位級別】:碩士

【部分圖文】:

基于稀疏數(shù)據(jù)的協(xié)同過濾推薦算法研究及實現(xiàn)


MovieLens100k和MovieLens1m中電影類型信息

分布信息


出的把電影按照類型劃分是一種有可行的解決思路。2. 對于用戶年齡數(shù)據(jù)處理為了使實驗結(jié)果具備可比性和有效性,本文把兩個數(shù)據(jù)集中用戶的年齡按照相同的年齡段區(qū)間進行劃分,將處理后的數(shù)據(jù)信息以數(shù)據(jù)表和圖的形式分別進行展示。表 4.7 MovieLens 100k 中年齡分布信息年齡段 25 18 35 45 50 56 1用戶個數(shù) 310 198 194 80 73 52 36占比(保留三位小數(shù)) 0.329 0.21 0.206 0.085 0.077 0.055 0.038表 4.8 MovieLens 1m 中年齡分布信息年齡段 25 35 18 45 50 56 1用戶個數(shù) 2096 1193 1103 550 496 380 222占比(保留三位小數(shù)) 0.347 0.198 0.183 0.091 0.082 0.063 0.037

數(shù)據(jù)信息,職業(yè)信息


(a) MovieLens 100k 中用戶職業(yè)信息 (b) MovieLens 100k 中用戶職業(yè)信息圖 4.4 MovieLens 100k 和 MovieLens 1m 中用戶職業(yè)數(shù)據(jù)信息本文通過對數(shù)據(jù)集中的數(shù)據(jù)分析發(fā)現(xiàn),用戶集中在個別職業(yè)中,學生成為了觀影的主要人群,這個很容易解釋,因為學生有周末和寒暑假,觀看電影成為一種娛樂方式。這也和本文通過對年齡分析得出的結(jié)論相吻合,學生大多處于 25 歲年齡段區(qū)間中,說明了本文提出的考慮職業(yè)屬性距離是有意義的。

【參考文獻】:
期刊論文
[1]基于K-means聚類算法優(yōu)化方法的研究[J]. 劉葉,吳晟,周海河,吳興蛟,韓林嶧.  信息技術(shù). 2019(01)

碩士論文
[1]基于譜聚類SM算法的協(xié)同過濾推薦算法研究[D]. 陳清華.江西農(nóng)業(yè)大學 2018
[2]基于用戶的協(xié)同過濾算法改進研究及并行化實現(xiàn)[D]. 李嵩.西北農(nóng)林科技大學 2018
[3]協(xié)同過濾推薦系統(tǒng)中的數(shù)據(jù)稀疏性及冷啟動問題研究[D]. 李曉菊.華東師范大學 2018
[4]基于改進K-means聚類和RBM的協(xié)同過濾算法[D]. 耿瑞.吉林大學 2018
[5]基于模糊聚類的并行化推薦算法設計與研究[D]. 楊業(yè).浙江理工大學 2018
[6]基于興趣度和聚類的動態(tài)加權(quán)關聯(lián)規(guī)則挖掘的研究[D]. 謝詩浩.湖南大學 2016
[7]基于張量分解的推薦算法研究[D]. 黃丹.北京交通大學 2016
[8]面向數(shù)據(jù)稀疏的協(xié)同過濾推薦算法研究與優(yōu)化[D]. 黃正.華南理工大學 2012



本文編號:3211012

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/3211012.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶63a6c***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com