基于協同過濾與劃分聚類的推薦算法研究
發(fā)布時間:2017-06-30 03:01
本文關鍵詞:基于協同過濾與劃分聚類的推薦算法研究,由筆耕文化傳播整理發(fā)布。
【摘要】:隨著互聯網技術和通信技術的蓬勃發(fā)展,人們已經從信息匱乏的時代邁入到信息過載的時代,目前解決信息過載的方法主要有信息檢索和信息過濾,以搜索引擎為代表的信息檢索技術已經日漸成熟,個性化推薦是信息過濾領域最典型的應用,作為搜索引擎的補充已被廣泛應用到電子商務、社交網絡、基于位置的服務和個性化廣告等領域。常見的個性化推薦技術有協同過濾、基于內容的推薦和基于圖的推薦等等,協同過濾是其中最古老也是應用最成功的算法,它假設過去相似的用戶將來會有相似的行為,通過對用戶群體的歷史行為分析計算找出相似用戶,然后給目標用戶推薦他近鄰喜歡但他未購買的商品,但是當面對海量信息時,協同過濾算法也面臨著數據稀疏、冷啟動、推薦精度和擴展性等問題。 傳統(tǒng)的基于用戶的協同過濾和基于項目的協同過濾在計算推薦結果時,都局限在分析用戶-項目評分信息,基本沒有考慮用戶和項目的內容屬性,盡可能多的挖掘有價值的推薦信息,對于提高推薦精度至關重要。本文充分利用項目的屬性特點,就提高協同過濾近鄰查找準確率和近鄰查找效率做了如下研究: 首先,通過具體實例分析了傳統(tǒng)的協同過濾算法近鄰查找方法的缺陷,數據高維稀疏造成用戶間相似度計算和近鄰查找不準確,然后提出了基于相似評分行為的近鄰查找優(yōu)化算法。 其次,將劃分聚類的思想應用到協同推薦中,聚類的過程是將相似度高的對象聚到同一個簇中,通過聚類將目標用戶近鄰查找空間縮小至與其最相似的一個或幾個聚類簇,提出了基于用戶-評分矩陣聚類的協同過濾算法;考慮項目的屬性特點,應用詞頻-逆文檔頻率TF-IDF評估思想,將高維稀疏的用戶-評分矩陣轉化成相對低維密集的用戶-興趣矩陣,提出了基于用戶-興趣矩陣聚類的協同過濾算法;融合用戶-評分和用戶-興趣,提出了基于用戶-評分融合用戶-興趣聚類的協同過濾算法,并分別研究了它們的推薦實時性和推薦精度。 最后,,在數據集MovieLens上設計實驗,以傳統(tǒng)的基于用戶的協同過濾算法作為對照實驗,驗證了基于相似評分行為的近鄰查找算法能夠提高近鄰的查找準確率從而提高推薦的精度;基于劃分聚類的協同過濾算法能夠提高近鄰的查找效率,融合了項目屬性信息聚類的協同過濾算法比傳統(tǒng)的協同過濾算法推薦精度要高。
【關鍵詞】:個性化推薦 協同過濾 近鄰查找 相似度計算 劃分聚類 推薦精度
【學位授予單位】:吉林大學
【學位級別】:碩士
【學位授予年份】:2014
【分類號】:TP391.3
【目錄】:
- 摘要4-6
- Abstract6-10
- 第1章 緒論10-14
- 1.1 研究背景10-11
- 1.2 國內外研究現狀11-12
- 1.3 本文的研究內容12-13
- 1.4 本文的組織結構13-14
- 第2章 推薦系統(tǒng)概述14-29
- 2.1 推薦系統(tǒng)簡介14-15
- 2.2 協同過濾推薦15-22
- 2.2.1 協同推薦工作流程16-17
- 2.2.2 協同過濾分類17-21
- 2.2.3 協同推薦面臨的挑戰(zhàn)21-22
- 2.3 其他常用推薦算法22-26
- 2.3.1 基于內容的推薦算法22-24
- 2.3.2 基于圖的推薦算法24-26
- 2.4 推薦系統(tǒng)評測標準26-28
- 2.4.1 誤差標準26-27
- 2.4.2 命中率標準27
- 2.4.3 其他標準27-28
- 2.5 本章小結28-29
- 第3章 優(yōu)化近鄰查找的協同過濾算法29-37
- 3.1 優(yōu)化背景29-31
- 3.2 基于相似評分行為的近鄰查找法31-32
- 3.2.1 算法描述31-32
- 3.3 實驗結果與分析32-36
- 3.3.1 數據集介紹32-33
- 3.3.2 評測標準33-34
- 3.3.3 實驗環(huán)境34
- 3.3.4 實驗分析34-36
- 3.4 本章小結36-37
- 第4章 基于劃分聚類的協同過濾算法37-51
- 4.1 優(yōu)化背景及目標37-38
- 4.1.1 優(yōu)化背景37-38
- 4.1.2 優(yōu)化目標38
- 4.2 基于用戶-評分矩陣聚類的協同過濾算法38-42
- 4.2.1 算法說明38-39
- 4.2.2 算法描述39-41
- 4.2.3 實驗結果與分析41-42
- 4.3 基于用戶-興趣矩陣聚類的協同過濾算法42-48
- 4.3.1 算法說明42-44
- 4.3.2 算法描述44-47
- 4.3.3 實驗結果與分析47-48
- 4.4 基于用戶-評分融合用戶-興趣矩陣聚類的協同過濾算法48-50
- 4.4.1 算法說明48-49
- 4.4.2 算法描述49
- 4.4.3 實驗結果與分析49-50
- 4.5 本章小結50-51
- 第5章 總結與展望51-53
- 5.1 總結51
- 5.2 展望51-53
- 參考文獻53-57
- 作者簡介及在學期間科研成果57-58
- 致謝58
【參考文獻】
中國期刊全文數據庫 前6條
1 王國霞;劉賀平;;個性化推薦系統(tǒng)綜述[J];計算機工程與應用;2012年07期
2 陳君;唐雁;;基于Web社會網絡的個性化Web信息推薦模型[J];計算機科學;2006年04期
3 藺豐奇;劉益;;信息過載問題研究述評[J];情報理論與實踐;2007年05期
4 曾春,邢春曉,周立柱;個性化服務技術綜述[J];軟件學報;2002年10期
5 楊博;趙鵬飛;;推薦算法綜述[J];山西大學學報(自然科學版);2011年03期
6 鄧愛林,左子葉,朱揚勇;基于項目聚類的協同過濾推薦算法[J];小型微型計算機系統(tǒng);2004年09期
本文關鍵詞:基于協同過濾與劃分聚類的推薦算法研究,由筆耕文化傳播整理發(fā)布。
本文編號:500283
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/500283.html
教材專著