基于機器學習的個人數(shù)據(jù)平臺推薦系統(tǒng)的研究與實現(xiàn)
發(fā)布時間:2021-04-19 18:33
隨著信息技術(shù)的發(fā)展,人們越來越多使用互聯(lián)網(wǎng)獲取新聞,購物,觀看影片等。伴隨網(wǎng)絡中的數(shù)據(jù)量急速增大,推薦系統(tǒng)成為了解決信息過載的重要方法。與此同時,“個人數(shù)據(jù)管理平臺”抓取了用戶在各個平臺上的信息,擁有海量數(shù)據(jù),如何利用這些數(shù)據(jù)對用戶精準推薦也恰好是推薦系統(tǒng)的研究領(lǐng)域。目前,最為廣泛應用的推薦算法是協(xié)同過濾算法。然而,該算法也面臨諸多問題,如相似度模型較為樸素、預測過程未考慮用戶偏好模型以及當項目增加時,有潛在的性能問題;谝陨系膯栴},本文對相似度模型、用戶偏好模型和拓展性問題進行了研究,提出了一種改進的協(xié)同過濾推薦算法,取得了如下的主要研究成果:(1)在相似度度量問題上,提出了一種新的度量模型。該模型受NLP領(lǐng)域中的詞嵌入思想的啟發(fā),分別通過將項目的共現(xiàn)信息與項目的簡介信息分別映射到低維的向量空間中,得到關(guān)于項目的兩種向量表示方法。最后將兩種表示結(jié)合起來,按權(quán)重計算相似度。在項目共現(xiàn)的嵌入中,提出了f-item2vec模型,該模型引入了項目評分因子,進而增大高分項目的相似度;針對項目簡介信息,先分詞,然后使用doc2vec的方法訓練項目的向量。與現(xiàn)有相似度模型相比,本文提出的相似度模...
【文章來源】:北京工業(yè)大學北京市 211工程院校
【文章頁數(shù)】:84 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 研究背景與意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 本文主要研究內(nèi)容與貢獻
1.4 本文的組織結(jié)構(gòu)
第2章 相關(guān)理論與技術(shù)概述
2.1 推薦系統(tǒng)概述
2.2 基于內(nèi)容的推薦算法
2.2.1 基于內(nèi)容的推薦算法的主要步驟
2.2.2 基于內(nèi)容的推薦算法的優(yōu)缺點
2.3 協(xié)同過濾推薦算法
2.3.1 基于內(nèi)存的協(xié)同過濾算法
2.3.2 基于模型的協(xié)同過濾算法
2.4 基于人口統(tǒng)計學的推薦算法
2.5 本章小結(jié)
第3章 基于項目嵌入的相似度度量模型
3.1 推薦系統(tǒng)中傳統(tǒng)相似度度量方法
3.2 基于項目嵌入的向量化方法
3.2.1 基于項目共現(xiàn)的f-item2vec
3.2.2 基于項目簡介信息的向量化方法
3.3 組合特征相似度度量模型
3.4 實驗及結(jié)果分析
3.4.1 數(shù)據(jù)集與評價標準
3.4.2 實驗設計與結(jié)果分析
3.5 本章小結(jié)
第4章 基于長短期興趣的用戶偏好模型
4.1 用戶偏好模型概述
4.2 用戶偏好模型的理論基礎
4.3 用戶偏好模型
4.3.1 短期興趣權(quán)重
4.3.2 長期興趣權(quán)重
4.3.3 用戶偏好模型與評分方法
4.4 實驗及結(jié)果分析
4.4.1 數(shù)據(jù)集與評價指標
4.4.2 實驗設計與結(jié)果分析
4.5 本章小結(jié)
第5章 基于聚類的協(xié)同過濾推薦模型
5.1 聚類過程
5.1.1 生成S個初始聚類中心
5.1.2 使用K-means算法聚類
5.2 改進的協(xié)同過濾算法模型
5.3 實驗及結(jié)果分析
5.3.1 實驗數(shù)據(jù)集
5.3.2 實驗評價指標
5.3.3 實驗設計
5.3.4 模型在MAE上的結(jié)果對比與時間開銷
5.3.5 模型在Precision上的結(jié)果對比
5.3.6 模型在Recall上的結(jié)果對比
5.4 本章小結(jié)
第6章 基于改進協(xié)同過濾的推薦原型系統(tǒng)的設計實現(xiàn)
6.1 系統(tǒng)開發(fā)環(huán)境與平臺
6.2 系統(tǒng)概要設計
6.3 系統(tǒng)數(shù)據(jù)庫設計
6.4 核心模塊設計
6.4.1 離線處理模塊
6.4.2 在線推薦模塊
6.4.3 個人信息管理模塊
6.4.4 相似項目推薦模塊
6.5 原型系統(tǒng)實現(xiàn)
6.5.1 離線處理模塊
6.5.2 在線推薦模塊
6.5.3 個人信息管理模塊
6.5.4 相似項目推薦模塊
6.6 本章小結(jié)
結(jié)論
參考文獻
攻讀碩士學位期間取得的研究成果
致謝
【參考文獻】:
期刊論文
[1]國外網(wǎng)絡環(huán)境中信息過載研究進展[J]. 郭佳,黃程松. 情報科學. 2018(07)
[2]基于標簽聚類與項目主題的協(xié)同過濾推薦算法[J]. 李昊陽,符云清. 計算機科學. 2018(04)
[3]基于階段時序效應的奇異值分解推薦模型[J]. 黃凱,張曦煌. 計算機應用. 2017(05)
[4]一種基于貝葉斯網(wǎng)絡的個性化協(xié)同過濾推薦方法研究[J]. 付永平,邱玉輝. 計算機科學. 2016(09)
[5]TF-IDF與規(guī)則相結(jié)合的中文關(guān)鍵詞自動抽取研究[J]. 牛萍,黃德根. 小型微型計算機系統(tǒng). 2016(04)
[6]基于BP神經(jīng)網(wǎng)絡的情境化信息推薦服務研究[J]. 周樸雄,張兵榮,趙龍文. 情報科學. 2016(03)
[7]基于用戶模糊相似度的協(xié)同過濾算法[J]. 吳毅濤,張興明,王興茂,李晗. 通信學報. 2016(01)
[8]Time-Ordered Collaborative Filtering for News Recommendation[J]. XIAO Yingyuan,AI Pengqiang,Ching-Hsien Hsu,WANG Hongya,JIAO Xu. 中國通信. 2015(12)
[9]大數(shù)據(jù)環(huán)境下的推薦系統(tǒng)[J]. 孟祥武,紀威宇,張玉潔. 北京郵電大學學報. 2015(02)
[10]協(xié)同過濾推薦技術(shù)綜述[J]. 冷亞軍,陸青,梁昌勇. 模式識別與人工智能. 2014(08)
本文編號:3148087
【文章來源】:北京工業(yè)大學北京市 211工程院校
【文章頁數(shù)】:84 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 研究背景與意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 本文主要研究內(nèi)容與貢獻
1.4 本文的組織結(jié)構(gòu)
第2章 相關(guān)理論與技術(shù)概述
2.1 推薦系統(tǒng)概述
2.2 基于內(nèi)容的推薦算法
2.2.1 基于內(nèi)容的推薦算法的主要步驟
2.2.2 基于內(nèi)容的推薦算法的優(yōu)缺點
2.3 協(xié)同過濾推薦算法
2.3.1 基于內(nèi)存的協(xié)同過濾算法
2.3.2 基于模型的協(xié)同過濾算法
2.4 基于人口統(tǒng)計學的推薦算法
2.5 本章小結(jié)
第3章 基于項目嵌入的相似度度量模型
3.1 推薦系統(tǒng)中傳統(tǒng)相似度度量方法
3.2 基于項目嵌入的向量化方法
3.2.1 基于項目共現(xiàn)的f-item2vec
3.2.2 基于項目簡介信息的向量化方法
3.3 組合特征相似度度量模型
3.4 實驗及結(jié)果分析
3.4.1 數(shù)據(jù)集與評價標準
3.4.2 實驗設計與結(jié)果分析
3.5 本章小結(jié)
第4章 基于長短期興趣的用戶偏好模型
4.1 用戶偏好模型概述
4.2 用戶偏好模型的理論基礎
4.3 用戶偏好模型
4.3.1 短期興趣權(quán)重
4.3.2 長期興趣權(quán)重
4.3.3 用戶偏好模型與評分方法
4.4 實驗及結(jié)果分析
4.4.1 數(shù)據(jù)集與評價指標
4.4.2 實驗設計與結(jié)果分析
4.5 本章小結(jié)
第5章 基于聚類的協(xié)同過濾推薦模型
5.1 聚類過程
5.1.1 生成S個初始聚類中心
5.1.2 使用K-means算法聚類
5.2 改進的協(xié)同過濾算法模型
5.3 實驗及結(jié)果分析
5.3.1 實驗數(shù)據(jù)集
5.3.2 實驗評價指標
5.3.3 實驗設計
5.3.4 模型在MAE上的結(jié)果對比與時間開銷
5.3.5 模型在Precision上的結(jié)果對比
5.3.6 模型在Recall上的結(jié)果對比
5.4 本章小結(jié)
第6章 基于改進協(xié)同過濾的推薦原型系統(tǒng)的設計實現(xiàn)
6.1 系統(tǒng)開發(fā)環(huán)境與平臺
6.2 系統(tǒng)概要設計
6.3 系統(tǒng)數(shù)據(jù)庫設計
6.4 核心模塊設計
6.4.1 離線處理模塊
6.4.2 在線推薦模塊
6.4.3 個人信息管理模塊
6.4.4 相似項目推薦模塊
6.5 原型系統(tǒng)實現(xiàn)
6.5.1 離線處理模塊
6.5.2 在線推薦模塊
6.5.3 個人信息管理模塊
6.5.4 相似項目推薦模塊
6.6 本章小結(jié)
結(jié)論
參考文獻
攻讀碩士學位期間取得的研究成果
致謝
【參考文獻】:
期刊論文
[1]國外網(wǎng)絡環(huán)境中信息過載研究進展[J]. 郭佳,黃程松. 情報科學. 2018(07)
[2]基于標簽聚類與項目主題的協(xié)同過濾推薦算法[J]. 李昊陽,符云清. 計算機科學. 2018(04)
[3]基于階段時序效應的奇異值分解推薦模型[J]. 黃凱,張曦煌. 計算機應用. 2017(05)
[4]一種基于貝葉斯網(wǎng)絡的個性化協(xié)同過濾推薦方法研究[J]. 付永平,邱玉輝. 計算機科學. 2016(09)
[5]TF-IDF與規(guī)則相結(jié)合的中文關(guān)鍵詞自動抽取研究[J]. 牛萍,黃德根. 小型微型計算機系統(tǒng). 2016(04)
[6]基于BP神經(jīng)網(wǎng)絡的情境化信息推薦服務研究[J]. 周樸雄,張兵榮,趙龍文. 情報科學. 2016(03)
[7]基于用戶模糊相似度的協(xié)同過濾算法[J]. 吳毅濤,張興明,王興茂,李晗. 通信學報. 2016(01)
[8]Time-Ordered Collaborative Filtering for News Recommendation[J]. XIAO Yingyuan,AI Pengqiang,Ching-Hsien Hsu,WANG Hongya,JIAO Xu. 中國通信. 2015(12)
[9]大數(shù)據(jù)環(huán)境下的推薦系統(tǒng)[J]. 孟祥武,紀威宇,張玉潔. 北京郵電大學學報. 2015(02)
[10]協(xié)同過濾推薦技術(shù)綜述[J]. 冷亞軍,陸青,梁昌勇. 模式識別與人工智能. 2014(08)
本文編號:3148087
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3148087.html
最近更新
教材專著