推薦算法自動選擇框架的研究與實現(xiàn)
發(fā)布時間:2023-02-11 13:38
互聯(lián)網(wǎng)的爆炸性發(fā)展在帶給人們便利的同時也帶來了嚴(yán)重的數(shù)據(jù)過載問題,為了解決這個問題,人們先后開發(fā)出了分類目錄和搜索引擎兩種解決方案,但都存在缺陷。隨著時代發(fā)展,推薦系統(tǒng)開始成為一種常見的解決方案而登上歷史舞臺。然而當(dāng)前的推薦系統(tǒng)往往是面向某個業(yè)務(wù)實現(xiàn)的針對性推薦軟件,當(dāng)業(yè)務(wù)需求或者環(huán)境發(fā)生改變時,推薦系統(tǒng)很容易出現(xiàn)各種問題,靈活性很差。此外當(dāng)前市面上很多推薦系統(tǒng)都存在一些顯而易見的過期推薦行為,即用戶經(jīng)常發(fā)現(xiàn)剛買過且當(dāng)前不再需要的物品也會被系統(tǒng)反復(fù)地推薦。針對上述問題,本文提出一個可控算法且可跨平臺運(yùn)行的通用推薦系統(tǒng)框架,該框架能夠運(yùn)行多個經(jīng)過優(yōu)化的推薦算法,并對各個算法的輸出結(jié)果進(jìn)行整合去重,從而實現(xiàn)更加精準(zhǔn)的個性化推薦。本文的主要研究工作如下:(1)為了實現(xiàn)框架能應(yīng)對不同推薦業(yè)務(wù)的效果,本文通過GroupLines實驗室獲取了和電影推薦相關(guān)的MovieLens數(shù)據(jù)集,又通過爬蟲拿到了Wargaming公司的用戶數(shù)據(jù)集,并對兩個數(shù)據(jù)集進(jìn)行整理與轉(zhuǎn)換,使之成為算法可以處理的格式,并且采取自適應(yīng)噪音消除策略計算數(shù)據(jù)集的清洗閥值。(2)使用協(xié)同過濾算法來獲取目標(biāo)用戶的推薦列表,并使用熱門推...
【文章頁數(shù)】:58 頁
【學(xué)位級別】:碩士
【文章目錄】:
中文摘要
Abstract
第1章 引言
1.1 選題的理論意義
1.2 推薦系統(tǒng)的國內(nèi)外發(fā)展情況
1.2.1 國外發(fā)展情況
1.2.2 國內(nèi)發(fā)展情況
1.3 課題內(nèi)容及本文所做的工作
1.3.1 課題研究內(nèi)容
1.3.2 論文內(nèi)容及組織安排
第2章 需求分析
2.1 框架定義
2.2 功能需求
2.3 數(shù)據(jù)需求
第3章 使用技術(shù)介紹
3.1 推薦技術(shù)
3.1.1 基于用戶的協(xié)同過濾推薦技術(shù)
3.1.2 基于物品的協(xié)同過濾推薦技術(shù)
3.2 網(wǎng)絡(luò)爬蟲技術(shù)
3.3 Hadoop框架
3.3.1 Hadoop簡介
3.3.2 Hadoop的特點
3.4 Python語言
3.5 HBase數(shù)據(jù)庫
3.6 開發(fā)與測試環(huán)境
第4章 推薦框架的設(shè)計與實現(xiàn)
4.1 系統(tǒng)的整體設(shè)計
4.1.1 框架運(yùn)行流程簡介
4.1.2 框架功能設(shè)計
4.2 數(shù)據(jù)集
4.2.1 數(shù)據(jù)集獲取
4.2.2 數(shù)據(jù)處理
4.2.3 數(shù)據(jù)格式
4.3 推薦算法的實現(xiàn)
4.3.1 噪音消除
4.3.2 基于用戶的推薦
4.3.3 基于物品的推薦
4.3.4 綜合推薦
4.4 推薦算法優(yōu)化
4.4.1 計算優(yōu)化
4.4.2 重復(fù)計算優(yōu)化
4.4.3 數(shù)據(jù)格式優(yōu)化
4.4.4 冷啟動優(yōu)化
4.4.5 個性優(yōu)化
4.5 推薦去重
4.5.1 現(xiàn)有的周期性去重方案分析
4.5.2 算法改進(jìn)思路
4.5.3 自動計算推薦窗口期的去重算法
4.6 推薦效果評價指標(biāo)
4.7 綜合展示
4.8 本章小結(jié)
第5章 總結(jié)與展望
5.1 全文總結(jié)
5.2 后續(xù)工作展望
參考文獻(xiàn)
致謝
個人簡歷及在學(xué)期間的研究成果和發(fā)表的學(xué)術(shù)論文
本文編號:3740484
【文章頁數(shù)】:58 頁
【學(xué)位級別】:碩士
【文章目錄】:
中文摘要
Abstract
第1章 引言
1.1 選題的理論意義
1.2 推薦系統(tǒng)的國內(nèi)外發(fā)展情況
1.2.1 國外發(fā)展情況
1.2.2 國內(nèi)發(fā)展情況
1.3 課題內(nèi)容及本文所做的工作
1.3.1 課題研究內(nèi)容
1.3.2 論文內(nèi)容及組織安排
第2章 需求分析
2.1 框架定義
2.2 功能需求
2.3 數(shù)據(jù)需求
第3章 使用技術(shù)介紹
3.1 推薦技術(shù)
3.1.1 基于用戶的協(xié)同過濾推薦技術(shù)
3.1.2 基于物品的協(xié)同過濾推薦技術(shù)
3.2 網(wǎng)絡(luò)爬蟲技術(shù)
3.3 Hadoop框架
3.3.1 Hadoop簡介
3.3.2 Hadoop的特點
3.4 Python語言
3.5 HBase數(shù)據(jù)庫
3.6 開發(fā)與測試環(huán)境
第4章 推薦框架的設(shè)計與實現(xiàn)
4.1 系統(tǒng)的整體設(shè)計
4.1.1 框架運(yùn)行流程簡介
4.1.2 框架功能設(shè)計
4.2 數(shù)據(jù)集
4.2.1 數(shù)據(jù)集獲取
4.2.2 數(shù)據(jù)處理
4.2.3 數(shù)據(jù)格式
4.3 推薦算法的實現(xiàn)
4.3.1 噪音消除
4.3.2 基于用戶的推薦
4.3.3 基于物品的推薦
4.3.4 綜合推薦
4.4 推薦算法優(yōu)化
4.4.1 計算優(yōu)化
4.4.2 重復(fù)計算優(yōu)化
4.4.3 數(shù)據(jù)格式優(yōu)化
4.4.4 冷啟動優(yōu)化
4.4.5 個性優(yōu)化
4.5 推薦去重
4.5.1 現(xiàn)有的周期性去重方案分析
4.5.2 算法改進(jìn)思路
4.5.3 自動計算推薦窗口期的去重算法
4.6 推薦效果評價指標(biāo)
4.7 綜合展示
4.8 本章小結(jié)
第5章 總結(jié)與展望
5.1 全文總結(jié)
5.2 后續(xù)工作展望
參考文獻(xiàn)
致謝
個人簡歷及在學(xué)期間的研究成果和發(fā)表的學(xué)術(shù)論文
本文編號:3740484
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/3740484.html
最近更新
教材專著