個性化電影主題播單推薦系統(tǒng)的設計與實現(xiàn)
發(fā)布時間:2021-05-17 07:55
視頻推薦在推薦系統(tǒng)領域是炙手可熱的話題,長視頻不同于文字,在推薦給用戶時所能展現(xiàn)出的信息相對較少,用戶大部分時間只能通過名稱和海報去判斷是否對視頻感興趣。為了解決此類問題,論文設計和實現(xiàn)了電影主題播單推薦系統(tǒng),從播單的角度尋求方案,一方面可以幫助用戶發(fā)現(xiàn)自己感興趣的視頻,減少信息篩選的時間,另一方面讓電影展現(xiàn)在對它感興趣的用戶面前,提高了平臺的流量,從而實現(xiàn)用戶和平臺的雙贏。電影主題播單推薦系統(tǒng)相比于傳統(tǒng)推薦系統(tǒng),需要解決主題尋找、視頻聚合等問題,系統(tǒng)會挖掘用戶的行為,將用戶日志轉(zhuǎn)化成抽象的用戶畫像,自動化生產(chǎn)興趣播單、基于內(nèi)容的播單和非個性化播單,再通過多路召回,混合推薦、多樣性過濾等步驟,將播單精準地推薦給需要的用戶。系統(tǒng)從功能上分為五個模塊,分別為用戶畫像模塊、播單處理模塊、推薦工程模塊、前端接口模塊和工程監(jiān)控模塊。其中用戶畫像的計算主要使用了播放指數(shù)公式,并設計 了基于 TF-IDF(Term Frequency-Inverse Document Frequency,詞頻-逆文檔頻率)和基于記憶遺忘曲線增量模型的權重計算公式。在播單自動化擴充時,需要計算電影與電影之間的共現(xiàn)相似...
【文章來源】:北京交通大學北京市 211工程院校 教育部直屬院校
【文章頁數(shù)】:90 頁
【學位級別】:碩士
【文章目錄】:
致謝
摘要
ABSTRACT
1 引言
1.1 論文背景
1.2 項目目標及意義
1.3 論文主要工作及組織結(jié)構(gòu)
2 相關技術綜述
2.1 Hadoop
2.1.1 MapReduce
2.1.2 Hive
2.1.3 Hbase
2.2 Spark
2.3 Couchbase
2.4 本章小結(jié)
3 需求分析
3.1 需求分析概述
3.2 功能性需求分析
3.2.1 用戶畫像功能
3.2.2 播單處理功能
3.2.3 推薦工程功能
3.2.4 前端接口功能
3.2.5 工程監(jiān)控功能
3.3 非功能性需求分析
3.4 本章小結(jié)
4 架構(gòu)設計
4.1 總體架構(gòu)設計
4.2 系統(tǒng)功能模塊設計
4.3 用戶日志
4.3.1 用戶播放日志
4.3.2 用戶行為日志
4.4 數(shù)據(jù)庫設計
4.4.1 用戶行為數(shù)據(jù)庫設計
4.4.2 用戶畫像數(shù)據(jù)庫設計
4.4.3 推薦播單數(shù)據(jù)庫設計
4.5 Spark數(shù)據(jù)傾斜調(diào)優(yōu)
4.6 本章小結(jié)
5 系統(tǒng)功能詳細設計與實現(xiàn)
5.1 開發(fā)平臺與運行環(huán)境
5.2 用戶畫像模塊
5.2.1 設計描述
5.2.2 特征向量權重算法設計
5.2.3 模塊流程圖與程序設計
5.3 播單處理模塊
5.3.1 設計描述
5.3.2 共現(xiàn)相似度和自動化播單設計
5.3.3 模塊流程圖與程序設計
5.4 推薦工程模塊
5.4.1 設計描述
5.4.2 基于加權SlopeOne算法的排序
5.4.3 基于ALS矩陣分解算法的排序
5.4.4 基于棧的多樣性過濾
5.4.5 模塊流程圖與程序設計
5.5 前端接口模塊
5.5.1 設計描述
5.5.2 前端接口模塊類設計
5.5.3 頁面結(jié)果展示
5.6 工程監(jiān)控模塊
5.6.1 設計描述
5.6.2 模塊流程圖
5.7 本章小結(jié)
6 系統(tǒng)功能測試與評估
6.1 測試環(huán)境
6.2 系統(tǒng)功能測試
6.3 系統(tǒng)評估
6.3.1 一級頁面效果評估
6.3.2 二級頁面效果評估
6.4 本章小結(jié)
7 結(jié)論與展望
7.1 項目結(jié)論
7.2 未來展望
參考文獻
作者簡歷
學位論文數(shù)據(jù)集
【參考文獻】:
期刊論文
[1]基于艾賓浩斯遺忘曲線的個性化推薦算法[J]. 周子愉. 電子制作. 2018(Z2)
[2]改進的TFIDF標簽提取算法[J]. 王杰,李旭健. 軟件工程. 2018(02)
[3]UGC網(wǎng)站用戶畫像研究[J]. 陳志明,胡震云. 計算機系統(tǒng)應用. 2017(01)
[4]用戶畫像在內(nèi)容推送中的研究與應用[J]. 吳明禮,楊雙亮. 電腦知識與技術. 2016(32)
[5]面向跨領域的推薦系統(tǒng)研究現(xiàn)狀與趨勢[J]. 歐輝思,曹健. 小型微型計算機系統(tǒng). 2016(07)
[6]大數(shù)據(jù)環(huán)境下的推薦系統(tǒng)[J]. 孟祥武,紀威宇,張玉潔. 北京郵電大學學報. 2015(02)
[7]大數(shù)據(jù)系統(tǒng)和分析技術綜述[J]. 程學旗,靳小龍,王元卓,郭嘉豐,張鐵贏,李國杰. 軟件學報. 2014(09)
[8]文本分類特征權重改進算法[J]. 臺德藝,王俊. 計算機工程. 2010(09)
碩士論文
[1]基于多推薦算法融合的視頻實時推薦系統(tǒng)的設計與實現(xiàn)[D]. 楊喬虎.東南大學 2017
[2]融合相似度和機器學習的加權Slope One算法研究[D]. 郇思思.燕山大學 2015
本文編號:3191403
【文章來源】:北京交通大學北京市 211工程院校 教育部直屬院校
【文章頁數(shù)】:90 頁
【學位級別】:碩士
【文章目錄】:
致謝
摘要
ABSTRACT
1 引言
1.1 論文背景
1.2 項目目標及意義
1.3 論文主要工作及組織結(jié)構(gòu)
2 相關技術綜述
2.1 Hadoop
2.1.1 MapReduce
2.1.2 Hive
2.1.3 Hbase
2.2 Spark
2.3 Couchbase
2.4 本章小結(jié)
3 需求分析
3.1 需求分析概述
3.2 功能性需求分析
3.2.1 用戶畫像功能
3.2.2 播單處理功能
3.2.3 推薦工程功能
3.2.4 前端接口功能
3.2.5 工程監(jiān)控功能
3.3 非功能性需求分析
3.4 本章小結(jié)
4 架構(gòu)設計
4.1 總體架構(gòu)設計
4.2 系統(tǒng)功能模塊設計
4.3 用戶日志
4.3.1 用戶播放日志
4.3.2 用戶行為日志
4.4 數(shù)據(jù)庫設計
4.4.1 用戶行為數(shù)據(jù)庫設計
4.4.2 用戶畫像數(shù)據(jù)庫設計
4.4.3 推薦播單數(shù)據(jù)庫設計
4.5 Spark數(shù)據(jù)傾斜調(diào)優(yōu)
4.6 本章小結(jié)
5 系統(tǒng)功能詳細設計與實現(xiàn)
5.1 開發(fā)平臺與運行環(huán)境
5.2 用戶畫像模塊
5.2.1 設計描述
5.2.2 特征向量權重算法設計
5.2.3 模塊流程圖與程序設計
5.3 播單處理模塊
5.3.1 設計描述
5.3.2 共現(xiàn)相似度和自動化播單設計
5.3.3 模塊流程圖與程序設計
5.4 推薦工程模塊
5.4.1 設計描述
5.4.2 基于加權SlopeOne算法的排序
5.4.3 基于ALS矩陣分解算法的排序
5.4.4 基于棧的多樣性過濾
5.4.5 模塊流程圖與程序設計
5.5 前端接口模塊
5.5.1 設計描述
5.5.2 前端接口模塊類設計
5.5.3 頁面結(jié)果展示
5.6 工程監(jiān)控模塊
5.6.1 設計描述
5.6.2 模塊流程圖
5.7 本章小結(jié)
6 系統(tǒng)功能測試與評估
6.1 測試環(huán)境
6.2 系統(tǒng)功能測試
6.3 系統(tǒng)評估
6.3.1 一級頁面效果評估
6.3.2 二級頁面效果評估
6.4 本章小結(jié)
7 結(jié)論與展望
7.1 項目結(jié)論
7.2 未來展望
參考文獻
作者簡歷
學位論文數(shù)據(jù)集
【參考文獻】:
期刊論文
[1]基于艾賓浩斯遺忘曲線的個性化推薦算法[J]. 周子愉. 電子制作. 2018(Z2)
[2]改進的TFIDF標簽提取算法[J]. 王杰,李旭健. 軟件工程. 2018(02)
[3]UGC網(wǎng)站用戶畫像研究[J]. 陳志明,胡震云. 計算機系統(tǒng)應用. 2017(01)
[4]用戶畫像在內(nèi)容推送中的研究與應用[J]. 吳明禮,楊雙亮. 電腦知識與技術. 2016(32)
[5]面向跨領域的推薦系統(tǒng)研究現(xiàn)狀與趨勢[J]. 歐輝思,曹健. 小型微型計算機系統(tǒng). 2016(07)
[6]大數(shù)據(jù)環(huán)境下的推薦系統(tǒng)[J]. 孟祥武,紀威宇,張玉潔. 北京郵電大學學報. 2015(02)
[7]大數(shù)據(jù)系統(tǒng)和分析技術綜述[J]. 程學旗,靳小龍,王元卓,郭嘉豐,張鐵贏,李國杰. 軟件學報. 2014(09)
[8]文本分類特征權重改進算法[J]. 臺德藝,王俊. 計算機工程. 2010(09)
碩士論文
[1]基于多推薦算法融合的視頻實時推薦系統(tǒng)的設計與實現(xiàn)[D]. 楊喬虎.東南大學 2017
[2]融合相似度和機器學習的加權Slope One算法研究[D]. 郇思思.燕山大學 2015
本文編號:3191403
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/3191403.html
最近更新
教材專著