基于排名多臂賭博機(jī)的推薦算法研究
發(fā)布時間:2021-09-09 16:18
隨著互聯(lián)網(wǎng)技術(shù)的高速發(fā)展,網(wǎng)絡(luò)上的信息資源紛繁復(fù)雜并呈現(xiàn)爆炸式增長的趨勢。推薦系統(tǒng)(Recommendation System,RS)由于具有信息過濾的特點,得到了各領(lǐng)域?qū)W者的不斷研究。傳統(tǒng)的推薦算法對用戶偏好的挖掘主要通過分析用戶的歷史性,在項目候選池與用戶池相對靜止的場景下能夠取得優(yōu)秀的效果。目前,大量的推薦行為都是通過實時在線的方式完成的,這就要求推薦系統(tǒng)能夠及時對用戶反饋進(jìn)行響應(yīng),并在一段時間做出連續(xù)推薦。傳統(tǒng)推薦算法對這種在線環(huán)境的動態(tài)性難以適應(yīng),從而導(dǎo)致了“探索-利用”問題。多臂賭博機(jī)(Muit-Arm Bandit,MAB)能夠動態(tài)處理數(shù)據(jù),使用連續(xù)的反饋信息不斷更新策略,很好地處理“探索-利用”的平衡問題。因此,本文將推薦問題建模為MAB問題,賭博機(jī)中的臂對應(yīng)于要推薦的項目,獎勵對應(yīng)于用戶是否點擊了推薦的項目。雖然MAB具有優(yōu)秀的理論支持和應(yīng)用效果,但現(xiàn)存基于MAB的推薦算法仍具有一定的局限性。其一,每次推薦時僅推薦一個項目,這不符合日常生活中的推薦形式。第二,推薦的項目僅考慮其準(zhǔn)確性,忽略了其他評測指標(biāo)。本文為解決現(xiàn)存基于MAB推薦算法的這兩個局限性,提出了基于排名多...
【文章來源】:南寧師范大學(xué)廣西壯族自治區(qū)
【文章頁數(shù)】:59 頁
【學(xué)位級別】:碩士
【部分圖文】:
“在線學(xué)習(xí)”過程示意圖
?傳統(tǒng)的推薦算法主要可以分為基于內(nèi)容的推薦(CB)協(xié)同過濾推薦算(CF),混合推薦??三大類K4K25K26:M。具體分類如圖2-2所示。其中協(xié)同過濾是最受歡迎的推薦算法。由于傳??統(tǒng)的算法不是本文主要研究內(nèi)容,僅作為知識儲備,因此在本小節(jié)僅作簡要介紹。???■??推薦算法?? ̄1 ̄r—?—=7'?'r—1 ̄??基于內(nèi)容的?|??協(xié)同過濾混合推薦??推薦??????I?????1?1???基于近鄰的協(xié)同過濾?基于算法的協(xié)同過濾??I???1?????I?1??I?I?I?I??基于用戶的協(xié)同[基于項目的協(xié)同過1?|?■土?[貝葉斯網(wǎng)絡(luò)1?[??隱IS?乂具達(dá)?固具;云?胃^????圖2-2推薦算法分類簡圖??CB是最早被使用的推薦算法,其原理也非常簡單,通過對樣本集的學(xué)習(xí),獲取項目的??描述(知識)后,根據(jù)用戶歷史喜歡的項目,將項目相似度高的項目推薦給用戶。以新聞??推薦為例,系統(tǒng)會為曾經(jīng)喜歡看科技新聞的用戶科技新聞。由于算法不需要獲取大量評分??數(shù)據(jù),只要對項目提取特征就可進(jìn)行推薦,因此,既不存在數(shù)據(jù)稀疏問題,也不存在冷啟??動問題。但算法依據(jù)歷史偏好對用戶進(jìn)行推薦,這就導(dǎo)致了推薦結(jié)果與用戶歷史喜歡的項??目的相似性過高
2.?2.1?多臂賭博機(jī)原理??多臂賭博機(jī)(Multi-armed?bandit,?MAB)的名字來源于對老虎機(jī)的戲稱t3QK31],示意??圖如圖2-3所示。老虎機(jī)(每臺老虎機(jī)僅有一個臂),是需要玩家進(jìn)行搖臂的一種賭博機(jī)??器,玩家搖臂后根據(jù)機(jī)器展示的數(shù)值,玩家可能會得到一筆獎勵,但是老虎機(jī)的設(shè)計都是??.?對莊家更有利,因此玩家能獲得獎勵的幾率很小。多臂賭博機(jī)從理論上擴(kuò)展了這種形式,??認(rèn)為一個老虎機(jī)中有多個臂,且每個臂都按照一個獨(dú)立的概率進(jìn)行獎勵,作為一個玩家,??并不知道機(jī)器每個臂的回報概率,唯一可以找到回報概率的方法是進(jìn)行游戲。玩家最終的??任務(wù)是在規(guī)定的次數(shù)內(nèi),通過玩這些機(jī)器,獲得最高的獎勵或者最小化遺憾。??搖臂??f&W???/???k??圖2_3?MAB不竟圖??將推薦問題建模為多臂賭博機(jī)問題,每個手臂表示要推薦給用戶的項目,獎勵對應(yīng)于??用戶是否點擊了推薦的項目。假設(shè)有一個擁有M個獨(dú)立臂的MAB,在每個時間t,搖下一個??臂j并接收從[0
【參考文獻(xiàn)】:
期刊論文
[1]融合協(xié)同過濾與上下文信息的Bandits推薦算法[J]. 王宇琛,王寶亮,侯永宏. 計算機(jī)科學(xué)與探索. 2019(03)
[2]基于深度學(xué)習(xí)的推薦系統(tǒng)研究綜述[J]. 黃立威,江碧濤,呂守業(yè),劉艷博,李德毅. 計算機(jī)學(xué)報. 2018(07)
[3]融合矩陣分解的多臂賭博機(jī)推薦算法[J]. 成石,王寶亮,毛陸虹,常鵬. 小型微型計算機(jī)系統(tǒng). 2017(12)
[4]在線學(xué)習(xí)方法綜述:湯普森抽樣和其他方法[J]. 何斯邁,金羽佳,王華,葛冬冬. 運(yùn)籌學(xué)學(xué)報. 2017(04)
[5]消費(fèi)者視角下的推薦系統(tǒng)研究[J]. 楊一翁,王毅,孫國輝. 企業(yè)經(jīng)濟(jì). 2016(09)
[6]網(wǎng)絡(luò)推薦系統(tǒng)對消費(fèi)者的營銷效果——技術(shù)接受模型視角[J]. 楊一翁,王毅,孫國輝. 中國流通經(jīng)濟(jì). 2016(02)
[7]一種結(jié)合推薦對象間關(guān)聯(lián)關(guān)系的社會化推薦算法[J]. 郭磊,馬軍,陳竹敏,姜浩然. 計算機(jī)學(xué)報. 2014(01)
[8]融合鄰域模型與隱語義模型的推薦算法[J]. 魯權(quán),王如龍,張錦,丁怡. 計算機(jī)工程與應(yīng)用. 2013(19)
[9]推薦系統(tǒng)評價指標(biāo)綜述[J]. 朱郁筱,呂琳媛. 電子科技大學(xué)學(xué)報. 2012(02)
[10]參與的樂趣——一個有中介的調(diào)節(jié)模型[J]. 樓尊. 管理科學(xué). 2010(02)
博士論文
[1]基于協(xié)同過濾的推薦算法研究[D]. 劉青文.中國科學(xué)技術(shù)大學(xué) 2013
本文編號:3392402
【文章來源】:南寧師范大學(xué)廣西壯族自治區(qū)
【文章頁數(shù)】:59 頁
【學(xué)位級別】:碩士
【部分圖文】:
“在線學(xué)習(xí)”過程示意圖
?傳統(tǒng)的推薦算法主要可以分為基于內(nèi)容的推薦(CB)協(xié)同過濾推薦算(CF),混合推薦??三大類K4K25K26:M。具體分類如圖2-2所示。其中協(xié)同過濾是最受歡迎的推薦算法。由于傳??統(tǒng)的算法不是本文主要研究內(nèi)容,僅作為知識儲備,因此在本小節(jié)僅作簡要介紹。???■??推薦算法?? ̄1 ̄r—?—=7'?'r—1 ̄??基于內(nèi)容的?|??協(xié)同過濾混合推薦??推薦??????I?????1?1???基于近鄰的協(xié)同過濾?基于算法的協(xié)同過濾??I???1?????I?1??I?I?I?I??基于用戶的協(xié)同[基于項目的協(xié)同過1?|?■土?[貝葉斯網(wǎng)絡(luò)1?[??隱IS?乂具達(dá)?固具;云?胃^????圖2-2推薦算法分類簡圖??CB是最早被使用的推薦算法,其原理也非常簡單,通過對樣本集的學(xué)習(xí),獲取項目的??描述(知識)后,根據(jù)用戶歷史喜歡的項目,將項目相似度高的項目推薦給用戶。以新聞??推薦為例,系統(tǒng)會為曾經(jīng)喜歡看科技新聞的用戶科技新聞。由于算法不需要獲取大量評分??數(shù)據(jù),只要對項目提取特征就可進(jìn)行推薦,因此,既不存在數(shù)據(jù)稀疏問題,也不存在冷啟??動問題。但算法依據(jù)歷史偏好對用戶進(jìn)行推薦,這就導(dǎo)致了推薦結(jié)果與用戶歷史喜歡的項??目的相似性過高
2.?2.1?多臂賭博機(jī)原理??多臂賭博機(jī)(Multi-armed?bandit,?MAB)的名字來源于對老虎機(jī)的戲稱t3QK31],示意??圖如圖2-3所示。老虎機(jī)(每臺老虎機(jī)僅有一個臂),是需要玩家進(jìn)行搖臂的一種賭博機(jī)??器,玩家搖臂后根據(jù)機(jī)器展示的數(shù)值,玩家可能會得到一筆獎勵,但是老虎機(jī)的設(shè)計都是??.?對莊家更有利,因此玩家能獲得獎勵的幾率很小。多臂賭博機(jī)從理論上擴(kuò)展了這種形式,??認(rèn)為一個老虎機(jī)中有多個臂,且每個臂都按照一個獨(dú)立的概率進(jìn)行獎勵,作為一個玩家,??并不知道機(jī)器每個臂的回報概率,唯一可以找到回報概率的方法是進(jìn)行游戲。玩家最終的??任務(wù)是在規(guī)定的次數(shù)內(nèi),通過玩這些機(jī)器,獲得最高的獎勵或者最小化遺憾。??搖臂??f&W???/???k??圖2_3?MAB不竟圖??將推薦問題建模為多臂賭博機(jī)問題,每個手臂表示要推薦給用戶的項目,獎勵對應(yīng)于??用戶是否點擊了推薦的項目。假設(shè)有一個擁有M個獨(dú)立臂的MAB,在每個時間t,搖下一個??臂j并接收從[0
【參考文獻(xiàn)】:
期刊論文
[1]融合協(xié)同過濾與上下文信息的Bandits推薦算法[J]. 王宇琛,王寶亮,侯永宏. 計算機(jī)科學(xué)與探索. 2019(03)
[2]基于深度學(xué)習(xí)的推薦系統(tǒng)研究綜述[J]. 黃立威,江碧濤,呂守業(yè),劉艷博,李德毅. 計算機(jī)學(xué)報. 2018(07)
[3]融合矩陣分解的多臂賭博機(jī)推薦算法[J]. 成石,王寶亮,毛陸虹,常鵬. 小型微型計算機(jī)系統(tǒng). 2017(12)
[4]在線學(xué)習(xí)方法綜述:湯普森抽樣和其他方法[J]. 何斯邁,金羽佳,王華,葛冬冬. 運(yùn)籌學(xué)學(xué)報. 2017(04)
[5]消費(fèi)者視角下的推薦系統(tǒng)研究[J]. 楊一翁,王毅,孫國輝. 企業(yè)經(jīng)濟(jì). 2016(09)
[6]網(wǎng)絡(luò)推薦系統(tǒng)對消費(fèi)者的營銷效果——技術(shù)接受模型視角[J]. 楊一翁,王毅,孫國輝. 中國流通經(jīng)濟(jì). 2016(02)
[7]一種結(jié)合推薦對象間關(guān)聯(lián)關(guān)系的社會化推薦算法[J]. 郭磊,馬軍,陳竹敏,姜浩然. 計算機(jī)學(xué)報. 2014(01)
[8]融合鄰域模型與隱語義模型的推薦算法[J]. 魯權(quán),王如龍,張錦,丁怡. 計算機(jī)工程與應(yīng)用. 2013(19)
[9]推薦系統(tǒng)評價指標(biāo)綜述[J]. 朱郁筱,呂琳媛. 電子科技大學(xué)學(xué)報. 2012(02)
[10]參與的樂趣——一個有中介的調(diào)節(jié)模型[J]. 樓尊. 管理科學(xué). 2010(02)
博士論文
[1]基于協(xié)同過濾的推薦算法研究[D]. 劉青文.中國科學(xué)技術(shù)大學(xué) 2013
本文編號:3392402
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3392402.html
最近更新
教材專著