結(jié)合雙重心理動(dòng)機(jī)建模和強(qiáng)化學(xué)習(xí)的個(gè)性化推薦
發(fā)布時(shí)間:2022-09-29 20:44
個(gè)性化推薦系統(tǒng)能夠提供給用戶個(gè)性化對(duì)象或服務(wù),在減輕信息過(guò)載問(wèn)題方面發(fā)揮著至關(guān)重要的作用。然而,一個(gè)好的推薦系統(tǒng)不僅僅是推薦給用戶符合其心意的對(duì)象,還要能夠挖掘用戶的興趣,因此了解真實(shí)場(chǎng)景下影響用戶選擇的真實(shí)原因是非常必要的。在真實(shí)場(chǎng)景下,影響用戶選擇的真實(shí)原因是用戶的心理動(dòng)機(jī),根據(jù)心理學(xué)中對(duì)動(dòng)機(jī)的闡述,其主要包括內(nèi)在動(dòng)機(jī)和外在動(dòng)機(jī)兩部分。其中,內(nèi)在動(dòng)機(jī)是指建立在個(gè)體內(nèi)在想法的基礎(chǔ)上的,外在動(dòng)機(jī)是來(lái)自于個(gè)體外在的影響。然而,在當(dāng)前推薦模型中,用戶的歷史選擇信息和用戶與對(duì)象的輔助信息相結(jié)合的合理性及優(yōu)勢(shì)來(lái)源于對(duì)內(nèi)在動(dòng)機(jī)的間接刻畫(huà)。而當(dāng)前方法上缺乏對(duì)外在動(dòng)機(jī)的刻畫(huà),以及對(duì)兩種動(dòng)機(jī)的聯(lián)合建模。為了實(shí)現(xiàn)對(duì)雙重動(dòng)機(jī)的聯(lián)合建模,我們選用了深度學(xué)習(xí)與強(qiáng)化學(xué)習(xí)結(jié)合的方式。首先我們使用深度學(xué)習(xí)模型即堆疊多層降噪編碼機(jī)Stacked Denoising Auto-Encoder(SDAE)模型來(lái)利用用戶的歷史選擇信息和用戶與對(duì)象的輔助信息同時(shí)建模用戶和對(duì)象并得到初步的用戶和對(duì)象的潛在特征表示,并利用了貝葉斯概率矩陣分解(BPMF)對(duì)用戶與對(duì)象的潛在特征表示進(jìn)行了優(yōu)化。在用戶和對(duì)象的潛在特征表示的基礎(chǔ)上,我...
【文章頁(yè)數(shù)】:51 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 研究背景及研究意義
1.1.1 研究背景
1.1.2 研究意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 對(duì)象的向量化表示
1.2.2 貝葉斯概率矩陣分解及其在推薦系統(tǒng)中的應(yīng)用
1.2.3 強(qiáng)化學(xué)習(xí)及其在推薦系統(tǒng)中的應(yīng)用
1.3 本文的問(wèn)題定義及研究思路
1.3.1 問(wèn)題定義
1.3.2 研究思路與貢獻(xiàn)
1.4 本文組織結(jié)構(gòu)
第2章 基于多源信息的用戶與對(duì)象的向量化表示
2.1 結(jié)合輔助信息與歷史選擇信息的推薦系統(tǒng)輸入
2.2 基于多源信息與SDAE的向量化表示
2.3 基于BPMF模型的模型構(gòu)建及優(yōu)化
2.4 本章小結(jié)
第3章 結(jié)合雙重心理動(dòng)機(jī)和強(qiáng)化學(xué)習(xí)的個(gè)性化推薦
3.1 選擇行為的內(nèi)在與外在心理動(dòng)機(jī)
3.2 基于強(qiáng)化學(xué)習(xí)的雙重心理動(dòng)機(jī)建模
3.2.1 Q-learning(Off-policy)模型
3.2.2 基于內(nèi)在與外在動(dòng)機(jī)的表示模型構(gòu)建及個(gè)性化推薦
3.3 本章小結(jié)
第4章 實(shí)驗(yàn)與分析
4.1 實(shí)驗(yàn)數(shù)據(jù)介紹
4.2 評(píng)價(jià)指標(biāo)的介紹
4.2.1 RMSE評(píng)價(jià)指標(biāo)的介紹
4.2.2 Recall@K評(píng)價(jià)指標(biāo)的介紹
4.3 實(shí)驗(yàn)參數(shù)設(shè)置及訓(xùn)練細(xì)節(jié)
4.4 實(shí)驗(yàn)?zāi)P蛯?duì)比、結(jié)果與分析
4.4.1 Baseline模型
4.4.2 實(shí)驗(yàn)結(jié)果與RMSE評(píng)價(jià)指標(biāo)分析
4.4.3 實(shí)驗(yàn)結(jié)果與Recall@K評(píng)價(jià)指標(biāo)分析
4.5 本章小結(jié)
第5章 總結(jié)和展望
參考文獻(xiàn)
發(fā)表論文和參加科研情況說(shuō)明
致謝
本文編號(hào):3683278
【文章頁(yè)數(shù)】:51 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 研究背景及研究意義
1.1.1 研究背景
1.1.2 研究意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 對(duì)象的向量化表示
1.2.2 貝葉斯概率矩陣分解及其在推薦系統(tǒng)中的應(yīng)用
1.2.3 強(qiáng)化學(xué)習(xí)及其在推薦系統(tǒng)中的應(yīng)用
1.3 本文的問(wèn)題定義及研究思路
1.3.1 問(wèn)題定義
1.3.2 研究思路與貢獻(xiàn)
1.4 本文組織結(jié)構(gòu)
第2章 基于多源信息的用戶與對(duì)象的向量化表示
2.1 結(jié)合輔助信息與歷史選擇信息的推薦系統(tǒng)輸入
2.2 基于多源信息與SDAE的向量化表示
2.3 基于BPMF模型的模型構(gòu)建及優(yōu)化
2.4 本章小結(jié)
第3章 結(jié)合雙重心理動(dòng)機(jī)和強(qiáng)化學(xué)習(xí)的個(gè)性化推薦
3.1 選擇行為的內(nèi)在與外在心理動(dòng)機(jī)
3.2 基于強(qiáng)化學(xué)習(xí)的雙重心理動(dòng)機(jī)建模
3.2.1 Q-learning(Off-policy)模型
3.2.2 基于內(nèi)在與外在動(dòng)機(jī)的表示模型構(gòu)建及個(gè)性化推薦
3.3 本章小結(jié)
第4章 實(shí)驗(yàn)與分析
4.1 實(shí)驗(yàn)數(shù)據(jù)介紹
4.2 評(píng)價(jià)指標(biāo)的介紹
4.2.1 RMSE評(píng)價(jià)指標(biāo)的介紹
4.2.2 Recall@K評(píng)價(jià)指標(biāo)的介紹
4.3 實(shí)驗(yàn)參數(shù)設(shè)置及訓(xùn)練細(xì)節(jié)
4.4 實(shí)驗(yàn)?zāi)P蛯?duì)比、結(jié)果與分析
4.4.1 Baseline模型
4.4.2 實(shí)驗(yàn)結(jié)果與RMSE評(píng)價(jià)指標(biāo)分析
4.4.3 實(shí)驗(yàn)結(jié)果與Recall@K評(píng)價(jià)指標(biāo)分析
4.5 本章小結(jié)
第5章 總結(jié)和展望
參考文獻(xiàn)
發(fā)表論文和參加科研情況說(shuō)明
致謝
本文編號(hào):3683278
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/3683278.html
最近更新
教材專著