基于深度隱特征分析的推薦算法研究
發(fā)布時間:2021-11-17 08:41
隨著互聯(lián)網(wǎng)行業(yè)的飛速發(fā)展,互聯(lián)網(wǎng)上的信息量呈指數(shù)型增長。在紛繁復雜的互聯(lián)網(wǎng)信息中,如何篩選出用戶想要的信息成為推薦系統(tǒng)的主要任務。推薦系統(tǒng)通過有效分析用戶的歷史行為數(shù)據(jù),達到預測用戶下一步行為的目的,成為目前解決信息過載的主要手段之一。然而,傳統(tǒng)的基于協(xié)同過濾的推薦算法對用戶-物品評分數(shù)據(jù)進行建模分析時,一般采用線性模型,導致推薦算法的精度提升有限。深度學習技術憑著強大的表征能力在圖像識別、自然語言處理方面取得了巨大的成功,基于深度學習的推薦算法近年被廣泛研究。本文針對傳統(tǒng)協(xié)同過濾算法的數(shù)據(jù)表征能力弱等問題,通過結合深度學習的相關理論和方法,對基于深度隱特征分析的推薦算法進行了研究,從而達到提升推薦算法精準率的目的。具體工作如下:(1)對深度學習和推薦算法的研究現(xiàn)狀進行了廣泛的調(diào)研,發(fā)現(xiàn)基于深度學習的推薦算法在處理多源數(shù)據(jù)、數(shù)據(jù)表征方面具有優(yōu)勢。在實際的推薦系統(tǒng)中,用戶和物品的信息數(shù)據(jù)是多種多樣的,例如物品的圖片信息;谏疃葘W習的推薦算法針對這些數(shù)據(jù)可以使用多種網(wǎng)絡模型進行處理,相較于傳統(tǒng)的協(xié)同過濾算法而言,能夠提取出更具代表性的特征。除此之外,基于深度學習的推薦算法能夠?qū)τ脩艉臀锲?..
【文章來源】:中國科學院大學(中國科學院重慶綠色智能技術研究院)重慶市
【文章頁數(shù)】:80 頁
【學位級別】:碩士
【部分圖文】:
圖2.1使用矩陣分解進行評分預測??
?基于深度隱特征分析的推薦算法研宄???0?1?0?0?...?0?0?0?1?0?...?0??I?*?*?I??r ̄??,??,??1?,?n??—?i??i?^?i??Predicted??rating??圖2.2?MLP模型??多層感知機模型擁有眾多衍生模型,目前在圖像處理上最為流行的卷積神??經(jīng)網(wǎng)絡(Convolutional?Neural?Networks,CNN),在自然語言處理上最為常用的??循環(huán)神經(jīng)網(wǎng)絡(Recurrent?Neural?Networks,RNN)等等。??自編碼器被證明能夠在推薦系統(tǒng)中學習到有效的特征表示,使得推薦精度??明顯提高[57],是推薦系統(tǒng)中最為常用的網(wǎng)絡模型之-。自編碼器??(Autoencoders,AE)是深度學習中一種對輸入數(shù)據(jù)的大量特征進行壓縮的方??法,屬于無監(jiān)督學習方法[68]。自編碼器首先也是一種神經(jīng)網(wǎng)絡模型,有輸入??層、隱含層、輸出層,其中輸入層和輸出層是相同的,中間層作為輸入數(shù)據(jù)的??低維特征表示,如圖2.3所示。將自編碼器作為一種模型應用于推薦算法中,??是目前相關論文中常見的方法。自編碼器的結構可以描述如下:??輸入層^中間隱含層:可視為編碼的過程,通過對輸入數(shù)據(jù)進行壓縮,??類似于PCA,提取主要的隱特征,同時需要非線性的激活函數(shù),進行特征的非??線性表達;??中間隱含層=>?輸出層,可視為解碼的過程,主要是將隱特征還原為輸入??數(shù)據(jù),也需要非線性激活函數(shù)對數(shù)據(jù)進行特征變換,是還原度盡可能高,整個??過程也可稱之為某種意義上的重構(reconstruction)。??16??
?第2章相關理論和技術???編碼?解碼??_??輸入)2?隱含W?輸出.丨3??圖2.3自編碼器模型??自編碼器擁有多種衍生模型,擁有不同的特點,適用于不同的特征提取場??景,主要分別有以下幾類:正則自編碼器(Regularized?Autoencoders)、稀疏自??編碼器(SparsityAutoencoders),去噪閂編碼器(DenoisingAutoencoders,DAE)??(2008),桟式去噪自編碼器(Stacked?DenoisingAutoencoders,SDAE)?(2010)、??收縮自編碼器(Contractive?Autoencoders,CAE?)(?2011?),變分自編碼器??(Variational?Autoencoders,VAE?)?(2013),以及衍生的邊緣去噪自編碼器??(Marginalize?Denoise?Autoencoders)?[44]。其中,用于推薦系統(tǒng)的模型有??SDAE[17,36]、VAE[26]、DAE[31]、CAE[33]和?MDAE[49]。??2.4深度隱特征的優(yōu)化方法??深度隱特征,指的是M過深度神經(jīng)網(wǎng)絡分別提取出的用戶隱特征和物品隱??特征,用于提升推薦模型的預測精度。然而,在深層祌經(jīng)網(wǎng)絡模型的訓練過程??中,存在著“梯度消失'?的問題[66],導致網(wǎng)絡難以學習到數(shù)據(jù)中的隱特征..除此??之外,本就計算復雜的神經(jīng)網(wǎng)絡,隨著神經(jīng)網(wǎng)絡的加深,其參數(shù)量陡增,計算??量也變得更大。然而深層祌經(jīng)網(wǎng)絡被提出的當吋,計算機硬件資源丨斑乏、〖丨?算??成本較高,導致當時的深層神經(jīng)網(wǎng)絡很難被學術界和工業(yè)界所接受。??如今,隨著計算機硬件的
【參考文獻】:
期刊論文
[1]基于深度學習的推薦系統(tǒng)研究綜述[J]. 黃立威,江碧濤,呂守業(yè),劉艷博,李德毅. 計算機學報. 2018(07)
[2]個性化推薦系統(tǒng)的研究進展[J]. 劉建國,周濤,汪秉宏. 自然科學進展. 2009(01)
本文編號:3500555
【文章來源】:中國科學院大學(中國科學院重慶綠色智能技術研究院)重慶市
【文章頁數(shù)】:80 頁
【學位級別】:碩士
【部分圖文】:
圖2.1使用矩陣分解進行評分預測??
?基于深度隱特征分析的推薦算法研宄???0?1?0?0?...?0?0?0?1?0?...?0??I?*?*?I??r ̄??,??,??1?,?n??—?i??i?^?i??Predicted??rating??圖2.2?MLP模型??多層感知機模型擁有眾多衍生模型,目前在圖像處理上最為流行的卷積神??經(jīng)網(wǎng)絡(Convolutional?Neural?Networks,CNN),在自然語言處理上最為常用的??循環(huán)神經(jīng)網(wǎng)絡(Recurrent?Neural?Networks,RNN)等等。??自編碼器被證明能夠在推薦系統(tǒng)中學習到有效的特征表示,使得推薦精度??明顯提高[57],是推薦系統(tǒng)中最為常用的網(wǎng)絡模型之-。自編碼器??(Autoencoders,AE)是深度學習中一種對輸入數(shù)據(jù)的大量特征進行壓縮的方??法,屬于無監(jiān)督學習方法[68]。自編碼器首先也是一種神經(jīng)網(wǎng)絡模型,有輸入??層、隱含層、輸出層,其中輸入層和輸出層是相同的,中間層作為輸入數(shù)據(jù)的??低維特征表示,如圖2.3所示。將自編碼器作為一種模型應用于推薦算法中,??是目前相關論文中常見的方法。自編碼器的結構可以描述如下:??輸入層^中間隱含層:可視為編碼的過程,通過對輸入數(shù)據(jù)進行壓縮,??類似于PCA,提取主要的隱特征,同時需要非線性的激活函數(shù),進行特征的非??線性表達;??中間隱含層=>?輸出層,可視為解碼的過程,主要是將隱特征還原為輸入??數(shù)據(jù),也需要非線性激活函數(shù)對數(shù)據(jù)進行特征變換,是還原度盡可能高,整個??過程也可稱之為某種意義上的重構(reconstruction)。??16??
?第2章相關理論和技術???編碼?解碼??_??輸入)2?隱含W?輸出.丨3??圖2.3自編碼器模型??自編碼器擁有多種衍生模型,擁有不同的特點,適用于不同的特征提取場??景,主要分別有以下幾類:正則自編碼器(Regularized?Autoencoders)、稀疏自??編碼器(SparsityAutoencoders),去噪閂編碼器(DenoisingAutoencoders,DAE)??(2008),桟式去噪自編碼器(Stacked?DenoisingAutoencoders,SDAE)?(2010)、??收縮自編碼器(Contractive?Autoencoders,CAE?)(?2011?),變分自編碼器??(Variational?Autoencoders,VAE?)?(2013),以及衍生的邊緣去噪自編碼器??(Marginalize?Denoise?Autoencoders)?[44]。其中,用于推薦系統(tǒng)的模型有??SDAE[17,36]、VAE[26]、DAE[31]、CAE[33]和?MDAE[49]。??2.4深度隱特征的優(yōu)化方法??深度隱特征,指的是M過深度神經(jīng)網(wǎng)絡分別提取出的用戶隱特征和物品隱??特征,用于提升推薦模型的預測精度。然而,在深層祌經(jīng)網(wǎng)絡模型的訓練過程??中,存在著“梯度消失'?的問題[66],導致網(wǎng)絡難以學習到數(shù)據(jù)中的隱特征..除此??之外,本就計算復雜的神經(jīng)網(wǎng)絡,隨著神經(jīng)網(wǎng)絡的加深,其參數(shù)量陡增,計算??量也變得更大。然而深層祌經(jīng)網(wǎng)絡被提出的當吋,計算機硬件資源丨斑乏、〖丨?算??成本較高,導致當時的深層神經(jīng)網(wǎng)絡很難被學術界和工業(yè)界所接受。??如今,隨著計算機硬件的
【參考文獻】:
期刊論文
[1]基于深度學習的推薦系統(tǒng)研究綜述[J]. 黃立威,江碧濤,呂守業(yè),劉艷博,李德毅. 計算機學報. 2018(07)
[2]個性化推薦系統(tǒng)的研究進展[J]. 劉建國,周濤,汪秉宏. 自然科學進展. 2009(01)
本文編號:3500555
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/3500555.html
最近更新
教材專著