分布式環(huán)境中一種帶有隱私保護(hù)的矩陣分解推薦方法
發(fā)布時(shí)間:2021-01-27 01:18
互聯(lián)網(wǎng)的出現(xiàn)和普及給用戶帶來(lái)便利的同時(shí)產(chǎn)生了大量的信息。為了幫助人們做出提供選擇快速?zèng)Q策,推薦系統(tǒng)需要收集用戶的歷史數(shù)據(jù)進(jìn)行建模分析,來(lái)實(shí)現(xiàn)推薦服務(wù)。矩陣分解推薦算法是協(xié)同過濾中最受歡迎的算法之一,有較高的推薦精確度。傳統(tǒng)的矩陣分解方法主要應(yīng)用于集中式環(huán)境中,用戶需要把各自的歷史數(shù)據(jù)提供給服務(wù)器,對(duì)于不受信任的推薦服務(wù)器,存在隱私泄露的風(fēng)險(xiǎn)。隨著個(gè)人信息泄露的情況在不斷的出現(xiàn),人們?cè)絹?lái)越重視隱私保護(hù)問題,更多的數(shù)據(jù)擁有者不愿意提供自身的數(shù)據(jù),因此,應(yīng)用于分布式推薦系統(tǒng)中的矩陣分解算法應(yīng)運(yùn)而生。為了解決分布式推薦系統(tǒng)中的隱私問題,現(xiàn)有的做法主要分為兩種,一種是基于數(shù)據(jù)擾動(dòng)的方式來(lái)保護(hù)數(shù)據(jù)的安全,通過差分隱私加噪的方法,或采用隨機(jī)擾動(dòng),將梯度數(shù)據(jù)加噪擾動(dòng)后再發(fā)送到服務(wù)器聚合通常因?yàn)楸Wo(hù)數(shù)據(jù)的隱私性而犧牲了部分的數(shù)據(jù)效用性,因此導(dǎo)致推薦效果的下降。另一種則采用加密的方法來(lái)保證數(shù)據(jù)的無(wú)損失計(jì)算,利用同態(tài)性質(zhì)進(jìn)行加密計(jì)算保證模型訓(xùn)練過程中數(shù)據(jù)安全性的同時(shí)不降低推薦的精度。但是采用同態(tài)加密等算法,伴隨大量的加密解密過程,因而降低了整個(gè)推薦算法的時(shí)間效率;诂F(xiàn)有的工作,主要關(guān)注分布式推薦下的矩陣分...
【文章來(lái)源】:廣西師范大學(xué)廣西壯族自治區(qū)
【文章頁(yè)數(shù)】:58 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
中國(guó)網(wǎng)民規(guī)模和互聯(lián)網(wǎng)普率
廣西師范大學(xué)碩士研究生學(xué)位論文7第2章推薦系統(tǒng)、隱私保護(hù)方法概述2.1推薦系統(tǒng)的概述及主要方法推薦系統(tǒng)的早期研究源于信息檢索和過濾,可以把推薦系統(tǒng)理解為一個(gè)智能系統(tǒng),能夠根據(jù)用戶的興趣偏好篩選用戶感興趣的服務(wù)或物品。開發(fā)推薦系統(tǒng)的目的是通過從大量異構(gòu)復(fù)雜數(shù)據(jù)中檢索出最相關(guān)的信息來(lái)減少信息過載,從而提供個(gè)性化服務(wù)。目前的推薦系統(tǒng)可主要分為基于協(xié)同過濾與基于內(nèi)容的推薦算法,還有混合推薦算法。定義2.1(推薦系統(tǒng)[34]):設(shè)C表示為用戶集合,S可以是所有可能的推薦項(xiàng)目集合,u是一個(gè)效用函數(shù),用于衡量項(xiàng)目(s∈S)對(duì)用戶(c∈C)的有效性,即U:C×S→R,其中R是一個(gè)完全有序的集合。用戶和項(xiàng)目集合都可能非常大,對(duì)于每個(gè)用戶c∈C,我們要選擇這樣的項(xiàng)目s"∈S最大限度地提高效用函數(shù)u,即:c),(maxargS"scuCSsc,(2.1)在推薦系統(tǒng)應(yīng)用程序中,通常有兩類實(shí)體,一般分為為用戶和項(xiàng)目(如電影,商品,音樂,書籍等)兩類,項(xiàng)目的效用通常是以評(píng)分表示,表示一個(gè)用戶是否喜歡這個(gè)項(xiàng)目的。如評(píng)分等級(jí)為1到5,則電影被用戶評(píng)為5表示用戶高度喜歡它,而1評(píng)級(jí)表示不喜歡,而推薦系統(tǒng)目的在于對(duì)那些用戶還未有評(píng)分的項(xiàng)目進(jìn)行預(yù)測(cè)評(píng)分,而進(jìn)行預(yù)測(cè)后最終的目的是選取出前N項(xiàng)項(xiàng)目推薦給用戶。在推薦系統(tǒng)中,最核心的工作模塊就是推薦算法,整個(gè)系統(tǒng)的工作需要用戶的反饋進(jìn)行優(yōu)化調(diào)整,以便為用戶提供更精確的推薦。工作流程如下圖2.1:圖2.1推薦系統(tǒng)工作流程2.1.1基于協(xié)同過濾推薦算法
廣西師范大學(xué)碩士研究生學(xué)位論文10圖2.2標(biāo)題轉(zhuǎn)換向量空間與協(xié)同過濾推薦算法不同,基于內(nèi)容的推薦算法,用戶之間是獨(dú)立的,每個(gè)用戶的偏好都是依據(jù)他本身對(duì)項(xiàng)目的喜好獲得的,與他人的行為無(wú)關(guān)這點(diǎn)與協(xié)同過濾正好相反。這樣就使得基于內(nèi)容的推薦算法存在一些協(xié)同過濾中沒有的優(yōu)勢(shì),例如新產(chǎn)生的項(xiàng)目可以立刻被推薦,基于內(nèi)容的算法關(guān)注內(nèi)容關(guān)聯(lián)性本身,而協(xié)同過濾需要被某些用戶有過打分歷史才會(huì)被推薦給其他用戶。當(dāng)然基于內(nèi)容的推薦算法也存在著不足,例如新用戶沒有喜好歷史,自然無(wú)法獲得他的特征,所以也就無(wú)法為他產(chǎn)生推薦內(nèi)容了。由于基于內(nèi)容推薦算法的一些缺點(diǎn),目前大部分的推薦系統(tǒng)都是以其他算法為主(如協(xié)同過濾算法),而將其作為輔助使用來(lái)解決主算法在某些情況下的不精確性(如解決新項(xiàng)目問題)。2.1.3基于混合的推薦算法基于混合的方法通常結(jié)合多種推薦算法。為了能夠克服單個(gè)推薦算法存在的缺點(diǎn),提高推薦性能,尤其是對(duì)于新用戶或者新項(xiàng)目,傳統(tǒng)用戶協(xié)同過濾算法和基于內(nèi)容的算法,無(wú)法給出很好的推薦;旌贤扑]算法通常采取特征組合,加權(quán)混合,并行推薦算法混合等方法實(shí)現(xiàn)[38]。將協(xié)同過濾和基于內(nèi)容的推薦進(jìn)行組合[39]是十分常用的方案,首先基于內(nèi)容的推薦算法使用樸素貝葉斯分類算法,填補(bǔ)評(píng)分矩陣中的缺失項(xiàng),然后使用協(xié)同過濾算法對(duì)評(píng)分矩陣進(jìn)行進(jìn)一步的計(jì)算。與單個(gè)推薦算法相比,克服了評(píng)分稀疏的問題,從而提高推薦精確度。2.2推薦系統(tǒng)中的隱私保護(hù)技術(shù)為了生成準(zhǔn)確的個(gè)性化推薦,推薦系統(tǒng)依賴于用戶偏好的詳細(xì)個(gè)人數(shù)據(jù)。例如評(píng)分,消費(fèi)記錄和個(gè)人資料。推薦系統(tǒng)為人們提供了很大的幫助,但是推薦系統(tǒng)收集和處理個(gè)人數(shù)據(jù)相關(guān)的隱私風(fēng)險(xiǎn)常常被低估或忽略,推薦系統(tǒng)進(jìn)行用戶數(shù)據(jù)的收集,對(duì)于用戶層面,許?
本文編號(hào):3002160
【文章來(lái)源】:廣西師范大學(xué)廣西壯族自治區(qū)
【文章頁(yè)數(shù)】:58 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
中國(guó)網(wǎng)民規(guī)模和互聯(lián)網(wǎng)普率
廣西師范大學(xué)碩士研究生學(xué)位論文7第2章推薦系統(tǒng)、隱私保護(hù)方法概述2.1推薦系統(tǒng)的概述及主要方法推薦系統(tǒng)的早期研究源于信息檢索和過濾,可以把推薦系統(tǒng)理解為一個(gè)智能系統(tǒng),能夠根據(jù)用戶的興趣偏好篩選用戶感興趣的服務(wù)或物品。開發(fā)推薦系統(tǒng)的目的是通過從大量異構(gòu)復(fù)雜數(shù)據(jù)中檢索出最相關(guān)的信息來(lái)減少信息過載,從而提供個(gè)性化服務(wù)。目前的推薦系統(tǒng)可主要分為基于協(xié)同過濾與基于內(nèi)容的推薦算法,還有混合推薦算法。定義2.1(推薦系統(tǒng)[34]):設(shè)C表示為用戶集合,S可以是所有可能的推薦項(xiàng)目集合,u是一個(gè)效用函數(shù),用于衡量項(xiàng)目(s∈S)對(duì)用戶(c∈C)的有效性,即U:C×S→R,其中R是一個(gè)完全有序的集合。用戶和項(xiàng)目集合都可能非常大,對(duì)于每個(gè)用戶c∈C,我們要選擇這樣的項(xiàng)目s"∈S最大限度地提高效用函數(shù)u,即:c),(maxargS"scuCSsc,(2.1)在推薦系統(tǒng)應(yīng)用程序中,通常有兩類實(shí)體,一般分為為用戶和項(xiàng)目(如電影,商品,音樂,書籍等)兩類,項(xiàng)目的效用通常是以評(píng)分表示,表示一個(gè)用戶是否喜歡這個(gè)項(xiàng)目的。如評(píng)分等級(jí)為1到5,則電影被用戶評(píng)為5表示用戶高度喜歡它,而1評(píng)級(jí)表示不喜歡,而推薦系統(tǒng)目的在于對(duì)那些用戶還未有評(píng)分的項(xiàng)目進(jìn)行預(yù)測(cè)評(píng)分,而進(jìn)行預(yù)測(cè)后最終的目的是選取出前N項(xiàng)項(xiàng)目推薦給用戶。在推薦系統(tǒng)中,最核心的工作模塊就是推薦算法,整個(gè)系統(tǒng)的工作需要用戶的反饋進(jìn)行優(yōu)化調(diào)整,以便為用戶提供更精確的推薦。工作流程如下圖2.1:圖2.1推薦系統(tǒng)工作流程2.1.1基于協(xié)同過濾推薦算法
廣西師范大學(xué)碩士研究生學(xué)位論文10圖2.2標(biāo)題轉(zhuǎn)換向量空間與協(xié)同過濾推薦算法不同,基于內(nèi)容的推薦算法,用戶之間是獨(dú)立的,每個(gè)用戶的偏好都是依據(jù)他本身對(duì)項(xiàng)目的喜好獲得的,與他人的行為無(wú)關(guān)這點(diǎn)與協(xié)同過濾正好相反。這樣就使得基于內(nèi)容的推薦算法存在一些協(xié)同過濾中沒有的優(yōu)勢(shì),例如新產(chǎn)生的項(xiàng)目可以立刻被推薦,基于內(nèi)容的算法關(guān)注內(nèi)容關(guān)聯(lián)性本身,而協(xié)同過濾需要被某些用戶有過打分歷史才會(huì)被推薦給其他用戶。當(dāng)然基于內(nèi)容的推薦算法也存在著不足,例如新用戶沒有喜好歷史,自然無(wú)法獲得他的特征,所以也就無(wú)法為他產(chǎn)生推薦內(nèi)容了。由于基于內(nèi)容推薦算法的一些缺點(diǎn),目前大部分的推薦系統(tǒng)都是以其他算法為主(如協(xié)同過濾算法),而將其作為輔助使用來(lái)解決主算法在某些情況下的不精確性(如解決新項(xiàng)目問題)。2.1.3基于混合的推薦算法基于混合的方法通常結(jié)合多種推薦算法。為了能夠克服單個(gè)推薦算法存在的缺點(diǎn),提高推薦性能,尤其是對(duì)于新用戶或者新項(xiàng)目,傳統(tǒng)用戶協(xié)同過濾算法和基于內(nèi)容的算法,無(wú)法給出很好的推薦;旌贤扑]算法通常采取特征組合,加權(quán)混合,并行推薦算法混合等方法實(shí)現(xiàn)[38]。將協(xié)同過濾和基于內(nèi)容的推薦進(jìn)行組合[39]是十分常用的方案,首先基于內(nèi)容的推薦算法使用樸素貝葉斯分類算法,填補(bǔ)評(píng)分矩陣中的缺失項(xiàng),然后使用協(xié)同過濾算法對(duì)評(píng)分矩陣進(jìn)行進(jìn)一步的計(jì)算。與單個(gè)推薦算法相比,克服了評(píng)分稀疏的問題,從而提高推薦精確度。2.2推薦系統(tǒng)中的隱私保護(hù)技術(shù)為了生成準(zhǔn)確的個(gè)性化推薦,推薦系統(tǒng)依賴于用戶偏好的詳細(xì)個(gè)人數(shù)據(jù)。例如評(píng)分,消費(fèi)記錄和個(gè)人資料。推薦系統(tǒng)為人們提供了很大的幫助,但是推薦系統(tǒng)收集和處理個(gè)人數(shù)據(jù)相關(guān)的隱私風(fēng)險(xiǎn)常常被低估或忽略,推薦系統(tǒng)進(jìn)行用戶數(shù)據(jù)的收集,對(duì)于用戶層面,許?
本文編號(hào):3002160
本文鏈接:http://www.sikaile.net/shoufeilunwen/xixikjs/3002160.html
最近更新
教材專著