融合用戶偏好和項(xiàng)目關(guān)聯(lián)的協(xié)同過(guò)濾算法研究
發(fā)布時(shí)間:2021-11-05 08:07
隨著信息時(shí)代的到來(lái),海量的信息充斥著現(xiàn)在的社會(huì)生活,這對(duì)信息的生產(chǎn)者和用戶來(lái)說(shuō)都是一項(xiàng)巨大的挑戰(zhàn)。推薦系統(tǒng)的產(chǎn)生為解決這個(gè)問(wèn)題提供了有效的解決辦法,作為信息生產(chǎn)者與用戶之間的橋梁,它能夠?yàn)橛脩艉Y選有價(jià)值的信息,同時(shí)也能夠幫助信息生產(chǎn)者把自己的信息推廣到對(duì)它感興趣的用戶面前。推薦系統(tǒng)的產(chǎn)生離不開(kāi)協(xié)同過(guò)濾算法的發(fā)展,協(xié)同過(guò)濾算法是目前應(yīng)用較為廣泛的推薦算法。雖然目前協(xié)同過(guò)濾算法已經(jīng)被應(yīng)用到許多電子商務(wù)網(wǎng)站的推薦系統(tǒng)當(dāng)中,但是仍然存在一些有待解決的問(wèn)題。本文針對(duì)協(xié)同過(guò)濾算法中相似度計(jì)算未考慮實(shí)際場(chǎng)景影響的問(wèn)題,對(duì)相似度計(jì)算方法做出了如下的改進(jìn):首先,提出了基于用戶偏好的相似度計(jì)算的改進(jìn)辦法。本文針對(duì)熱冷門物品對(duì)相似度計(jì)算的影響,采用熱門物品懲罰因子來(lái)減少熱門物品在相似度計(jì)算中所占的比重,并將這種因子引入到余弦相似度計(jì)算當(dāng)中;考慮到用戶共同評(píng)分項(xiàng)目數(shù)量對(duì)兩用戶相似度的影響,我們采用杰西卡相關(guān)度計(jì)算與改進(jìn)的余弦相似度計(jì)算相結(jié)合的方式來(lái)進(jìn)行用戶相似度計(jì)算。其次,提出了基于項(xiàng)目關(guān)聯(lián)的相似度計(jì)算的改進(jìn)辦法。針對(duì)傳統(tǒng)的相似度計(jì)算只考慮項(xiàng)目評(píng)分,從而導(dǎo)致項(xiàng)目相關(guān)度計(jì)算不合理的問(wèn)題,我們采用了項(xiàng)目的評(píng)分相似...
【文章來(lái)源】:吉林大學(xué)吉林省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:54 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
基于內(nèi)容的推薦算法示意圖
第二章推薦算法及相關(guān)概念介紹9圖2.2基于用戶的協(xié)同過(guò)濾黑色實(shí)線表示用戶對(duì)該內(nèi)容感興趣,黑色虛線則表示系統(tǒng)將該內(nèi)容推薦給某用戶。如上圖所示,用戶A喜歡內(nèi)容1,內(nèi)容4;用戶C則對(duì)內(nèi)容1,內(nèi)容2,內(nèi)容4。從這些用戶的歷史行為數(shù)據(jù)中,可以得出用戶A和用戶C的具有相似的喜好,由此可以推斷出用戶A可能對(duì)內(nèi)容2也會(huì)感興趣,所以我們可以把內(nèi)容2推薦給用戶A。傳統(tǒng)的UserCF的實(shí)現(xiàn)過(guò)程可以分為以下三個(gè)步驟:(1)首先,根據(jù)用戶與系統(tǒng)的交互行為,可建立用戶-項(xiàng)目評(píng)分矩陣。用戶的歷史行為數(shù)據(jù)會(huì)有很多種,包括:對(duì)內(nèi)容的評(píng)分,瀏覽歷史,收藏夾,點(diǎn)贊等,本文通過(guò)用戶對(duì)項(xiàng)目的評(píng)分?jǐn)?shù)據(jù)進(jìn)行舉例說(shuō)明,來(lái)介紹UserCF算法的計(jì)算過(guò)程,用戶-項(xiàng)目評(píng)分矩陣如下表2.1:表2.1用戶-項(xiàng)目評(píng)分矩陣項(xiàng)目1項(xiàng)目2項(xiàng)目3項(xiàng)目4用戶A3004用戶B0050用戶C3403(2)通過(guò)上述的用戶-項(xiàng)目評(píng)分矩陣中用戶對(duì)項(xiàng)目的評(píng)分?jǐn)?shù)據(jù),再結(jié)合上述的相似度計(jì)算方式,確定偏好相似的用戶集,常用的相似度計(jì)算方法已經(jīng)在本文的2.2.1章節(jié)給出了詳細(xì)介紹。(3)根據(jù)用戶的相似度,可以得出目標(biāo)用戶的最近鄰居KNN,推薦給目標(biāo)用
第二章推薦算法及相關(guān)概念介紹10戶。KNN篩選的常用方式有兩種:第一種是通過(guò)設(shè)置用戶相似度的閾值,相似度大于該閾值,我們認(rèn)為兩用戶為興趣相似用戶,否則,認(rèn)為兩用戶不是興趣相似用戶,通過(guò)設(shè)置閾值過(guò)濾掉不相關(guān)的用戶群;第二種,是通過(guò)找到Top-N的用戶,得到“鄰居”用戶群,這種方法,是通過(guò)對(duì)相似度的值進(jìn)行排序,從高到低取N個(gè)鄰居用戶。根據(jù)具體情況可以選擇合適的策略得到最近鄰居KNN。2.1.2.2基于項(xiàng)目的協(xié)同過(guò)濾基于項(xiàng)目(Item)的協(xié)同過(guò)濾,主要更多考慮的是項(xiàng)目之間的聯(lián)系,通過(guò)確定相似的項(xiàng)目集合,再根據(jù)用戶在系統(tǒng)中的行為信息,尋找與用戶曾經(jīng)購(gòu)買過(guò)或者瀏覽過(guò)的內(nèi)容,來(lái)為用戶推薦用戶感興趣的內(nèi)容。該算法原理如圖2.3所示:圖2.3基于項(xiàng)目的協(xié)同過(guò)濾黑色實(shí)線表示用戶對(duì)該內(nèi)容感興趣,黑色虛線則表示系統(tǒng)將該內(nèi)容推薦給某用戶。如圖所示,我們可以看出用戶A對(duì)內(nèi)容1,內(nèi)容3感興趣;用戶B對(duì)內(nèi)容1,內(nèi)容2,內(nèi)容3;用戶C對(duì)內(nèi)容1感興趣。從用戶的歷史喜好信息中,可以得出對(duì)內(nèi)容1感興趣的用戶都對(duì)內(nèi)容3感興趣,內(nèi)容1和內(nèi)容3具有相似性,所以系統(tǒng)將會(huì)把內(nèi)容3推薦給用戶C;陧(xiàng)目(Item)的協(xié)同過(guò)濾算法的推薦過(guò)程可以分為以下三個(gè)步驟:(1)首先,根據(jù)用戶的歷史行為數(shù)據(jù),構(gòu)建項(xiàng)目-用戶行為矩陣,用戶的操作行為可以包括:瀏覽記錄,收藏記錄,瀏覽時(shí)長(zhǎng)等。還是以用戶對(duì)項(xiàng)目的評(píng)分舉例,構(gòu)建項(xiàng)目-用戶行為矩陣如下表2.2:
本文編號(hào):3477410
【文章來(lái)源】:吉林大學(xué)吉林省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:54 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
基于內(nèi)容的推薦算法示意圖
第二章推薦算法及相關(guān)概念介紹9圖2.2基于用戶的協(xié)同過(guò)濾黑色實(shí)線表示用戶對(duì)該內(nèi)容感興趣,黑色虛線則表示系統(tǒng)將該內(nèi)容推薦給某用戶。如上圖所示,用戶A喜歡內(nèi)容1,內(nèi)容4;用戶C則對(duì)內(nèi)容1,內(nèi)容2,內(nèi)容4。從這些用戶的歷史行為數(shù)據(jù)中,可以得出用戶A和用戶C的具有相似的喜好,由此可以推斷出用戶A可能對(duì)內(nèi)容2也會(huì)感興趣,所以我們可以把內(nèi)容2推薦給用戶A。傳統(tǒng)的UserCF的實(shí)現(xiàn)過(guò)程可以分為以下三個(gè)步驟:(1)首先,根據(jù)用戶與系統(tǒng)的交互行為,可建立用戶-項(xiàng)目評(píng)分矩陣。用戶的歷史行為數(shù)據(jù)會(huì)有很多種,包括:對(duì)內(nèi)容的評(píng)分,瀏覽歷史,收藏夾,點(diǎn)贊等,本文通過(guò)用戶對(duì)項(xiàng)目的評(píng)分?jǐn)?shù)據(jù)進(jìn)行舉例說(shuō)明,來(lái)介紹UserCF算法的計(jì)算過(guò)程,用戶-項(xiàng)目評(píng)分矩陣如下表2.1:表2.1用戶-項(xiàng)目評(píng)分矩陣項(xiàng)目1項(xiàng)目2項(xiàng)目3項(xiàng)目4用戶A3004用戶B0050用戶C3403(2)通過(guò)上述的用戶-項(xiàng)目評(píng)分矩陣中用戶對(duì)項(xiàng)目的評(píng)分?jǐn)?shù)據(jù),再結(jié)合上述的相似度計(jì)算方式,確定偏好相似的用戶集,常用的相似度計(jì)算方法已經(jīng)在本文的2.2.1章節(jié)給出了詳細(xì)介紹。(3)根據(jù)用戶的相似度,可以得出目標(biāo)用戶的最近鄰居KNN,推薦給目標(biāo)用
第二章推薦算法及相關(guān)概念介紹10戶。KNN篩選的常用方式有兩種:第一種是通過(guò)設(shè)置用戶相似度的閾值,相似度大于該閾值,我們認(rèn)為兩用戶為興趣相似用戶,否則,認(rèn)為兩用戶不是興趣相似用戶,通過(guò)設(shè)置閾值過(guò)濾掉不相關(guān)的用戶群;第二種,是通過(guò)找到Top-N的用戶,得到“鄰居”用戶群,這種方法,是通過(guò)對(duì)相似度的值進(jìn)行排序,從高到低取N個(gè)鄰居用戶。根據(jù)具體情況可以選擇合適的策略得到最近鄰居KNN。2.1.2.2基于項(xiàng)目的協(xié)同過(guò)濾基于項(xiàng)目(Item)的協(xié)同過(guò)濾,主要更多考慮的是項(xiàng)目之間的聯(lián)系,通過(guò)確定相似的項(xiàng)目集合,再根據(jù)用戶在系統(tǒng)中的行為信息,尋找與用戶曾經(jīng)購(gòu)買過(guò)或者瀏覽過(guò)的內(nèi)容,來(lái)為用戶推薦用戶感興趣的內(nèi)容。該算法原理如圖2.3所示:圖2.3基于項(xiàng)目的協(xié)同過(guò)濾黑色實(shí)線表示用戶對(duì)該內(nèi)容感興趣,黑色虛線則表示系統(tǒng)將該內(nèi)容推薦給某用戶。如圖所示,我們可以看出用戶A對(duì)內(nèi)容1,內(nèi)容3感興趣;用戶B對(duì)內(nèi)容1,內(nèi)容2,內(nèi)容3;用戶C對(duì)內(nèi)容1感興趣。從用戶的歷史喜好信息中,可以得出對(duì)內(nèi)容1感興趣的用戶都對(duì)內(nèi)容3感興趣,內(nèi)容1和內(nèi)容3具有相似性,所以系統(tǒng)將會(huì)把內(nèi)容3推薦給用戶C;陧(xiàng)目(Item)的協(xié)同過(guò)濾算法的推薦過(guò)程可以分為以下三個(gè)步驟:(1)首先,根據(jù)用戶的歷史行為數(shù)據(jù),構(gòu)建項(xiàng)目-用戶行為矩陣,用戶的操作行為可以包括:瀏覽記錄,收藏記錄,瀏覽時(shí)長(zhǎng)等。還是以用戶對(duì)項(xiàng)目的評(píng)分舉例,構(gòu)建項(xiàng)目-用戶行為矩陣如下表2.2:
本文編號(hào):3477410
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3477410.html
最近更新
教材專著