基于鄰域的協(xié)同過濾推薦系統(tǒng)相似度研究
發(fā)布時間:2018-05-28 05:07
本文選題:鄰域 + 協(xié)同過濾; 參考:《江西財經(jīng)大學(xué)》2017年博士論文
【摘要】:在當(dāng)今這個信息過載的時代,如何有效地選擇和推薦滿足用戶需求的信息,已經(jīng)成為服務(wù)計算領(lǐng)域的關(guān)鍵問題之一。推薦系統(tǒng)能有效地減輕用戶的認(rèn)知負(fù)擔(dān),為其提供個性化的服務(wù)和信息。協(xié)同過濾推薦系統(tǒng)是現(xiàn)有推薦系統(tǒng)中最流行,應(yīng)用最廣泛一種。基于鄰域的協(xié)同過濾推薦系統(tǒng)是最早出現(xiàn)的協(xié)同過濾系統(tǒng),因其簡單、高效及可解釋性好,可擴(kuò)展性和穩(wěn)定性強(qiáng)等特點(diǎn),被廣泛應(yīng)用于商業(yè)系統(tǒng)之中。其主要思想是根據(jù)近鄰的喜好來產(chǎn)生推薦,沒有近鄰就無法進(jìn)行推薦。近鄰的選擇是通過度量彼此之間的相似度來完成的,F(xiàn)有的相似度計算方法是通過比較評價矩陣中兩個向量的共同評價部分得到的。沒有共同評價就無法度量相似度,從而導(dǎo)致無法推薦。在實(shí)際應(yīng)用中,評價矩陣的稀疏性往往導(dǎo)致共同評價部分過少甚至沒有,造成現(xiàn)有的相似度度量方法會出現(xiàn)計算不準(zhǔn)確甚至無法計算的問題。本文針對現(xiàn)有的相似度計算方法中存在的計算不準(zhǔn)確,不完整,以及無法計算的問題,展開一系列研究工作,主要的研究內(nèi)容和創(chuàng)新性可以歸納為以下幾個方面:(1)本文提出了一種整體性相似度計算方法,F(xiàn)有的相似度計算方法是通過比較共同評價而不是所有評價得到的。評價數(shù)據(jù)的稀疏性會導(dǎo)致共同評價部分往往較少,由此造成所得到的相似度只能反映出局部的相似性,而與其實(shí)際整體的相似性存在偏差。用戶和物品評價矩陣越稀疏,共同評價就越少,相似度偏差也越大。為此,我們將所有評價的整體相似度和原有的共同評價的局部相似度相結(jié)合,提出一種新的相似度度量方法,并在此基礎(chǔ)上對其準(zhǔn)確性做出進(jìn)一步改進(jìn)。該方法能保持其原有方法的簡單性和高效性。實(shí)驗(yàn)結(jié)果表明,新的相似度計算方法產(chǎn)生的推薦結(jié)果比現(xiàn)有方法更準(zhǔn)確。(2)本文提出了一種傳遞相似度計算方法;卩徲虻耐扑]方法是依靠相似的近鄰來產(chǎn)生推薦的,而近鄰的選擇則是根據(jù)相似度來篩選的。用戶和物品評價矩陣的稀疏性會導(dǎo)致共同評價部分非常稀少甚至沒有。沒有共同評價部分就意味著相似度無法度量,無法度量相似度也就無法選擇近鄰,最終導(dǎo)致無法產(chǎn)生推薦結(jié)果。對此,我們采用“朋友的朋友是朋友”的策略,將兩個無法直接度量相似性的用戶或物品,通過與第三方的相似關(guān)系,間接地計算出雙方之間的相似性。該方法不僅可以處理因?yàn)闆]有共同評價而無法度量相似度問題,還可以修正因共同評價過少而造成相似度不準(zhǔn)確的情況。實(shí)驗(yàn)結(jié)果表明,傳遞相似度計算方法是有效的,尤其是在評價非常稀疏時,能產(chǎn)生更多的推薦結(jié)果,對現(xiàn)有相似度計算方法是一個很好的補(bǔ)充。(3)本文提出了一種基于負(fù)相關(guān)的相似度計算方法;卩徲虻膮f(xié)同過濾推薦系統(tǒng)中通常都是采用基于相關(guān)性的相似度計算方法,由此得到相關(guān)性有正相關(guān)和負(fù)相關(guān)。正相關(guān)可以直接反映出兩個用戶或兩個物品之間的相似關(guān)系相似度,因此被認(rèn)為是可靠的相似度。而負(fù)相關(guān)由于不能直接反映出相似關(guān)系而往往被過濾掉。沒有正相關(guān)就意味著相似性無法計算。對此,在兩個用戶或物品因?yàn)闆]有正相關(guān)而無法度量其相似性的時候,我們采用“敵人的敵人是朋友”的策略,通過負(fù)相關(guān)找到“敵人”的“敵人”,并將其作為自己的朋友來產(chǎn)生推薦。該方法可以應(yīng)對因沒有正相關(guān)性而無法度量相似度的問題,同時也可以修正因共同評價過少而正相關(guān)相似度不準(zhǔn)確的情況。實(shí)驗(yàn)結(jié)果表明,該方法能產(chǎn)生更多的推薦結(jié)果,尤其是在正相關(guān)相似度不準(zhǔn)確或無法獲得時,是一個很好的補(bǔ)充。
[Abstract]:This paper puts forward a new similarity measure method by comparing the similarity between the two vectors in the evaluation matrix . ( 3 ) In this paper , a kind of similarity calculation method based on negative correlation is presented in this paper . It is usually used to calculate the similarity between two users or two objects based on the similarity calculation method based on correlation .
【學(xué)位授予單位】:江西財經(jīng)大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2017
【分類號】:TP391.3;F274
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 朱云峰;;余弦距離算法在固定資產(chǎn)管理系統(tǒng)中文本相似度查詢的應(yīng)用[J];無錫商業(yè)職業(yè)技術(shù)學(xué)院學(xué)報;2013年06期
2 馮霞;高峰;劉秀麗;;基于改進(jìn)T-S模型的HAZOP方法在化工生產(chǎn)安全中的應(yīng)用[J];科技與企業(yè);2012年14期
3 李聰;;電子商務(wù)協(xié)同過濾可擴(kuò)展性研究綜述[J];現(xiàn)代圖書情報技術(shù);2010年11期
4 夏秀峰;郝仲模;李磊;;考慮年度日程表事件的協(xié)同過濾推薦[J];計算機(jī)工程與應(yīng)用;2010年11期
5 朱敏;蘇博;;基于奇異值分解的協(xié)同過濾推薦算法研究[J];計算機(jī)安全;2010年07期
6 龔松杰;;電子商務(wù)中協(xié)同過濾推薦技術(shù)研究[J];商場現(xiàn)代化;2008年03期
7 李雪峰;劉魯;張f,
本文編號:1945400
本文鏈接:http://www.sikaile.net/jingjilunwen/xmjj/1945400.html
最近更新
教材專著