社交網絡中基于矩陣補全的深度矩陣分解推薦算法研究
發(fā)布時間:2021-11-02 16:21
信息爆炸的時代,單純使用搜索引擎獲取信息的方式已然無法滿足人們的日常所需。在互聯(lián)網背景下誕生的推薦系統(tǒng),通過研究人們的歷史行為,主動向人們提供可能感興趣的信息,很好地解決了這一難題。但傳統(tǒng)的推薦算法普遍難以解決冷啟動問題,并且受到數(shù)據(jù)稀疏性的影響較大。隨著在線社交網絡的興起,研究者們開始將社交網絡拓撲結構的影響加入到推薦算法的考慮過程之中,彌補了傳統(tǒng)推薦算法的不足,這就是社交網絡推薦。本文的工作主要分為兩個部分:矩陣補全和深度社交矩陣分解。兩者都是借助用戶和用戶之間的信任關系、用戶和商品之間的交互行為,對用戶特征和商品特征進行深度挖掘。矩陣補全在本文中的目標是對實驗數(shù)據(jù)進行預處理,以避免傳統(tǒng)推薦算法因基于數(shù)據(jù)隨機丟失的前提而引起的計算偏差。在矩陣補全的基礎上,考慮到算法兼顧顯式評分和隱式反饋的重要性,本文提出了將深度矩陣分解方法擴展到社交網絡推薦領域的處理框架。隨著在線社交網絡的快速發(fā)展,許多數(shù)據(jù)挖掘技術都開始把社交關系加入到推薦算法的考量范圍之中。雖然已經有了大量的工作,但是大多數(shù)社交網絡推薦算法都基于同一個假設——用戶歷史數(shù)據(jù)中的缺失值是隨機丟失的,但在現(xiàn)實生活中這是很少見的情況。...
【文章來源】:華東師范大學上海市 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:66 頁
【學位級別】:碩士
【部分圖文】:
長尾理論
華東師范大學碩士學位論文10圖3基于興趣圖譜的關系圖和基于社交圖譜的關系圖如上圖所示,以信任關系為基礎的興趣圖譜可以用有向圖表示,其中節(jié)點集合為={,,…,},表示網絡中的用戶。節(jié)點之間的連邊表示用戶之間的信任關系,比如節(jié)點F和節(jié)點C之間的有向連邊在新浪微博中就可以理解為用戶F關注了用戶C。當然,用戶之間也可以互相信任,比如用戶D和用戶E就是互相信任的關系。在以有向圖表示的興趣圖譜中,對于任一節(jié)點,我們定義:out():節(jié)點指向的節(jié)點集合,現(xiàn)實意義為用戶信任的用戶集合;in():指向節(jié)點的節(jié)點集合,現(xiàn)實意義為信任用戶的用戶集合。在圖3中,以朋友關系為基礎的社交圖譜一般用無向圖表示,這是因為在用戶雙方建立關系之前已經通過雙方的確認。在以無向圖表示的社交圖譜中,對于任一節(jié)點,我們定義:Γ():節(jié)點所擁有的鄰居節(jié)點數(shù)目,同時也是節(jié)點所擁有的連邊數(shù)。在社交網絡圖中,每個節(jié)點都各有其鄰居節(jié)點,也就是說,每位用戶都各有其鄰居用戶,在這里可以理解為用戶的朋友。與現(xiàn)實世界一樣,同樣是朋友,關系也有親疏之別。下面將分別詳細闡述節(jié)點親疏關系在基于社交圖譜的無向圖和基于興趣圖譜的有向圖中的計算過程。2.1.1基于社交圖譜的無向圖在基于社交圖譜的無向圖中,計算朋友之間的親疏關系常用的有以下三種策略:a)公共鄰居指標公共鄰居指標[43]是最常見的基于局部的指標之一,其含義直觀且容易理解。在現(xiàn)實生活中,如果兩位用戶有許多的共同好友,那么這兩位用戶的社交圈子一定有很大的重疊部分,自然可以推斷,兩人的興趣愛好也十分類似。從現(xiàn)實映射到社交網絡中也同樣
華東師范大學碩士學位論文12可以解釋為,用戶A和用戶B如果都與社交達人用戶C存在朋友關系,并不足以認為兩人的親密度很高;而若用戶A、B兩人都與不擅交際的用戶D交往甚密,則足以說明問題。2.1.2基于興趣圖譜的有向圖相比基于社交圖譜的無向圖,計算基于興趣圖譜的有向圖中兩兩用戶之間的信任關系要相對復雜。首先,在計算信任度之前,在社交網絡中還有以下兩個需要了解的基本概念:跳數(shù)(hop):在計算機網絡中,跳數(shù)表示在源和目標之間傳遞路徑上所需中間設備的數(shù)量。把這個概念遷移到社交網絡中,hop對應網絡中從源節(jié)點到目標節(jié)點路徑上的節(jié)點數(shù)目。最短路徑長度:網絡中任意兩個節(jié)點之間的最短路徑長度為兩點間的全部路徑中邊數(shù)最小的通路長度,同時也等于兩點間的最短跳數(shù)。在有向圖中,由于用戶之間的信任是單向傳播,故用戶之間的相似度無法用上述的公共鄰居指標、Jaccard指標和AA指標來計算。大量研究表明,信任具有一定程度的可傳遞性,并且遵循一定的傳播策略。在有向圖中,模擬用戶間信任傳播的計算方式有很多種。在進行具體闡述之前首先給出如下定義::表示用戶間的信任度,在圖論中可理解為邊的權值。其中為源節(jié)點,為目標節(jié)點,且取值范圍為[0,1],的值越大,表示用戶對用戶越信任。以圖4為例,用戶B對用戶A的信任度為0.6。=(,,):表示信任圖。其中與的意義與2.2.1章節(jié)中所介紹的意義相同,表示邊的權重的集合,也就是上述信任度的集合,公式化表示為{∈|,∈}。圖4基于興趣圖譜的有向圖示意圖
本文編號:3472115
【文章來源】:華東師范大學上海市 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:66 頁
【學位級別】:碩士
【部分圖文】:
長尾理論
華東師范大學碩士學位論文10圖3基于興趣圖譜的關系圖和基于社交圖譜的關系圖如上圖所示,以信任關系為基礎的興趣圖譜可以用有向圖表示,其中節(jié)點集合為={,,…,},表示網絡中的用戶。節(jié)點之間的連邊表示用戶之間的信任關系,比如節(jié)點F和節(jié)點C之間的有向連邊在新浪微博中就可以理解為用戶F關注了用戶C。當然,用戶之間也可以互相信任,比如用戶D和用戶E就是互相信任的關系。在以有向圖表示的興趣圖譜中,對于任一節(jié)點,我們定義:out():節(jié)點指向的節(jié)點集合,現(xiàn)實意義為用戶信任的用戶集合;in():指向節(jié)點的節(jié)點集合,現(xiàn)實意義為信任用戶的用戶集合。在圖3中,以朋友關系為基礎的社交圖譜一般用無向圖表示,這是因為在用戶雙方建立關系之前已經通過雙方的確認。在以無向圖表示的社交圖譜中,對于任一節(jié)點,我們定義:Γ():節(jié)點所擁有的鄰居節(jié)點數(shù)目,同時也是節(jié)點所擁有的連邊數(shù)。在社交網絡圖中,每個節(jié)點都各有其鄰居節(jié)點,也就是說,每位用戶都各有其鄰居用戶,在這里可以理解為用戶的朋友。與現(xiàn)實世界一樣,同樣是朋友,關系也有親疏之別。下面將分別詳細闡述節(jié)點親疏關系在基于社交圖譜的無向圖和基于興趣圖譜的有向圖中的計算過程。2.1.1基于社交圖譜的無向圖在基于社交圖譜的無向圖中,計算朋友之間的親疏關系常用的有以下三種策略:a)公共鄰居指標公共鄰居指標[43]是最常見的基于局部的指標之一,其含義直觀且容易理解。在現(xiàn)實生活中,如果兩位用戶有許多的共同好友,那么這兩位用戶的社交圈子一定有很大的重疊部分,自然可以推斷,兩人的興趣愛好也十分類似。從現(xiàn)實映射到社交網絡中也同樣
華東師范大學碩士學位論文12可以解釋為,用戶A和用戶B如果都與社交達人用戶C存在朋友關系,并不足以認為兩人的親密度很高;而若用戶A、B兩人都與不擅交際的用戶D交往甚密,則足以說明問題。2.1.2基于興趣圖譜的有向圖相比基于社交圖譜的無向圖,計算基于興趣圖譜的有向圖中兩兩用戶之間的信任關系要相對復雜。首先,在計算信任度之前,在社交網絡中還有以下兩個需要了解的基本概念:跳數(shù)(hop):在計算機網絡中,跳數(shù)表示在源和目標之間傳遞路徑上所需中間設備的數(shù)量。把這個概念遷移到社交網絡中,hop對應網絡中從源節(jié)點到目標節(jié)點路徑上的節(jié)點數(shù)目。最短路徑長度:網絡中任意兩個節(jié)點之間的最短路徑長度為兩點間的全部路徑中邊數(shù)最小的通路長度,同時也等于兩點間的最短跳數(shù)。在有向圖中,由于用戶之間的信任是單向傳播,故用戶之間的相似度無法用上述的公共鄰居指標、Jaccard指標和AA指標來計算。大量研究表明,信任具有一定程度的可傳遞性,并且遵循一定的傳播策略。在有向圖中,模擬用戶間信任傳播的計算方式有很多種。在進行具體闡述之前首先給出如下定義::表示用戶間的信任度,在圖論中可理解為邊的權值。其中為源節(jié)點,為目標節(jié)點,且取值范圍為[0,1],的值越大,表示用戶對用戶越信任。以圖4為例,用戶B對用戶A的信任度為0.6。=(,,):表示信任圖。其中與的意義與2.2.1章節(jié)中所介紹的意義相同,表示邊的權重的集合,也就是上述信任度的集合,公式化表示為{∈|,∈}。圖4基于興趣圖譜的有向圖示意圖
本文編號:3472115
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3472115.html
最近更新
教材專著