基于詞嵌入的個性化新聞推薦算法研究
發(fā)布時間:2022-01-26 05:20
互聯(lián)網技術的發(fā)展,越來越多的人將閱讀的方式轉變?yōu)榫W上閱讀。新聞推薦作為一種新聞過濾和用戶定位的手段,可以根據用戶歷史的閱讀習慣為用戶推薦其可能感興趣的新聞話題,幫助用戶在大數據時代下,準確的獲得有效信息,節(jié)省大量的閱讀成本,有效的解決了大數據帶來的信息過載問題。而目前對于信息過載條件下的推薦系統(tǒng)研究主要集中在電子商務領域,對于新聞的個性化推薦研究較少,但新聞作為日常生活必不可缺的一部分,更新迭代速度快,信息量大,用戶很難及時的捕獲到自己感興趣的信息。因此,針對新聞進行個性化推薦具有重要意義。協(xié)同過濾模型是經典的推薦算法模型,取得了較好的成果,且隨著統(tǒng)計學的發(fā)展,神經網絡的出現(xiàn)將神經網絡與協(xié)同過濾相結合的神經協(xié)同過濾模型又進一步提升了推薦系統(tǒng)精度,然而,這兩種模型均存在著一定的局限性,例如都是通過用戶和項目的交互記錄來提取用戶的行為特征,沒有充分利用可用的額外信息,限制了推薦準確度的提升,且對于稀疏數據較為敏感。因此,本文將結合文本挖掘技術與神經協(xié)同過濾模型在新聞推薦領域的應用進行研究。首先對目前主流的推薦算法和文本特征表示的相關原理進行詳細的分析和介紹,并總結了各個方法的優(yōu)缺點。在此基...
【文章來源】:上海師范大學上海市
【文章頁數】:60 頁
【學位級別】:碩士
【部分圖文】:
淘寶推薦實例
喜歡并且適合自己的裙子,這就是信息過載造成的用戶挑瀏覽所有的待推薦項目并從中篩選出自己感興趣的項目析大量的用戶行為日志,找出用戶的歷史行為特點,并且史行為,產生各不相同的推薦列表。r 等曾經將推薦系統(tǒng)定義為是利用數據挖掘技術和預測算數據、項目特征數據、用戶特征數據等預測用戶感興趣的mavicius 等用數學語言給出了推薦系統(tǒng)的定義:用待推薦用戶集合,用 表示所有待推函數 f ,用來衡量用戶 i 對項目 j 的效用又稱感興R,其中n=mR 表示評分矩陣,矩陣中每個元素表示用算法的目的就是在項目集合V 中找到用戶u U最感興趣下面的公式(2-1)來表示:, arg max ( , )uv Vu U v f u v = 工作流程可以用下圖表示,工作流程如下所示:{u iU = { | 1, 2,..., }jV = v j =n
圖 2-2 基于內容的推薦算法示意圖上面流程圖可以清楚的發(fā)現(xiàn),推薦算法是根據用戶的歷史行為,產戶興趣的幾個關鍵詞作為用戶的興趣愛好模型。并計算待推薦新聞好的相似程度給出推薦列表。目前最常用的文本特征表示方法就是,通過提取關鍵詞,構建關鍵詞表,將用戶的興趣特征和新聞的特空間中的一個高維向量,并根據向量的相似程度的大小來衡量用戶相似程度。一個用戶興趣偏好和新聞特征可以表示為下式所示的向量:1 2( , ,..., )kD = w w w(2kw 表示特征的權重,即用戶在這個關鍵詞上的偏好程度,例如,用這個詞上的權重為 0.8,表示用戶對于游戲的喜好程度相當高,因
本文編號:3609894
【文章來源】:上海師范大學上海市
【文章頁數】:60 頁
【學位級別】:碩士
【部分圖文】:
淘寶推薦實例
喜歡并且適合自己的裙子,這就是信息過載造成的用戶挑瀏覽所有的待推薦項目并從中篩選出自己感興趣的項目析大量的用戶行為日志,找出用戶的歷史行為特點,并且史行為,產生各不相同的推薦列表。r 等曾經將推薦系統(tǒng)定義為是利用數據挖掘技術和預測算數據、項目特征數據、用戶特征數據等預測用戶感興趣的mavicius 等用數學語言給出了推薦系統(tǒng)的定義:用待推薦用戶集合,用 表示所有待推函數 f ,用來衡量用戶 i 對項目 j 的效用又稱感興R,其中n=mR 表示評分矩陣,矩陣中每個元素表示用算法的目的就是在項目集合V 中找到用戶u U最感興趣下面的公式(2-1)來表示:, arg max ( , )uv Vu U v f u v = 工作流程可以用下圖表示,工作流程如下所示:{u iU = { | 1, 2,..., }jV = v j =n
圖 2-2 基于內容的推薦算法示意圖上面流程圖可以清楚的發(fā)現(xiàn),推薦算法是根據用戶的歷史行為,產戶興趣的幾個關鍵詞作為用戶的興趣愛好模型。并計算待推薦新聞好的相似程度給出推薦列表。目前最常用的文本特征表示方法就是,通過提取關鍵詞,構建關鍵詞表,將用戶的興趣特征和新聞的特空間中的一個高維向量,并根據向量的相似程度的大小來衡量用戶相似程度。一個用戶興趣偏好和新聞特征可以表示為下式所示的向量:1 2( , ,..., )kD = w w w(2kw 表示特征的權重,即用戶在這個關鍵詞上的偏好程度,例如,用這個詞上的權重為 0.8,表示用戶對于游戲的喜好程度相當高,因
本文編號:3609894
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/3609894.html
最近更新
教材專著