基于Python的新聞個(gè)性化推薦系統(tǒng)優(yōu)化與實(shí)現(xiàn)
發(fā)布時(shí)間:2021-03-10 17:47
智能推薦隨著互聯(lián)網(wǎng)的飛速發(fā)展已經(jīng)成為日常生活中不可或缺的技術(shù),人們?cè)絹碓搅?xí)慣于通過手機(jī)在線閱讀來了解新聞熱點(diǎn)。然而各種網(wǎng)絡(luò)新聞每天都在以億萬計(jì)的數(shù)量遞增,且每個(gè)人都有自己的興趣愛好和閱讀習(xí)慣;那么在如此龐大數(shù)量的新聞消息中,如何讓用戶及時(shí)瀏覽到自己感興趣的新聞消息,成為當(dāng)前大數(shù)據(jù)行業(yè)研究的熱點(diǎn)。媒體企業(yè)希望通過相關(guān)大數(shù)據(jù)算法結(jié)合用戶的行為數(shù)據(jù)與新聞的文本主題信息來給用戶做個(gè)性化推薦。本論文根據(jù)市場上新聞智能推薦系統(tǒng)的技術(shù)難點(diǎn)及系統(tǒng)弱點(diǎn),改進(jìn)并設(shè)計(jì)出一套新聞個(gè)性化智能推薦系統(tǒng)。首先,根據(jù)以往新聞推薦系統(tǒng)難以掌握用戶實(shí)時(shí)準(zhǔn)確的興趣愛好這一難點(diǎn)出發(fā),通過改進(jìn)設(shè)計(jì),采用從多角度采集用戶行為數(shù)據(jù)這一重要環(huán)節(jié):改進(jìn)一,系統(tǒng)結(jié)合相關(guān)機(jī)器學(xué)習(xí)算法,通過分析企業(yè)從用戶手機(jī)端獲取的用戶日常行為數(shù)據(jù),得到用戶特征畫像;改進(jìn)二,通過分析用戶實(shí)時(shí)閱讀行為數(shù)據(jù),預(yù)測用戶實(shí)時(shí)興趣愛好;系統(tǒng)最后結(jié)合用戶畫像和用戶實(shí)時(shí)興趣愛好進(jìn)行推薦。其次,系統(tǒng)將新聞網(wǎng)提供的實(shí)時(shí)新聞數(shù)據(jù),利用先進(jìn)文本處理算法并結(jié)合系統(tǒng)通過大量新聞?dòng)?xùn)練出的主題模型,準(zhǔn)確提取新聞主題類型,再結(jié)合用戶的興趣愛好,將用戶感興趣的新聞及時(shí)推薦給他們。最后,本系...
【文章來源】:景德鎮(zhèn)陶瓷大學(xué)江西省
【文章頁數(shù)】:60 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
推薦系統(tǒng)的基本任務(wù)是聯(lián)系用戶和新聞內(nèi)容用戶
(1)用戶姓名和性別,年齡和職業(yè),學(xué)歷和收入等基本信息;(2)用戶通過輸入的關(guān)鍵詞、主題;用戶對(duì)自己喜歡的信息或不喜行標(biāo)注等自己的主動(dòng)提供的信息;(3)用戶在閱讀過程中對(duì)內(nèi)容進(jìn)行評(píng)論和分享,轉(zhuǎn)載和收藏等還,數(shù)、瀏覽時(shí)間和頻率等隱性信息[22];(4)推進(jìn)對(duì)象相關(guān)特點(diǎn)、屬性。根據(jù)信息的特點(diǎn),有些數(shù)據(jù)是穩(wěn)定的,有些數(shù)據(jù)是變化的,如何通用戶真正的興趣愛好是本模塊的難點(diǎn)。2.3 推薦對(duì)象模塊推薦對(duì)象模塊是根據(jù)推薦對(duì)象的特征建立對(duì)象特征模型,與需要推行比較,得出需要推薦的對(duì)象特征。2.3.1 推薦對(duì)象建模流程推薦對(duì)象建模過程如圖 2.4 所示
圖 2.5 基于用戶的協(xié)同過濾過程該推薦方法主要工作是找到最近鄰居并產(chǎn)生推薦;最近鄰居尋找是這里的和最近鄰居相似性越高就和目標(biāo)用戶越接近。所以用 sim(i,j)表示用戶戶 j 之間的相似性。用 m 維向量表示每個(gè)用戶對(duì)推薦對(duì)象的評(píng)分,用不同向量間的相似度度量用戶間的相似度,如圖 2.6 所示。用戶用戶+項(xiàng)目評(píng)價(jià)矩陣 尋找用戶最近鄰居對(duì)未評(píng)價(jià)項(xiàng)目評(píng)分尋找對(duì)象最近鄰居推薦評(píng)分最高的若干個(gè)項(xiàng)目IB-CF 過程
【參考文獻(xiàn)】:
期刊論文
[1]卷積神經(jīng)網(wǎng)絡(luò)概述[J]. 侯宇昆. 中國新通信. 2017(09)
[2]卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J]. 周飛燕,金林鵬,董軍. 計(jì)算機(jī)學(xué)報(bào). 2017(06)
[3]卷積神經(jīng)網(wǎng)絡(luò)的研究進(jìn)展綜述[J]. 楊斌,鐘金英. 南華大學(xué)學(xué)報(bào)(自然科學(xué)版). 2016(03)
[4]卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J]. 李彥冬,郝宗波,雷航. 計(jì)算機(jī)應(yīng)用. 2016(09)
[5]基于全文檢索的文本相似度算法應(yīng)用研究[J]. 王格,吳釗,李向. 計(jì)算機(jī)與數(shù)字工程. 2016(04)
[6]社交網(wǎng)站用戶興趣模型研究[J]. 徐曉彤,胡松筠. 科技和產(chǎn)業(yè). 2014(11)
[7]關(guān)聯(lián)爆發(fā)主題模式挖掘方法研究綜述[J]. 黃永文. 現(xiàn)代圖書情報(bào)技術(shù). 2012(10)
[8]LDA算法及其在人臉識(shí)別中的應(yīng)用[J]. 謝永林. 計(jì)算機(jī)工程與應(yīng)用. 2010(19)
[9]中文分詞算法研究[J]. 劉件,魏程. 微計(jì)算機(jī)應(yīng)用. 2008(08)
[10]網(wǎng)絡(luò)用戶信息獲取語言使用行為研究[J]. 賴茂生,屈鵬. 現(xiàn)代圖書情報(bào)技術(shù). 2008(06)
博士論文
[1]社會(huì)化電子商務(wù)用戶信息采納過程及影響因素研究[D]. 耿榮娜.吉林大學(xué) 2017
[2]基于用戶分解和社交融合的推薦算法研究[D]. 王智謹(jǐn).華東師范大學(xué) 2016
[3]融合新聞采集與呈現(xiàn)[D]. 劉冰.山東大學(xué) 2015
[4]個(gè)性化信息推薦中若干關(guān)鍵問題與技術(shù)研究[D]. 殷風(fēng)景.國防科學(xué)技術(shù)大學(xué) 2014
[5]基于面向?qū)ο笏枷牒偷湫陀脩羧航M的個(gè)性化推薦方法研究[D]. 譚昶.中國科學(xué)技術(shù)大學(xué) 2014
[6]Web導(dǎo)航中用戶認(rèn)知特征及行為研究[D]. 王秀峰.南京大學(xué) 2013
[7]文本分類中詞共現(xiàn)關(guān)系的研究及其應(yīng)用[D]. 章舜仲.南京理工大學(xué) 2010
[8]基于內(nèi)容相關(guān)度計(jì)算的文本結(jié)構(gòu)分析方法研究[D]. 鐘茂生.上海交通大學(xué) 2010
[9]我國網(wǎng)絡(luò)傳媒的文化產(chǎn)業(yè)經(jīng)營研究[D]. 詹恂.四川大學(xué) 2005
碩士論文
[1]基于用戶特征數(shù)據(jù)的內(nèi)容推薦方法的研究與應(yīng)用[D]. 曹建新.北方工業(yè)大學(xué) 2017
[2]實(shí)時(shí)新聞推薦系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 王珂.北京交通大學(xué) 2017
[3]基于主題模型與用戶興趣的個(gè)性化新聞推薦算法研究[D]. 司吉峰.西安電子科技大學(xué) 2015
[4]基于3G手機(jī)的個(gè)性化信息推薦系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 陳傳敬.中國石油大學(xué)(華東) 2014
[5]基于用戶情境的論壇個(gè)性化推薦模型研究[D]. 應(yīng)中運(yùn).西南大學(xué) 2014
[6]信息無障礙移動(dòng)推薦系統(tǒng)[D]. 鄧涵.西南財(cái)經(jīng)大學(xué) 2014
[7]Google和Yahoo的阿拉伯語搜索效果對(duì)比分析[D]. 孫舒.北京外國語大學(xué) 2013
[8]推薦系統(tǒng)中信息相似度的研究及其應(yīng)用[D]. 高鵬.上海交通大學(xué) 2013
[9]基于Web的用戶個(gè)性化服務(wù)研究[D]. 田鳳珍.河北農(nóng)業(yè)大學(xué) 2011
[10]基于Web2.0的個(gè)性化服務(wù)系統(tǒng)在電子商務(wù)中的應(yīng)用研究[D]. 張欣悅.中南林業(yè)科技大學(xué) 2011
本文編號(hào):3075029
【文章來源】:景德鎮(zhèn)陶瓷大學(xué)江西省
【文章頁數(shù)】:60 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
推薦系統(tǒng)的基本任務(wù)是聯(lián)系用戶和新聞內(nèi)容用戶
(1)用戶姓名和性別,年齡和職業(yè),學(xué)歷和收入等基本信息;(2)用戶通過輸入的關(guān)鍵詞、主題;用戶對(duì)自己喜歡的信息或不喜行標(biāo)注等自己的主動(dòng)提供的信息;(3)用戶在閱讀過程中對(duì)內(nèi)容進(jìn)行評(píng)論和分享,轉(zhuǎn)載和收藏等還,數(shù)、瀏覽時(shí)間和頻率等隱性信息[22];(4)推進(jìn)對(duì)象相關(guān)特點(diǎn)、屬性。根據(jù)信息的特點(diǎn),有些數(shù)據(jù)是穩(wěn)定的,有些數(shù)據(jù)是變化的,如何通用戶真正的興趣愛好是本模塊的難點(diǎn)。2.3 推薦對(duì)象模塊推薦對(duì)象模塊是根據(jù)推薦對(duì)象的特征建立對(duì)象特征模型,與需要推行比較,得出需要推薦的對(duì)象特征。2.3.1 推薦對(duì)象建模流程推薦對(duì)象建模過程如圖 2.4 所示
圖 2.5 基于用戶的協(xié)同過濾過程該推薦方法主要工作是找到最近鄰居并產(chǎn)生推薦;最近鄰居尋找是這里的和最近鄰居相似性越高就和目標(biāo)用戶越接近。所以用 sim(i,j)表示用戶戶 j 之間的相似性。用 m 維向量表示每個(gè)用戶對(duì)推薦對(duì)象的評(píng)分,用不同向量間的相似度度量用戶間的相似度,如圖 2.6 所示。用戶用戶+項(xiàng)目評(píng)價(jià)矩陣 尋找用戶最近鄰居對(duì)未評(píng)價(jià)項(xiàng)目評(píng)分尋找對(duì)象最近鄰居推薦評(píng)分最高的若干個(gè)項(xiàng)目IB-CF 過程
【參考文獻(xiàn)】:
期刊論文
[1]卷積神經(jīng)網(wǎng)絡(luò)概述[J]. 侯宇昆. 中國新通信. 2017(09)
[2]卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J]. 周飛燕,金林鵬,董軍. 計(jì)算機(jī)學(xué)報(bào). 2017(06)
[3]卷積神經(jīng)網(wǎng)絡(luò)的研究進(jìn)展綜述[J]. 楊斌,鐘金英. 南華大學(xué)學(xué)報(bào)(自然科學(xué)版). 2016(03)
[4]卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J]. 李彥冬,郝宗波,雷航. 計(jì)算機(jī)應(yīng)用. 2016(09)
[5]基于全文檢索的文本相似度算法應(yīng)用研究[J]. 王格,吳釗,李向. 計(jì)算機(jī)與數(shù)字工程. 2016(04)
[6]社交網(wǎng)站用戶興趣模型研究[J]. 徐曉彤,胡松筠. 科技和產(chǎn)業(yè). 2014(11)
[7]關(guān)聯(lián)爆發(fā)主題模式挖掘方法研究綜述[J]. 黃永文. 現(xiàn)代圖書情報(bào)技術(shù). 2012(10)
[8]LDA算法及其在人臉識(shí)別中的應(yīng)用[J]. 謝永林. 計(jì)算機(jī)工程與應(yīng)用. 2010(19)
[9]中文分詞算法研究[J]. 劉件,魏程. 微計(jì)算機(jī)應(yīng)用. 2008(08)
[10]網(wǎng)絡(luò)用戶信息獲取語言使用行為研究[J]. 賴茂生,屈鵬. 現(xiàn)代圖書情報(bào)技術(shù). 2008(06)
博士論文
[1]社會(huì)化電子商務(wù)用戶信息采納過程及影響因素研究[D]. 耿榮娜.吉林大學(xué) 2017
[2]基于用戶分解和社交融合的推薦算法研究[D]. 王智謹(jǐn).華東師范大學(xué) 2016
[3]融合新聞采集與呈現(xiàn)[D]. 劉冰.山東大學(xué) 2015
[4]個(gè)性化信息推薦中若干關(guān)鍵問題與技術(shù)研究[D]. 殷風(fēng)景.國防科學(xué)技術(shù)大學(xué) 2014
[5]基于面向?qū)ο笏枷牒偷湫陀脩羧航M的個(gè)性化推薦方法研究[D]. 譚昶.中國科學(xué)技術(shù)大學(xué) 2014
[6]Web導(dǎo)航中用戶認(rèn)知特征及行為研究[D]. 王秀峰.南京大學(xué) 2013
[7]文本分類中詞共現(xiàn)關(guān)系的研究及其應(yīng)用[D]. 章舜仲.南京理工大學(xué) 2010
[8]基于內(nèi)容相關(guān)度計(jì)算的文本結(jié)構(gòu)分析方法研究[D]. 鐘茂生.上海交通大學(xué) 2010
[9]我國網(wǎng)絡(luò)傳媒的文化產(chǎn)業(yè)經(jīng)營研究[D]. 詹恂.四川大學(xué) 2005
碩士論文
[1]基于用戶特征數(shù)據(jù)的內(nèi)容推薦方法的研究與應(yīng)用[D]. 曹建新.北方工業(yè)大學(xué) 2017
[2]實(shí)時(shí)新聞推薦系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 王珂.北京交通大學(xué) 2017
[3]基于主題模型與用戶興趣的個(gè)性化新聞推薦算法研究[D]. 司吉峰.西安電子科技大學(xué) 2015
[4]基于3G手機(jī)的個(gè)性化信息推薦系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 陳傳敬.中國石油大學(xué)(華東) 2014
[5]基于用戶情境的論壇個(gè)性化推薦模型研究[D]. 應(yīng)中運(yùn).西南大學(xué) 2014
[6]信息無障礙移動(dòng)推薦系統(tǒng)[D]. 鄧涵.西南財(cái)經(jīng)大學(xué) 2014
[7]Google和Yahoo的阿拉伯語搜索效果對(duì)比分析[D]. 孫舒.北京外國語大學(xué) 2013
[8]推薦系統(tǒng)中信息相似度的研究及其應(yīng)用[D]. 高鵬.上海交通大學(xué) 2013
[9]基于Web的用戶個(gè)性化服務(wù)研究[D]. 田鳳珍.河北農(nóng)業(yè)大學(xué) 2011
[10]基于Web2.0的個(gè)性化服務(wù)系統(tǒng)在電子商務(wù)中的應(yīng)用研究[D]. 張欣悅.中南林業(yè)科技大學(xué) 2011
本文編號(hào):3075029
本文鏈接:http://www.sikaile.net/xinwenchuanbolunwen/3075029.html
最近更新
教材專著