基于搜索日志的圖文推薦系統(tǒng)設(shè)計與實現(xiàn)
本文關(guān)鍵詞:基于搜索日志的圖文推薦系統(tǒng)設(shè)計與實現(xiàn)
更多相關(guān)文章: 搜索日志 Hadoop 查詢推薦 推薦系統(tǒng)
【摘要】:隨著互聯(lián)網(wǎng)的廣泛使用,信息的獲取方式發(fā)生了巨大改變。互聯(lián)網(wǎng)帶來了信息交流成本的極大下降,人們能便捷的從網(wǎng)絡(luò)獲取各種各樣的信息。為了高效搜索信息,搜索引擎普遍為用戶提供相關(guān)搜索的服務(wù)。這種查詢推薦服務(wù)可以優(yōu)化用戶的檢索詞,提高搜索服務(wù)質(zhì)量,或者推薦新的搜索內(nèi)容發(fā)現(xiàn)用戶的興趣,從而實現(xiàn)個性化的搜索服務(wù)。這種相關(guān)搜索服務(wù)本質(zhì)上就是通過查詢推薦系統(tǒng)實現(xiàn)的。與其他推薦系統(tǒng)相比,查詢推薦系統(tǒng)的目標(biāo)在于推薦用戶感興趣的或是更清晰表達(dá)用戶意圖的檢索詞。本文設(shè)計和實現(xiàn)了一種基于搜索日志的圖文查詢推薦系統(tǒng)。不同于傳統(tǒng)的查詢推薦系統(tǒng),本文設(shè)計的查詢推薦系統(tǒng)的推薦結(jié)果不是簡單的文字信息,是將圖片和文字融合的圖文結(jié)果,推薦結(jié)果更具吸引力,具有更好的推薦效果是系統(tǒng)的一大特色。本文設(shè)計了一種利用多種搜索日志挖掘搜索推薦結(jié)果的算法,算法融合了基于點擊日志的URL共現(xiàn)算法、檢索詞相似度計算方法、Session日志切分等方法,達(dá)到了推薦出文字和圖片的圖文結(jié)果和擴(kuò)大查詢推薦覆蓋率的效果。系統(tǒng)主要包含三大數(shù)據(jù)處理模塊,圖文關(guān)聯(lián)模塊的功能是挖掘圖文關(guān)聯(lián)的優(yōu)質(zhì)種子數(shù)據(jù),推薦詞挖掘模塊是大規(guī)模挖掘具有相關(guān)性的query對,候選集擴(kuò)充模塊是用推薦詞關(guān)聯(lián)數(shù)據(jù)擴(kuò)充圖文關(guān)聯(lián)的優(yōu)質(zhì)數(shù)據(jù)。通過查詢推薦系統(tǒng)實際運(yùn)行的運(yùn)行日志和點擊信息,可以證明本文實現(xiàn)的圖文推薦算法是真實有效的,同時圖文推薦系統(tǒng)能滿足數(shù)據(jù)處理的實際需求。本論文從理論和實踐上證明了這種圖文推薦算法是有效的。
【關(guān)鍵詞】:搜索日志 Hadoop 查詢推薦 推薦系統(tǒng)
【學(xué)位授予單位】:大連理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP391.3
【目錄】:
- 摘要4-5
- Abstract5-8
- 1 緒論8-12
- 1.1 研究背景及意義8-9
- 1.2 國內(nèi)外相關(guān)研究9-10
- 1.3 論文主要工作10-11
- 1.4 論文章節(jié)安排11-12
- 2 相關(guān)技術(shù)介紹12-21
- 2.1 Hadoop12-13
- 2.1.1 HDFS12-13
- 2.1.2 YARN13
- 2.2 BigFlow13-15
- 2.3 推薦技術(shù)15-18
- 2.3.1 基于內(nèi)容的推薦16-17
- 2.3.2 基于知識的推薦17
- 2.3.3 協(xié)同過濾推薦17-18
- 2.4 搜索日志分析18-21
- 3 需求分析與算法設(shè)計21-35
- 3.1 需求分析21-28
- 3.1.1 業(yè)務(wù)理解21-22
- 3.1.2 搜索意圖22-25
- 3.1.3 搜索推薦25-27
- 3.1.4 功能性需求27-28
- 3.2 算法設(shè)計28-35
- 3.2.1 整體概述28-29
- 3.2.2 查詢點擊二部圖29-32
- 3.2.3 檢索詞的相似度計算32-35
- 4 詳細(xì)設(shè)計與實現(xiàn)35-51
- 4.1 圖文關(guān)聯(lián)模塊35-43
- 4.1.1 數(shù)據(jù)說明35-37
- 4.1.2 基于Hadoop的分布式實現(xiàn)37-42
- 4.1.3 高頻詞和低頻詞42-43
- 4.2 推薦詞挖掘模塊43-46
- 4.2.1 數(shù)據(jù)說明43-44
- 4.2.2 基于Hadoop的分布式實現(xiàn)44-46
- 4.3 候選集擴(kuò)充模塊46-51
- 4.3.1 數(shù)據(jù)說明46-48
- 4.3.2 基于BigFlow的分布式實現(xiàn)48-50
- 4.3.3 在線排序與反饋機(jī)制50-51
- 5 實驗與分析51-56
- 5.1 實驗51-54
- 5.1.1 實驗方法51
- 5.1.2 實驗結(jié)果51-54
- 5.2 分析54-56
- 5.2.1 存在的問題54-55
- 5.2.2 改進(jìn)的方向55-56
- 結(jié)論56-57
- 參考文獻(xiàn)57-59
- 致謝59-60
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 米可菲;張勇;邢春曉;蔚欣;;面向大數(shù)據(jù)的開源推薦系統(tǒng)分析[J];計算機(jī)與數(shù)字工程;2013年10期
2 脫建勇;王嵩;李秀;劉文煌;;精品課共享中的推薦系統(tǒng)框架與實現(xiàn)[J];計算機(jī)工程與設(shè)計;2006年17期
3 蘇冠賢;張麗霞;林丕源;劉吉平;;生物信息學(xué)推薦系統(tǒng)的設(shè)計與實現(xiàn)[J];計算機(jī)應(yīng)用研究;2007年05期
4 王改芬;;推薦系統(tǒng)研究綜述[J];軟件導(dǎo)刊;2007年23期
5 葉群來;;營銷與網(wǎng)絡(luò)推薦系統(tǒng)[J];電子商務(wù);2007年10期
6 李媚;;個性化網(wǎng)絡(luò)學(xué)習(xí)資源推薦系統(tǒng)研究[J];福建電腦;2008年12期
7 潘冉;姜麗紅;;基于經(jīng)濟(jì)學(xué)模型的推薦系統(tǒng)的研究[J];計算機(jī)應(yīng)用與軟件;2008年03期
8 劉魯;任曉麗;;推薦系統(tǒng)研究進(jìn)展及展望[J];信息系統(tǒng)學(xué)報;2008年01期
9 劉小燕;陳艷麗;賈宗璞;沈記全;;基于增強(qiáng)學(xué)習(xí)的旅行計劃推薦系統(tǒng)[J];計算機(jī)工程;2010年21期
10 曹畋;;智能推薦系統(tǒng)在知識瀏覽領(lǐng)域的應(yīng)用[J];硅谷;2011年21期
中國重要會議論文全文數(shù)據(jù)庫 前8條
1 張燕;李燕萍;;基于內(nèi)容分析和點擊率記錄的混合音樂推薦系統(tǒng)[A];2009年通信理論與信號處理學(xué)術(shù)年會論文集[C];2009年
2 趙欣;寇綱;鄔文帥;盧艷群;;基于時間密集性的推薦系統(tǒng)攻擊檢測[A];第六屆(2011)中國管理學(xué)年會論文摘要集[C];2011年
3 張玉連;張波;張敏;;改進(jìn)的個性化信息推薦系統(tǒng)的設(shè)計與實現(xiàn)[A];2005年全國理論計算機(jī)科學(xué)學(xué)術(shù)年會論文集[C];2005年
4 王君;許潔萍;;層次音樂推薦系統(tǒng)的研究[A];第18屆全國多媒體學(xué)術(shù)會議(NCMT2009)、第5屆全國人機(jī)交互學(xué)術(shù)會議(CHCI2009)、第5屆全國普適計算學(xué)術(shù)會議(PCC2009)論文集[C];2009年
5 潘宇;林鴻飛;楊志豪;;基于用戶聚類的電子商務(wù)推薦系統(tǒng)[A];第三屆學(xué)生計算語言學(xué)研討會論文集[C];2006年
6 尤忠彬;陳越;張英;朱揚(yáng)勇;;基于Web服務(wù)的技術(shù)轉(zhuǎn)移平臺推薦系統(tǒng)研究[A];第二十二屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2005年
7 王國霞;劉賀平;李擎;;二部圖影射及其在推薦系統(tǒng)中的應(yīng)用[A];第25屆中國控制與決策會議論文集[C];2013年
8 王雪;董愛華;吳怡之;;基于RFID技術(shù)的智能服裝推薦系統(tǒng)設(shè)計[A];2011年全國電子信息技術(shù)與應(yīng)用學(xué)術(shù)會議論文集[C];2011年
中國重要報紙全文數(shù)據(jù)庫 前2條
1 ;大數(shù)據(jù)如何“落地”[N];中國新聞出版報;2014年
2 本報記者 鄒大斌;大數(shù)據(jù):電商新武器[N];計算機(jī)世界;2012年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 周魏;推薦系統(tǒng)中基于目標(biāo)項目分析的托攻擊檢測研究[D];重慶大學(xué);2015年
2 田剛;融合維基知識的情境感知Web服務(wù)發(fā)現(xiàn)方法研究[D];武漢大學(xué);2015年
3 胡亮;集成多元信息的推薦系統(tǒng)建模方法的研究[D];上海交通大學(xué);2015年
4 孫麗梅;Web-based推薦系統(tǒng)中若干關(guān)鍵問題研究[D];東北大學(xué);2013年
5 王宏宇;商務(wù)推薦系統(tǒng)的設(shè)計研究[D];中國科學(xué)技術(shù)大學(xué);2007年
6 楊東輝;基于情感相似度的社會化推薦系統(tǒng)研究[D];哈爾濱工業(yè)大學(xué);2014年
7 曹渝昆;基于神經(jīng)網(wǎng)絡(luò)和模糊邏輯的智能推薦系統(tǒng)研究[D];重慶大學(xué);2006年
8 王立才;上下文感知推薦系統(tǒng)若干關(guān)鍵技術(shù)研究[D];北京郵電大學(xué);2012年
9 劉龍;一個能實現(xiàn)個性化實時路徑推薦服務(wù)的推薦系統(tǒng)框架[D];中國科學(xué)技術(shù)大學(xué);2014年
10 李濤;推薦系統(tǒng)中若干關(guān)鍵問題研究[D];南京航空航天大學(xué);2009年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 朱孔真;基于云計算的電子商務(wù)智能推薦系統(tǒng)研究[D];武漢理工大學(xué);2014年
2 郭敬澤;基于賦權(quán)評分和Dpark的分布式推薦系統(tǒng)研究與實現(xiàn)[D];天津理工大學(xué);2015年
3 周俊宇;信息推薦系統(tǒng)的研究與設(shè)計[D];江南大學(xué);2015年
4 李煒;基于電子商務(wù)平臺的保險推薦系統(tǒng)的設(shè)計與實現(xiàn)[D];復(fù)旦大學(xué);2013年
5 車豐;基于排序主題模型的論文推薦系統(tǒng)[D];大連海事大學(xué);2015年
6 秦大路;基于因式分解機(jī)模型的上下文感知推薦系統(tǒng)研究[D];鄭州大學(xué);2015年
7 徐霞婷;動態(tài)路網(wǎng)監(jiān)控與導(dǎo)航推薦系統(tǒng)的設(shè)計與實現(xiàn)[D];蘇州大學(xué);2015年
8 黃學(xué)峰;基于Hadoop的電影推薦系統(tǒng)研究與實現(xiàn)[D];南京師范大學(xué);2015年
9 路小瑞;基于Hadoop平臺的職位推薦系統(tǒng)的設(shè)計與實現(xiàn)[D];上海交通大學(xué);2015年
10 李愛寶;基于組合消費行為分析的團(tuán)購?fù)扑]系統(tǒng)的設(shè)計與實現(xiàn)[D];哈爾濱工業(yè)大學(xué);2015年
,本文編號:535761
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/535761.html