用戶興趣模型驅(qū)動(dòng)的個(gè)性化搜索引擎的研究和實(shí)現(xiàn)
本文關(guān)鍵詞:用戶興趣模型驅(qū)動(dòng)的個(gè)性化搜索引擎的研究和實(shí)現(xiàn),由筆耕文化傳播整理發(fā)布。
【摘要】:作為互聯(lián)網(wǎng)的重要入口,搜索引擎地位不言而喻而眾多搜索引擎有著同樣的外表,搜索結(jié)果嚴(yán)重同質(zhì)化個(gè)性化搜索引擎通過(guò)為用戶建立興趣模型并根據(jù)已獲得的用戶興趣特征及其歷史查詢對(duì)查詢?cè)~進(jìn)行優(yōu)化擴(kuò)展,為用戶返回量身定做的查詢結(jié)果,,成為搜索領(lǐng)域重要的研究趨勢(shì)針對(duì)個(gè)性化搜索引擎不能有效描述用戶興趣特征查詢擴(kuò)展會(huì)造成擴(kuò)展詞漂移2個(gè)關(guān)鍵科技問(wèn)題,論文主要研究工作如下: (1)在用戶興趣模型中,針對(duì)傳統(tǒng)的TF-IDF并未考慮到關(guān)鍵詞的位置會(huì)對(duì)其重要程度的影響,也未區(qū)分用戶對(duì)網(wǎng)頁(yè)的喜好程度論文提出了基于改進(jìn)TF-IDF的用戶興趣建模方法實(shí)驗(yàn)表明,改進(jìn)的建模方法不僅能夠?yàn)橛脩艚⑴d趣模型還能夠進(jìn)行實(shí)時(shí)的更新,能夠準(zhǔn)確描述用戶特征,符合為用戶建立興趣模型的要求 (2)在以往的查詢擴(kuò)展中,嚴(yán)重依賴初始查詢結(jié)果且需要用戶的參與,但是往往初始查詢結(jié)果的相關(guān)度并不高造成查詢擴(kuò)展的漂移,使查詢不準(zhǔn)確針對(duì)上述問(wèn)題提出了查詢擴(kuò)展的方法:利用用戶對(duì)于所查看網(wǎng)頁(yè)的興趣度等信息,選擇用戶興趣度的高的歷史查詢文件作為候選的查詢?cè)~文檔集,并結(jié)合用戶興趣模型對(duì)查詢?cè)~進(jìn)行擴(kuò)展實(shí)驗(yàn)表明,本文提出的方法在查詢時(shí)的平均準(zhǔn)確率比無(wú)擴(kuò)展的方法和基于局部上下文的查詢擴(kuò)展方法要高
【關(guān)鍵詞】:搜索引擎 用戶興趣模型 查詢擴(kuò)展 個(gè)性化
【學(xué)位授予單位】:湖南工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2014
【分類號(hào)】:TP391.3
【目錄】:
- 摘要4-5
- ABSTRACT5-8
- 第一章 緒論8-14
- 1.1 研究背景及意義8-9
- 1.2 搜索引擎的發(fā)展歷程9-10
- 1.3 個(gè)性化搜索引擎的國(guó)內(nèi)外研究現(xiàn)狀10-12
- 1.3.1 用戶興趣模型的研究現(xiàn)狀10-11
- 1.3.2 個(gè)性化搜索引擎系統(tǒng)的研究現(xiàn)狀11-12
- 1.4 論文主要內(nèi)容和結(jié)構(gòu)12-14
- 第二章 搜索引擎的相關(guān)理論和技術(shù)14-22
- 2.1 搜索引擎14-16
- 2.1.1 搜索引擎的工作原理14-15
- 2.1.2 搜索引擎的體系結(jié)構(gòu)15-16
- 2.1.3 搜索引擎的分類16
- 2.2 查詢擴(kuò)展技術(shù)16-18
- 2.3 經(jīng)典排序算法18-20
- 2.3.1 基于超鏈接的排序算法19
- 2.3.2 基于向量空間的排序算法19-20
- 2.4 個(gè)性化搜索引擎20-21
- 2.5 本章小結(jié)21-22
- 第三章 基于改進(jìn) TF-IDF 的用戶興趣建模及查詢擴(kuò)展22-40
- 3.1 用戶興趣模型22-23
- 3.2 改進(jìn)的用戶興趣建模23-29
- 3.2.1 數(shù)據(jù)獲取23-24
- 3.2.2 用戶興趣模型的表示24
- 3.2.3 用戶興趣的存儲(chǔ)24-25
- 3.2.4 基于線性回歸的網(wǎng)頁(yè)興趣度計(jì)算25-27
- 3.2.5 基于改進(jìn) TF-IDF 的查詢?cè)~權(quán)重計(jì)算27-28
- 3.2.6 基于改進(jìn) TF-IDF 的用戶興趣建模步驟28-29
- 3.3 用戶興趣模型的更新29-30
- 3.4 實(shí)驗(yàn)與分析30-33
- 3.5 個(gè)性化查詢擴(kuò)展33-38
- 3.5.1 基于用戶信息的查詢擴(kuò)展33-34
- 3.5.2 基于用戶興趣模型和歷史查詢?nèi)罩镜牟樵償U(kuò)展34-37
- 3.5.3 關(guān)鍵詞擴(kuò)展及實(shí)現(xiàn)37-38
- 3.6 本章小結(jié)38-40
- 第四章 原型系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)40-52
- 4.1 原型系統(tǒng)的設(shè)計(jì)40-43
- 4.2 系統(tǒng)環(huán)境的配置43
- 4.3 系統(tǒng)性能測(cè)試43-48
- 4.3.1 搜索引擎的評(píng)價(jià)標(biāo)準(zhǔn)43-45
- 4.3.2 系統(tǒng)性能檢測(cè)45-48
- 4.4 系統(tǒng)的運(yùn)行界面48-51
- 4.5 本章小結(jié)51-52
- 第五章 總結(jié)與展望52-54
- 參考文獻(xiàn)54-57
- 攻讀學(xué)位期間主要的研究成果57-58
- 致謝58
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 趙喜樂;陳光;;垂直搜索引擎的抓取系統(tǒng)——基于網(wǎng)絡(luò)蜘蛛技術(shù)[J];電腦知識(shí)與技術(shù);2009年19期
2 褚紅丹;焦素云;馬威;;用戶訪問(wèn)興趣路徑挖掘方法[J];計(jì)算機(jī)工程與應(yīng)用;2008年35期
3 趙銀春,付關(guān)友,朱征宇;基于Web瀏覽內(nèi)容和行為相結(jié)合的用戶興趣挖掘[J];計(jì)算機(jī)工程;2005年12期
4 黃名選;張師超;嚴(yán)小衛(wèi);;基于查詢行為和關(guān)聯(lián)規(guī)則的相關(guān)反饋查詢擴(kuò)展[J];計(jì)算機(jī)工程;2009年10期
5 朱鯤鵬;魏芳;;基于用戶日志挖掘的查詢擴(kuò)展方法[J];計(jì)算機(jī)應(yīng)用與軟件;2012年06期
6 張志強(qiáng);孟慶海;謝曉芹;;個(gè)性化的社會(huì)標(biāo)簽查詢擴(kuò)展技術(shù)研究[J];計(jì)算機(jī)科學(xué)與探索;2010年09期
7 宋迎迎;;基于用戶行為分析的個(gè)性化搜索引擎[J];新世紀(jì)圖書館;2013年05期
8 萇道方;鐘悅;;考慮行為和眼動(dòng)跟蹤的用戶興趣模型[J];河南科技大學(xué)學(xué)報(bào)(自然科學(xué)版);2014年01期
9 王園;;網(wǎng)絡(luò)環(huán)境下高校圖書館個(gè)性化信息服務(wù)研究[J];情報(bào)科學(xué);2011年08期
10 李學(xué)慶;劉瑞華;;一種基于本體論的用戶興趣模型構(gòu)建方法[J];情報(bào)探索;2010年06期
本文關(guān)鍵詞:用戶興趣模型驅(qū)動(dòng)的個(gè)性化搜索引擎的研究和實(shí)現(xiàn),由筆耕文化傳播整理發(fā)布。
本文編號(hào):349005
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/349005.html