面向不同對象的搜索引擎中的排序模型與性能評價
發(fā)布時間:2017-08-30 01:03
本文關(guān)鍵詞:面向不同對象的搜索引擎中的排序模型與性能評價
更多相關(guān)文章: 信息檢索 搜索引擎 對象級搜索 性能評價
【摘要】:目前,互聯(lián)網(wǎng)規(guī)模不斷擴(kuò)大,成為人們最重要的信息來源之一,但同時也出現(xiàn)了“信息過載”的問題,網(wǎng)絡(luò)上的信息增長速度過快,用戶獲取所需信息難度越來越大。因此,搜索引擎應(yīng)運而生。隨著搜索引擎的發(fā)展,目前有兩個重要的研究方向:其一,傳統(tǒng)搜索引擎是基于網(wǎng)頁的,而網(wǎng)絡(luò)上的信息承載方式已經(jīng)不僅限于傳統(tǒng)網(wǎng)頁,因此需要探索新的搜索引擎技術(shù);其二,搜索引擎層出不窮,質(zhì)量參差不齊,需要有一種合適的方式來評價搜索引擎的性能。本文主要貢獻(xiàn)有以下三點:第一,提出了一種新的對象級別搜索引擎的排序模型。本模型適用于多種對象存在的場合,是基于對象之間的鏈接關(guān)系的,從而具有通用性。第二,提出了UIG的概念。UIG與傳統(tǒng)的DCG相比,衡量的信息更為準(zhǔn)確。第三,提出了一種用于搜索引擎性能評價的搜索引擎的理想點擊分布族。在實際應(yīng)用中,可以通過搜索引擎的實際點擊數(shù)據(jù)擬合其參數(shù);同時,從實際點擊分布與理想點擊分布的差別上,可以反映出搜索引擎排序算法的缺陷與改進(jìn)方向。本文所提出的對象級搜索引擎排序模型,首先以對象鏈接圖為基礎(chǔ),計算單個對象對單個term的相關(guān)度,然后對多個term的相關(guān)度進(jìn)行合并。本模型在ACM Portal數(shù)據(jù)集上得到驗證取得較好效果。本文所提出的搜索引擎點擊分布模型,是從壽命分布中的威布爾分布出發(fā),并結(jié)合搜索引擎的特點加以修改所得。本模型在AOL、搜狗、微軟搜索引擎數(shù)據(jù)集上得到驗證取得較好效果。
【關(guān)鍵詞】:信息檢索 搜索引擎 對象級搜索 性能評價
【學(xué)位授予單位】:中國科學(xué)技術(shù)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP391.3
【目錄】:
- 摘要5-6
- ABSTRACT6-8
- 第1章 緒論8-20
- 1.1 引言8-9
- 1.2 研究背景9-16
- 1.2.1 信息檢索9-14
- 1.2.2 對象級別的搜索14-15
- 1.2.3 搜索引擎性能評價15-16
- 1.3 本文動因16-17
- 1.4 本文研究內(nèi)容與主要貢獻(xiàn)17-18
- 1.5 本文章節(jié)安排18-20
- 第2章 相關(guān)工作綜述20-28
- 2.1 引言20
- 2.2 傳統(tǒng)搜索引擎算法20-23
- 2.3 對象級搜索算法23-24
- 2.4 搜索引擎性能評價方法24-26
- 2.5 本章小結(jié)26-28
- 第3章 對象級搜索引擎的排序模型研究28-38
- 3.1 引言28-29
- 3.2 對象影響力計算29-31
- 3.3 單個查詢的相關(guān)度計算31-33
- 3.4 多個查詢的相關(guān)度合并33-34
- 3.5 實驗數(shù)據(jù)與結(jié)果34-36
- 3.5.1 單個查詢的性能對比34-35
- 3.5.2 多個查詢的合并性能對比35-36
- 3.6 本章小結(jié)36-38
- 第4章 搜索引擎性能評價38-54
- 4.1 引言38
- 4.2 搜索引擎性能評價標(biāo)準(zhǔn)38-40
- 4.3 搜索引擎中用戶點擊分布的理想模型40-46
- 4.3.1 搜索結(jié)果頁內(nèi)總點擊率的分布模型41-43
- 4.3.2 搜索結(jié)果頁內(nèi)每個文檔的點擊分布模型43-44
- 4.3.3 模型中的參數(shù)估計44-46
- 4.4 實驗結(jié)果46-52
- 4.4.1 搜索結(jié)果頁內(nèi)總點擊率擬合47-49
- 4.4.2 搜索結(jié)果頁中總點擊率擬合49-52
- 4.5 本章小結(jié)52-54
- 第5章 總結(jié)與展望54-56
- 參考文獻(xiàn)56-60
- 致謝60-62
- 在讀期間發(fā)表的學(xué)術(shù)論文與取得的其他研究成果62
本文編號:756391
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/756391.html
最近更新
教材專著