搜索引擎的相關(guān)性排序算法研究.pdf 全文
本文關(guān)鍵詞:搜索引擎的相關(guān)性排序算法研究,由筆耕文化傳播整理發(fā)布。
中國科學(xué)技術(shù)大學(xué)
碩士學(xué)位論文
搜索引擎的相關(guān)性排序算法研究
姓名:王黎
申請學(xué)位級別:碩士
專業(yè):模式識別與智能系統(tǒng)
指導(dǎo)教師:帥建梅
20100427
摘 要
摘 要
隨著計算機系統(tǒng)性能的提高和網(wǎng)絡(luò)技術(shù)的不斷進(jìn)步,萬維網(wǎng)成為全球最大的信
息資源庫,如何為如此龐大的信息資源提供高效的導(dǎo)航服務(wù),幫助用戶在海量的數(shù)
據(jù)中快速找到需要的信息是搜索引擎亟待解決的問題。通常用戶只關(guān)心搜索引擎返
回的排在前面的結(jié)果,然而當(dāng)前搜索引擎返回的查詢結(jié)果與用戶需求的相關(guān)程度并
不理想。于是搜索引擎的相關(guān)性排序--按照與用戶查詢的相關(guān)程度對搜索引擎的索
引文檔進(jìn)行排序,成為當(dāng)前研究的重點和熱點。
本文首先研究了文本搜索引擎的相關(guān)性排序模型,并為自學(xué)習(xí)排序模型提出一
種構(gòu)造訓(xùn)練集的方法。然后研究了圖像搜索引擎的相關(guān)性排序問題,重點介紹了圖
像重排序的方法,并提出一種度量圖像相似性的方法。本文對搜索引擎的相關(guān)性排
序方法進(jìn)行了深入的研究,主要工作和創(chuàng)新之處歸納為以下幾點:
(1) 文本搜索引擎的相關(guān)性排序模型,包括布爾模型,向量空間模型,概率模
型,超鏈接模型,自學(xué)習(xí)排序模型,其中自學(xué)習(xí)排序模型將機器學(xué)習(xí)的方法
運用到搜索引擎的相關(guān)性排序問題,解決了以往模型的許多不足之處。
(2) 為自學(xué)習(xí)排序模型構(gòu)造訓(xùn)練集。自學(xué)習(xí)排序是一種有監(jiān)督的機器學(xué)習(xí)算法,,
模型的性能很大程度上依賴訓(xùn)練集。構(gòu)造訓(xùn)練集
本文關(guān)鍵詞:搜索引擎的相關(guān)性排序算法研究,由筆耕文化傳播整理發(fā)布。
本文編號:99835
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/99835.html