搜索結果多樣化研究綜述
發(fā)布時間:2022-10-09 15:25
基于傳統信息檢索技術的搜索引擎一般按照用戶提交的查詢獲得一系列搜索結果,經過相關性排序之后返回給用戶.相關研究表明,用戶提交給搜索引擎的查詢通常是短查詢,且經常具有歧義性和寬泛性.另外,不同的用戶在使用同一個查詢詞時,其查詢需求也往往是不同的.此時若搜索引擎只進行相關性排序,則會面臨搜索結果冗余性過大、無法有效覆蓋用戶意圖的問題,對用戶體驗產生負面影響.為了滿足用戶需求,現有的搜索引擎在搜索排序過程中必須有效應對查詢歧義性問題.搜索結果多樣化是解決這個問題的方法之一,其目標是盡量提升搜索結果的多樣性,讓搜索結果盡可能多地覆蓋不同用戶的查詢意圖,以確保至少有一個結果可以命中實際的用戶需求.和傳統的搜索排序模型僅考慮文檔和查詢的相關性不同,多樣化排序模型還需要進一步考慮文檔的新穎性或者結果集對不同用戶意圖的覆蓋度.現有的多樣化算法,根據是否顯式地衡量查詢包含潛在用戶意圖所對應的子話題,可以分為隱式多樣化模型和顯式多樣化模型.隱式多樣化模型通常只考慮文檔之間的相似性,即認為一份結果文檔集中的每一個結果文檔,彼此之間的不相似度越高,多樣化程度越高;而顯式多樣化模型則顯式地考慮不同查詢所對應的不...
【文章頁數】:23 頁
【文章目錄】:
1 引言
2 搜索結果多樣化的定義
(1)基于內容(Content-based)的定義
(2)基于新穎性(Novelty-based)的定義
(3)基于覆蓋度(Coverage-based)的定義
3 搜索結果多樣化算法
3.1 隱式多樣化排序方法
3.2 顯式多樣化排序方法
3.2.1 顯式多樣化排序的子話題抽取
3.2.2 顯式多樣化排序模型
3.2.2. 1 xQuAD模型
3.2.2. 2 PM2模型
3.2.2. 3 基于子話題多層級分類方法的HxQuAD和HPM2模型
3.2.2. 4 針對短文本流的多樣化
3.3 基于監(jiān)督式學習的多樣化排序模型
3.3.1 學習式排序模型概述
3.3.2 關系排序模型(R-LTR)與PAMM模型
3.3.3 使用神經張量網絡(NTN)抽取新穎性特征
3.3.4 基于注意力機制的顯式多樣化學習方法
3.3.5 小結
3.4 將強化學習應用到搜索結果多樣化中
3.5 搜索結果個性多樣化
4 搜索結果多樣化的主要評價指標
5 搜索結果多樣化實驗結果與分析
6 搜索結果多樣化在實際部署的大型分布式系統中的性能評估
7 未來研究方向
Background
本文編號:3688887
【文章頁數】:23 頁
【文章目錄】:
1 引言
2 搜索結果多樣化的定義
(1)基于內容(Content-based)的定義
(2)基于新穎性(Novelty-based)的定義
(3)基于覆蓋度(Coverage-based)的定義
3 搜索結果多樣化算法
3.1 隱式多樣化排序方法
3.2 顯式多樣化排序方法
3.2.1 顯式多樣化排序的子話題抽取
3.2.2 顯式多樣化排序模型
3.2.2. 1 xQuAD模型
3.2.2. 2 PM2模型
3.2.2. 3 基于子話題多層級分類方法的HxQuAD和HPM2模型
3.2.2. 4 針對短文本流的多樣化
3.3 基于監(jiān)督式學習的多樣化排序模型
3.3.1 學習式排序模型概述
3.3.2 關系排序模型(R-LTR)與PAMM模型
3.3.3 使用神經張量網絡(NTN)抽取新穎性特征
3.3.4 基于注意力機制的顯式多樣化學習方法
3.3.5 小結
3.4 將強化學習應用到搜索結果多樣化中
3.5 搜索結果個性多樣化
4 搜索結果多樣化的主要評價指標
5 搜索結果多樣化實驗結果與分析
6 搜索結果多樣化在實際部署的大型分布式系統中的性能評估
7 未來研究方向
Background
本文編號:3688887
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/3688887.html
教材專著