天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 搜索引擎論文 >

搜索引擎的相關性排序算法研究92

發(fā)布時間:2016-11-17 09:40

  本文關鍵詞:搜索引擎的相關性排序算法研究,由筆耕文化傳播整理發(fā)布。


原始搜索結果進行重新排序,使新的序列更能滿足用戶;在以上圖像重排序算法中,圖像相似性的度量至關重要;5.2研究工作展望;目前大部分相關性算法研究都集中在通用搜索引擎,然;搜索引擎大多提供基于關鍵字的檢索,難以支持根據(jù)語;另外隨著多媒體的發(fā)展,視頻搜索是一個很有前景的研;參考文獻;[1]蘇新寧編著,信息檢索理論與技術,科學技術文;[2]章毓晉著,圖像處理和分析

原始搜索結果進行重新排序,使新的序列更能滿足用戶搜索需求。目前圖像重排序主要有基于虛相關反饋,基于信息瓶頸理論和基于圖理論的三類方法。

在以上圖像重排序算法中,圖像相似性的度量至關重要。通常,我們通過計算圖像視覺特征的相似性來估計圖像的相似性。圖像視覺特征包含全局特征(如顏色,紋理,形狀)和局部特征(如尺度不變特征)。然而現(xiàn)有的相似性度量沒有考慮針對不同的查詢詞,圖像的相似性應該不同。本文提出一種與查詢詞相關的相似性度量方法,把基于全局特征的相似性,基于局部特征的相似性,以及視覺單詞同時出現(xiàn)率融合到一個迭代算法中,挖掘出與查詢詞相關的圖像信息計算相似性。實驗結果表明我們提出的相似性度量方法優(yōu)于基于全局特征,局部特征,或它們線性組合的相似性。

5.2 研究工作展望

目前大部分相關性算法研究都集中在通用搜索引擎,然而不同領域、不同背景的用戶往往有不同的檢索目的和需求,根據(jù)通用搜索引擎的相關性算法返回的結果包含大量用戶不關心的網(wǎng)頁,通常不能滿足特定需求的用戶。比如,同樣是輸入關鍵詞輸入“bm25”,從事文本信息檢索研究的用戶希望了解排序函數(shù)Okapi BM25的具體算法,從事環(huán)境研究的用戶主要是想知道有關BM25氣體檢測儀的相關情況,而醫(yī)療工作者卻更希望了解BM25連續(xù)性腎臟治療機的相關情況。相同的查詢請求,不同的用戶意圖,搜索引擎很難準確判斷用戶需求。因此,對不同的領域開發(fā)不同的搜索引擎,認為針對特定領域,研究不同的相關性算法,能有效提高檢索準確度,提高用戶滿意度。

搜索引擎大多提供基于關鍵字的檢索,難以支持根據(jù)語義信息進行的查詢。當前特別突出的問題是,假如用戶使用的關鍵詞不恰當,即使存在需要的信息,也會導致用戶得不到相應的信息。由于語言本身的模糊性,語義信息特別豐富,如何判斷用戶意圖是搜索引擎中一個極有挑戰(zhàn)性的問題。

另外隨著多媒體的發(fā)展,視頻搜索是一個很有前景的研究領域。如何填補文本信息和視頻信息的語義鴻溝,找到適合視頻檢索的相關性排序算法,快速有效地檢索出用戶所需要的信息,是一個亟待解決的問題。

參考文獻

[1] 蘇新寧 編著,信息檢索理論與技術,科學技術文獻出版社,2004.

[2] 章毓晉 著,圖像處理和分析,清華大學出版社,1999.

[3] 章毓晉 著,基于內容的視覺信息檢索,科學出版社,2003.

[4]2. J. Lafferty, C. Zhai. Document Language Models, Query Models and Risk Minimization

for Information Retrieval. In ACM SIGIR, 2001.

[5]3. J.M. Ponte, W.B. Croft. A Language Modeling Approach to Information Retrieval. In

ACM SIGIR, 1998.

[6]1. S.E. Robertson, S. Walker, and S. Jones. Okapi at TREC-3. In Proceedings of the Third

Text Retrieval, 1994.

[7]4. P. Li, J.C. Burges, Q. Wu. McRank: Learning to Rank Using Multiple Classification and

Gradient Boosting. In NIPS, 2007.

[8]5. R.Herbrich, T.Graepel, K.Obermayer. Large Margin Rank Boundaries for Ordinal

Regression. MIT Press, Cambridge, 2000.

[9]6. M.F.Tsai, T.Y. Liu. FRank: A Ranking Method with Fidelity Loss. In ACM SIGIR, 2007.

[10]7. Y. Freund, R. Iyer, R.E. Schapire, and Y.Singer. An Efficient Boosting Algorithm for

Combining Preferences. In Journal of Machine Learning Research,1998.

[11]8. C. Burges, T. Shake, E. Renshaw, A. Lazier, and M. Deeds. Learning to Rank Using

Gradient Descent. In ICML, 2005.

[12]9.T. Joachims. Optimizing Search Engines using Clickthrough Data. In SIGKDD, 2002.

[13]10. Z. Cao, T. Qin, T.Y. Liu, M.F Tsai, and H. Li. Learning to Rank: From Pairwise

Approach to Listwise Approach. In Machine Learning, 2007.

[14]11. S. Tong, D. Koller. Support vector machine active learning with applications to text

classification. In JMLR, 2002.

[15]12. S.C. Townsend, Y. Zhou, and B.W. Croft. Predicting query performance. In ACM

SIGIR, 2002.

[16]13. Y. Freund, S.H. Seung, E. Shamir, and N. Tishby. Selective sampling using the query by

committee algorithm. In Machine Learning, 1997.

[17]14. M.G. Kendall. A new measure of rank correlation. In Biometrika, 1938.

[18]15. K. Jarvelin, J. Kekalainen. IR evaluation methods for retrieving highly relevant

documents. In ACM SIGIR, 2000.

[19] W.Y. Ma, H.J. Zhang. Benchmarking of image features for content-based retrieval. In

Conference Record of the Thirty-Second Asilomar Conference on Signals, Systems &Computers, 1998.

[20] T. Chang, C.C. Kuo. Texture analysis and classi?cation with tree-structured wavelet

transform. In IEEE Transactions on Image Processing, 1993.

[21] J. Huang, S.R. Kumar, M. Mitra, and W.J. Zhu. Image indexing using color correlograms.

In CVPR, 1997.

[22] D.K. Park, Y.S. Jeon, and C.S. Won. Efficient use of local edge histogram descriptor. In

ACM Multimedia, 2000.

[23] D.G. Lowe. Object recognition from local scale-invariant features. In ICCV, 1999.

[24] N.B. Haim, B. Babenko, and S. Belongie. Improving web-based image search via content

based clustering. In SLAM, 2006.

[25] R. Yan, E. Hauptmann, and R. Jin. Multimedia search with pseudo-relevance feedback. In

CIVR, 2003.

[26] W.H. Hsu, L.S. Kennedy, and S.F. Chang. Video search reranking via information

bottleneck principle. In ACM Multimedia, 2006.

[27] W.H. Hsu, L.S. Kennedy, and S.F. Chang. Video search reranking through random walk

over document-level context graph. In ACM Multimedia, 2007.

[28] H. Zitouni, S. Sevil, D. Ozkan, and P. Duygulu. Re-ranking of web image search results

using a graph algorithm. In ICPR, 2008.

[29] X. Tian, L. Yang, J. Wang, Y. Yang, X. Wu, and X.-S. Hua. Bayesian video search

reranking. In ACM Multimedia, 2008.

[30] Y. Jing, S. Baluja. Visualrank: Applying pagerank to large-scale image search. In IEEE

Transactions on Pattern Analysis and Machine Intelligence, 2008.

[31] R.L. Cilibrasi, P.M.B. Vitanyi. The google similarity distance. In IEEE Transactions on

Knowledge and Data Engineering, 2007.

[32] J. Yang, Y.G. Jiang, A.G. Hauptmann, and C.W. Ngo. Evaluating bag-of-visual-words

representations in scene classi?cation. In MIR, 2007.

[33] K.S. Jones. A statistical interpretation of term specificity and its application in retrieval. In

document retrieval systems, 1988.

[34] X.J. Wang, W.Y. Ma, G.R. Xue, and X. Li. Multi-model similarity propagation and its

application for web image retrieval. In ACM Multimedia, 2004.

[35] A.N. Langville, C.D. Meyer. Google's PageRank and Beyond: the science of search engine

rankings. In Mathematical Intelligencer, 2008.

[36] C. Ding, X. He, P. Husbands, and H. Zha. PageRank HITS and a unified framework for link

analysis. In ACM SIGIR, 2002.

致 謝

在研究學習期間,我有幸得到了三位老師的教導,他們是:我的導

師,中國科大周逸峰研究員,中科院昆明動物所馬原野研究員以及美國猶他大學的王永昌老師。三位老師深厚的學術功底,嚴謹?shù)墓ぷ鲬B(tài)度和敏銳的科學洞察力使我受益良多。衷心感謝他們多年來給予我的悉心教導和熱情幫助。

感謝李祥瑞老師在實驗方面的指導以及猶他大學Audie Leventhal教

授、動物所陳南輝教師的幫助?拼蟮娜~翔、楊贇同學和昆明動物所的王秀松、付玉和張潔同學參與了部分試驗工作,在此深表謝意。

……

最后,謹以此文獻給我的父親和母親。

2005年6月

在讀期間發(fā)表的學術論文與取得的研究成果

在讀期間發(fā)表的學術論文與取得的研究成果

已發(fā)表論文:

[1]王黎,帥建梅.文本搜索排序中構造訓練集的一種方法. 計算機系統(tǒng)應用.

[2] 王黎,帥建梅. 圖像重排序中與查詢相關的圖像相似性度量. 計算機系統(tǒng)應用.

55

 

 

下載地址:搜索引擎的相關性排序算法研究92.Doc

  【】

最新搜索

搜索引擎的相關性排序算法研究

98展望未來2 習題Unit 4

72每朵花都有自己的春天鳳凰 閱讀答案

溜子司機操作規(guī)程29

廣西最大的投資來源地是()、

QXDM基本功能及使用方法41

50心內科英文病歷模板

98禁令規(guī)范心得

第14課 漢代的文化與科技導學案01

文山67


  本文關鍵詞:搜索引擎的相關性排序算法研究,,由筆耕文化傳播整理發(fā)布。



本文編號:178633

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/178633.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶9fbbc***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com