天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

基于SLCS的元搜索去重技術(shù)研究

發(fā)布時(shí)間:2018-01-20 04:51

  本文關(guān)鍵詞: 網(wǎng)頁去重 元搜索引擎 LCS 特征碼 出處:《圖書情報(bào)工作》2010年15期  論文類型:期刊論文


【摘要】:針對元搜索結(jié)果中的網(wǎng)頁重復(fù)問題,把基于最長公共子序列(Longest Common Subsequence,簡稱LCS)的網(wǎng)頁去重方法應(yīng)用到元搜索引擎的去重中,提出基于SLCS(首字母S表示Summary)的元搜索去重方法。在獲得網(wǎng)頁文檔摘要后,根據(jù)查詢詞在語句中出現(xiàn)的次數(shù)和語句長度,計(jì)算摘要語句集合中每個(gè)語句權(quán)重,提取權(quán)重最大的語句作為網(wǎng)頁摘要特征語句,通過比較摘要特征語句間的LCS,計(jì)算出結(jié)果網(wǎng)頁相似性,以提高元搜索引擎的檢索質(zhì)量,實(shí)驗(yàn)表明該方法具有較高的準(zhǔn)確率。
[Abstract]:Aiming at the problem of web page repetition in meta search results, the longest Common Subsequence is based on the longest common subsequence. The method of web page de-reduplication based on LCSS is applied to the meta search engine. A new method based on SLCSS (S for Summary-based) is proposed. According to the number and length of the query words in the statement, the weight of each statement in the summary statement set is calculated, and the statement with the largest weight is extracted as the feature statement of the web page summary. By comparing the LCSs among abstract feature statements, the similarity of the result pages is calculated to improve the retrieval quality of the meta search engine. The experimental results show that this method has a high accuracy.
【作者單位】: 河南工業(yè)大學(xué)信息科學(xué)與工程學(xué)院;
【分類號】:TP391.3
【正文快照】: 元搜索引擎(Meta-search Engine)將用戶的查詢請求分發(fā)給多個(gè)獨(dú)立的成員搜索引擎,對搜索結(jié)果進(jìn)行融合處理,能夠較好地滿足用戶的查詢需求[1]。但是,查詢結(jié)果中會有一定程度的重復(fù),這種重復(fù)嚴(yán)重影響查詢結(jié)果的質(zhì)量。因此,如何高效去除元搜索引擎查詢結(jié)果中的重復(fù)網(wǎng)頁,是搜索引,

本文編號:1446916

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/1446916.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶47750***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com