天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 搜索引擎論文 >

元搜索引擎排序方法建模與算法

發(fā)布時(shí)間:2016-08-15 13:01

  本文關(guān)鍵詞:元搜索引擎排序方法建模與算法研究,由筆耕文化傳播整理發(fā)布。


第39卷 第11A期2012年11月計(jì)算機(jī)科學(xué)

Comutercience。樱郑铮欤常梗危铮保保

Nov2012 

元搜索引擎排序方法建模與算法研究

劉勝久 李天瑞 賈 真 尹紅風(fēng)

()西南交通大學(xué)信息科學(xué)與技術(shù)學(xué)院 成都610031

 

摘 要 元搜索引擎的核心技術(shù)是排序算法。在研究元搜索引擎排序算法的基礎(chǔ)上,通過(guò)合理簡(jiǎn)化等一系列措施建立數(shù)學(xué)模型,抽象出元搜索引擎排序算法的基本框架。隨后結(jié)合各成員搜索引擎的市場(chǎng)份額及各成員搜索引擎的搜索結(jié)果,給出了一種新的元搜素引擎排序算法。該算法簡(jiǎn)單且易于實(shí)現(xiàn)。關(guān)鍵詞 搜索引擎,元搜索引擎,排序

中圖法分類(lèi)號(hào)。裕校常梗保场  ∥墨I(xiàn)標(biāo)識(shí)碼。痢

ResearchonModelinandAlorithmsforRankinAroachesofMetaSearchEnine        。纾纾纾穑穑纭 

LIUShenITianruiIAZhenIN Honfeniu。。獭。。省 。伲纾纾纾

(,,)SchoolofInformationScienceandTechnoloSouthwestJiaotonUniversitChendu610031,China      。纾纾纭

 

,Abstractheketechnoloofmetasearchenineisrankinalorithm.Basedontheresearchofrankinalorithms。浴          。纾纾纾纾纾纭   。鳎澹澹螅簦幔猓欤椋螅瑁幔颍澹幔螅铮睿幔猓欤澹恚幔簦瑁澹恚幔簦椋悖幔欤恚铮洌澹欤簦铮洌澹螅悖颍椋猓澹猓幔螅椋悖恚澹簦瑁铮洌螅铮妫颍幔睿耄椋睿幔欤铮颍椋簦瑁恚螅妫铮颍恚澹簦幔螅澹幔颍悖瑁澹睿椋睿濉              。纾纾纭。簦瑁颍铮酰瑁幔螅澹颍椋澹螅铮妫螅簦澹螅椋睿悖欤酰洌椋睿螅椋恚欤椋妫椋悖幔簦椋铮睿拢悖铮恚猓椋睿椋睿鳎椋簦瑁恚幔颍耄澹簦螅瑁幔颍澹螅幔睿洌螅澹幔颍悖瑁颍澹螅酰欤簦螅铮妫澹幔悖瑁螅澹幔颍悖瑁澹睢             。纾穑纾穑纭  ,inewethenrooseanewrankinalorithm。鳎瑁椋悖瑁椋螅螅椋恚欤澹幔睿洌澹幔螅簦铮椋恚欤澹恚澹睿簦         。纾穑穑纾纾穑稹 

,,KewordsearchenineMetasearchenineRank S  。纾纾

]在元搜索引擎研究方面,文獻(xiàn)[具體討論了中文元搜索3引擎成員搜索引擎的選擇策略,并指出為提高元搜索引擎的工作效率和檢準(zhǔn)率,所選擇的普通搜索引擎應(yīng)該質(zhì)量較高且比較穩(wěn)定,對(duì)綜合性搜索引擎應(yīng)考慮用戶(hù)認(rèn)可度,對(duì)專(zhuān)業(yè)搜索引擎應(yīng)考慮其領(lǐng)域特色,且將成員搜索引擎分組供用戶(hù)選擇,一方面使搜索更有針對(duì)性,另一方面也照顧了用戶(hù)的使用偏]好。文獻(xiàn)[對(duì)元搜索引擎資源選擇融合方法進(jìn)行研究,提出4了基于相關(guān)性與獨(dú)特性融合的資源選擇方法,給出了基于λ參數(shù)的線性融合算法,并具體說(shuō)明了λ參數(shù)的估值方法,所提方法較經(jīng)典的資源選擇方法在檢索性能上有一定程度的提]高。文獻(xiàn)[歸納出元搜索引擎系統(tǒng)合成算法的5個(gè)約束條5件:一般性約束條件、對(duì)等合成的約束條件、包含合成的約束條件、不相交合成的約束條件及交搭合成的約束條件。文獻(xiàn)[]提出了在考慮查詢(xún)關(guān)鍵字同獨(dú)立搜索引擎返回結(jié)果的相6

關(guān)性和搜索引擎數(shù)據(jù)庫(kù)的影響因子的情況下,加入用戶(hù)的反饋因素,使得搜索結(jié)果更貼近用戶(hù)的需要,并使排序的結(jié)果更]加優(yōu)化。文獻(xiàn)[利用貝葉斯規(guī)則,結(jié)合各組成系統(tǒng)平均執(zhí)行7推導(dǎo)出一種新的相關(guān)度計(jì)算公式,并提出了一種性能的信息,

新的基于概率模型的排序優(yōu)化方法,從而較好地解決了結(jié)果融合中相關(guān)度規(guī)范化和均衡化的問(wèn)題。文獻(xiàn)[討論了元搜8]索引擎涉及到的關(guān)鍵技術(shù),提出了采用基于概念分組的聚類(lèi)算法來(lái)解決作為元搜索引擎核心問(wèn)題的搜索結(jié)果合成的問(wèn)題。

本文擬通過(guò)對(duì)傳統(tǒng)及新近元搜索引擎排序算法的分析研究,抽象出元搜索引擎排序算法的數(shù)學(xué)模型,以更好地從理論

1 引言

搜索引擎的出現(xiàn)是時(shí)代的產(chǎn)物,是為了解決互聯(lián)網(wǎng)信息泛濫而出現(xiàn)的。所有搜索引擎的目的都是將互聯(lián)網(wǎng)上最符合用戶(hù)需求的信息按相關(guān)性大小返回給用戶(hù)。由于不同搜索引搜索結(jié)果也存在擎的搜索算法及采取的搜索策略不盡相同,

較大的差距。當(dāng)前,沒(méi)有一個(gè)搜索引擎能完全滿(mǎn)足所有用戶(hù)不

]1

同類(lèi)別的需求。搜索引擎的評(píng)測(cè)結(jié)果[也充分證明了這一點(diǎn)。

元搜索引擎可以視為搜索引擎的搜索引擎,其是伴隨著搜索引擎的涌現(xiàn)而發(fā)展起來(lái)的。元搜索引擎一般由3部分組成,,即搜索請(qǐng)求提交機(jī)制、搜索接口代理機(jī)制及搜索結(jié)果顯示機(jī)制。元搜索引擎的出現(xiàn)在一定程度上解決了需要連續(xù)使用不同獨(dú)立搜索引擎重復(fù)相同檢索的問(wèn)題。它通過(guò)同時(shí)對(duì)多個(gè)搜索引擎進(jìn)行檢索來(lái)獲得分級(jí)編排的排序結(jié)果。

元搜索引擎的核心是搜索前預(yù)處理和對(duì)搜索結(jié)果的集

2]

。搜索前預(yù)處理的主要目的是保證將查詢(xún)請(qǐng)求映射到對(duì)成[

搜應(yīng)搜索引擎的查詢(xún)請(qǐng)求時(shí)查詢(xún)信息不缺損。相比較而言,索結(jié)果的集成更為復(fù)雜。由于各個(gè)成員搜索引擎近乎獨(dú)立,因此元搜索引擎幾乎無(wú)法獲知它們的技術(shù)細(xì)節(jié)。如何將從多個(gè)成員搜索引擎檢索到的結(jié)果有機(jī)地融合在一起并按照一定以進(jìn)一步提高元搜索引擎的查的優(yōu)先關(guān)系排列顯示給用戶(hù),

準(zhǔn)率一直是元搜索引擎研究的重點(diǎn),F(xiàn)階段對(duì)元搜索引擎的研究主要集中在成員搜索引擎的選擇及優(yōu)先度系數(shù)的設(shè)置、成員搜索引擎中搜索結(jié)果相關(guān)性的確定及相關(guān)性融合算法的研究等4個(gè)方面。

),)本文受?chē)?guó)家自然科學(xué)基金委主任基金(中國(guó)科學(xué)院自動(dòng)化研究所復(fù)雜系統(tǒng)管理與控制重點(diǎn)實(shí)驗(yàn)室開(kāi)放課題(資助。6115200120110102,:,劉勝久(男,博士生,主要研究方向?yàn)閿?shù)據(jù)挖掘與知識(shí)發(fā)現(xiàn)等,李天瑞(男,教授,博士生導(dǎo)1988-)E-mailliusheniu2008@163.com;1969-)gj主要研究方向?yàn)閿?shù)據(jù)挖掘與知識(shí)發(fā)現(xiàn)、粗糙集與粒計(jì)算等。師,

·197·


  本文關(guān)鍵詞:元搜索引擎排序方法建模與算法研究,由筆耕文化傳播整理發(fā)布。



本文編號(hào):94585

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/94585.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)26c04***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com