穩(wěn)定的信息檢索方法及其在分布式環(huán)境下的應(yīng)用探究.pdf 全文免費(fèi)在線閱讀
本文關(guān)鍵詞:穩(wěn)定的信息檢索方法及其在分布式環(huán)境下的應(yīng)用,由筆耕文化傳播整理發(fā)布。
文檔介紹:
中國(guó)科學(xué)院研究生院博士學(xué)位論文穩(wěn)定的信息檢索方法及其在分布式環(huán)境下的應(yīng)用姓名:楊志峰申請(qǐng)學(xué)位級(jí)別:博士專業(yè):計(jì)算機(jī)科學(xué)與技術(shù)指導(dǎo)教師:白碩20030501摘要摘要隨著人類知識(shí)的增長(zhǎng)和網(wǎng)絡(luò)應(yīng)用的普及,以電子形式存在的自然語(yǔ)言信息的數(shù)量迅速膨脹。一力而,這種現(xiàn)象使人們可以方便快捷地獲取信息;另一方面,如果沒(méi)有合理的榆索手段,人們將很難充分地利用這些數(shù)據(jù)。信息檢索技術(shù)“J.以幫助人們有效地對(duì)大量文本數(shù)據(jù)進(jìn)行檢索。但是,由于目前尚未住自然語(yǔ)苦理解領(lǐng)域耿得突破,信息檢索方法主要利用統(tǒng)計(jì)手段。它常常依賴于特定的經(jīng)驗(yàn)參數(shù),參數(shù)優(yōu)化過(guò)程繁瑣,且不利用實(shí)際應(yīng)用。本文試圖尋找一種較為穩(wěn)定的文本檢索算法和WEB信息檢索方法,可以在不同的數(shù)據(jù)集和不同的檢索任務(wù)中都取得較好的檢索效果。同時(shí),它是一種平滑函數(shù),參數(shù)在一定范圍內(nèi)變動(dòng)時(shí)不會(huì)對(duì)結(jié)果造成劇烈的影響。利_|=瑪水文提出的檢索算法和過(guò)程,在2002年文本檢索會(huì)議(TREC)的WebTrack中取得了滿意的成績(jī),同時(shí)也在2001年TREC的數(shù)據(jù)集以及早期的數(shù)據(jù)集上取得了較好的效果。本文在TREC檢索任務(wù)及其相關(guān)性判定的基礎(chǔ)上,探討了利用遺傳算法改善檢索質(zhì)量和進(jìn)行參數(shù)優(yōu)化的可能性。在有相關(guān)性判定的遺傳算法中,通過(guò)謹(jǐn)慎地選擇遺傳...
內(nèi)容來(lái)自轉(zhuǎn)載請(qǐng)標(biāo)明出處.
本文關(guān)鍵詞:穩(wěn)定的信息檢索方法及其在分布式環(huán)境下的應(yīng)用,,由筆耕文化傳播整理發(fā)布。
本文編號(hào):186366
本文鏈接:http://www.sikaile.net/kejilunwen/xinxigongchenglunwen/186366.html