基于Wikidata和標(biāo)簽云的搜索算法研究
發(fā)布時間:2017-08-20 02:18
本文關(guān)鍵詞:基于Wikidata和標(biāo)簽云的搜索算法研究
更多相關(guān)文章: 知識庫 Wikidata 網(wǎng)頁檢索 頁面排序 標(biāo)簽云 搜索引擎
【摘要】:知識庫是一種結(jié)構(gòu)化、易于操作、有組織的知識集群。針對Wikidata這一開放知識庫的內(nèi)容及結(jié)構(gòu),提出一種構(gòu)建標(biāo)簽云的方法,對信息進行標(biāo)簽化處理,并將轉(zhuǎn)換得到的標(biāo)簽向量應(yīng)用于信息檢索和頁面排序。首先,提取Wikidata中的結(jié)構(gòu)化數(shù)據(jù),構(gòu)建以實體為單位的標(biāo)簽云;然后,將需要檢索的文檔和用戶的檢索語句映射為相應(yīng)的標(biāo)簽,并采用處理向量的相關(guān)方法實現(xiàn)網(wǎng)頁的排序算法;最后,采用信息檢索常用的標(biāo)準(zhǔn)對該算法進行驗證。實驗結(jié)果表明,與傳統(tǒng)的基于關(guān)鍵詞的搜索方法相比,新算法在一定程度上能夠提高頁面排序的準(zhǔn)確率。
【作者單位】: 吉林大學(xué)計算機科學(xué)與技術(shù)學(xué)院;
【關(guān)鍵詞】: 知識庫 Wikidata 網(wǎng)頁檢索 頁面排序 標(biāo)簽云 搜索引擎
【分類號】:TP391.3
【正文快照】: 0引言信息呈現(xiàn)幾何式爆炸增長,面對如此龐大的信息數(shù)量,搜索引擎成為互聯(lián)網(wǎng)的絕佳入口。目前主流的搜索引擎算法仍以關(guān)鍵詞的匹配程度檢索,但是相同的詞語在不同的語境中有著不同的意義,而不同的人對同樣的詞語也會有不同的理解,因此簡單地基于關(guān)鍵詞的搜索引擎既不能識別出關(guān),
本文編號:704147
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/704147.html
最近更新
教材專著