天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 搜索引擎論文 >

基于權(quán)重標(biāo)準(zhǔn)化SimRank方法的查詢擴(kuò)展技術(shù)研究

發(fā)布時(shí)間:2018-08-05 11:29
【摘要】:查詢擴(kuò)展是信息檢索中的一項(xiàng)重要技術(shù)。傳統(tǒng)的局部分析查詢擴(kuò)展方法利用偽相關(guān)文檔作為候選詞集合,然而部分偽相關(guān)文檔并不具有很高的相關(guān)性。該文利用真實(shí)的搜索引擎查詢?nèi)罩?建立了查詢點(diǎn)擊圖,經(jīng)過多次圖結(jié)構(gòu)的轉(zhuǎn)化得到能夠反映詞之間關(guān)聯(lián)程度的詞項(xiàng)關(guān)系圖,并在圖結(jié)構(gòu)的相似度算法SimRank的基礎(chǔ)上,提出了一種基于權(quán)重標(biāo)準(zhǔn)化的改進(jìn)SimRank方法,該方法利用詞項(xiàng)關(guān)系圖中詞項(xiàng)的全局和間接關(guān)系,能夠有效挖掘與原始查詢相關(guān)聯(lián)的擴(kuò)展詞。同時(shí),為降低SimRank算法的計(jì)算復(fù)雜度,該文采用了剪枝等策略進(jìn)行優(yōu)化,使得計(jì)算效率有大幅提高。在TREC標(biāo)準(zhǔn)數(shù)據(jù)集上的實(shí)驗(yàn)表明,該文的方法可以有效地選擇相關(guān)擴(kuò)展詞。MAP指標(biāo)較局部分析查詢擴(kuò)展方法提高了1.81%,在P@10和P@20指標(biāo)評(píng)價(jià)中效果分別提高了5.44%和3.73%。
[Abstract]:Query extension is an important technology in information retrieval. The traditional local analysis query expansion method uses pseudo-correlation documents as candidate word sets, but partial pseudo-correlation documents are not highly correlated. In this paper, the query click graph is established by using the real search engine query log, and the word item relation graph which can reflect the degree of correlation between words is obtained through the transformation of the structure of multiple graphs, and based on the similarity algorithm SimRank of the graph structure. An improved SimRank method based on weight standardization is proposed. By using the global and indirect relationships of the word items in the word term relational graph, the extended words associated with the original query can be effectively mined. At the same time, in order to reduce the computational complexity of the SimRank algorithm, the pruning strategy is used to optimize the algorithm, which greatly improves the computational efficiency. Experiments on the TREC standard data set show that the proposed method can effectively select the relative extension word .MAP index, which is 1.81% higher than that of the local analysis query extension method, and the effect is 5.44% and 3.73% higher in the evaluation of P10 and Papp20 indexes, respectively.
【作者單位】: 大連理工大學(xué)信息檢索研究室;
【基金】:國(guó)家自然科學(xué)基金資助項(xiàng)目(60673039,60973068) 國(guó)家社科基金資助項(xiàng)目(08BTQ025) 國(guó)家863高科技計(jì)劃資助項(xiàng)目(2006AA01Z151) 教育部留學(xué)回國(guó)人員科研啟動(dòng)基金 高等學(xué)校博士學(xué)科點(diǎn)專項(xiàng)科研基金資助項(xiàng)目(20090041110002)
【分類號(hào)】:TP391.3

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 李文駿;崔志明;;基于搜索引擎的Deep Web數(shù)據(jù)源發(fā)現(xiàn)技術(shù)[J];計(jì)算機(jī)技術(shù)與發(fā)展;2008年08期

2 李莉;高慶獅;;一種基于語(yǔ)義單元的查詢擴(kuò)展方法[J];計(jì)算機(jī)科學(xué);2008年02期

3 裴飛;洪宇;孫常龍;姚建民;朱巧明;;基于Web的查詢擴(kuò)展[J];電腦知識(shí)與技術(shù);2011年06期

4 馬云龍;林原;林鴻飛;;基于權(quán)重標(biāo)準(zhǔn)化SimRank方法的查詢擴(kuò)展技術(shù)研究[J];中文信息學(xué)報(bào);2011年01期

5 蔣輝;陽(yáng)小華;;基于文檔與搜索結(jié)果上下文的查詢擴(kuò)展方法[J];計(jì)算機(jī)應(yīng)用;2009年03期

6 牟力科;張蕾;張曉孿;;基于概念圖的用戶興趣查詢擴(kuò)展模型的研究[J];計(jì)算機(jī)工程與應(yīng)用;2008年06期

7 熊桂喜;王開鋒;;基于語(yǔ)義的查詢擴(kuò)展研究[J];微計(jì)算機(jī)信息;2008年30期

8 曹蓓蓓;信息檢索技術(shù)的設(shè)計(jì)探討[J];河北建筑科技學(xué)院學(xué)報(bào);2005年03期

9 李小琳;陸汝占;;基于日志挖掘的查詢概念圖擴(kuò)展[J];計(jì)算機(jī)應(yīng)用與軟件;2010年03期

10 黃曉冬;Invisible Web研究綜述[J];情報(bào)科學(xué);2004年09期

相關(guān)會(huì)議論文 前10條

1 鄧長(zhǎng)壽;郭景峰;楊焱林;鄧安遠(yuǎn);;下一代Web搜索引擎初探[A];第十八屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2001年

2 彭軻;廖聞劍;;淺析搜索引擎[A];中國(guó)通信學(xué)會(huì)第五屆學(xué)術(shù)年會(huì)論文集[C];2008年

3 羅偉;李陶深;;一種基于本體的個(gè)性化搜索引擎模型[A];廣西計(jì)算機(jī)學(xué)會(huì)2006年年會(huì)論文集[C];2006年

4 姚建民;孫俊;;基于搜索引擎查詢?cè)~分類擴(kuò)展的譯文挖掘[A];蘇州市自然科學(xué)優(yōu)秀學(xué)術(shù)論文匯編(2008-2009)[C];2010年

5 倪俊峰;;基于黃頁(yè)搜索引擎的關(guān)鍵字排名廣告系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[A];2005年中國(guó)索引學(xué)會(huì)年會(huì)暨學(xué)術(shù)研討會(huì)論文集[C];2005年

6 張怡;查貴庭;;SEO在信息服務(wù)中的應(yīng)用研究[A];2010年中國(guó)索引學(xué)會(huì)年會(huì)暨學(xué)術(shù)研討會(huì)論文集[C];2010年

7 陳援非;何哲;朱珍民;;基于普適計(jì)算的個(gè)性化搜索技術(shù)[A];第二屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2006)——第2屆中國(guó)普適計(jì)算學(xué)術(shù)會(huì)議(PCC'06)論文集[C];2006年

8 楊萌;李春麗;朱明;;網(wǎng)絡(luò)搜索技術(shù)下的編輯工作[A];學(xué)報(bào)編輯論叢(第十一集)[C];2003年

9 陳磊;茹立云;馬少平;;基于用戶日志挖掘的搜索引擎廣告效果分析[A];第四屆全國(guó)學(xué)生計(jì)算語(yǔ)言學(xué)研討會(huì)會(huì)議論文集[C];2008年

10 張志強(qiáng);孟慶海;謝曉芹;;個(gè)性化的社會(huì)標(biāo)簽查詢擴(kuò)展技術(shù)研究[A];NDBC2010第27屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集A輯二[C];2010年

相關(guān)重要報(bào)紙文章 前10條

1 博文邋譯;你的隱私 搜索引擎知道[N];計(jì)算機(jī)世界;2007年

2 楊潔;搜索引擎營(yíng)銷市場(chǎng)生變[N];中國(guó)計(jì)算機(jī)報(bào);2007年

3 劉文君;搜索引擎也在尋求創(chuàng)新[N];大眾科技報(bào);2007年

4 ;法國(guó)挑戰(zhàn)谷歌推出衛(wèi)星地圖搜索引擎[N];人民日?qǐng)?bào);2006年

5 MirrorCity.net技術(shù)總監(jiān) 姚浩;讓搜索引擎回歸最初夢(mèng)想[N];中國(guó)文化報(bào);2008年

6 本報(bào)記者 操秀英;國(guó)雙科技以技術(shù)加服務(wù)贏得市場(chǎng)[N];科技日?qǐng)?bào);2009年

7 趙敏;“魚群理論”破解搜索營(yíng)銷謎局[N];中國(guó)企業(yè)報(bào);2007年

8 本報(bào)記者 樊哲高;搜索引擎三國(guó)紛爭(zhēng) 中文市場(chǎng)兩軍對(duì)壘[N];中國(guó)電子報(bào);2009年

9 EndTo;優(yōu)化Meta討好搜索引擎[N];電腦報(bào);2009年

10 本報(bào)記者 馬文方;Yebol:從思維科學(xué)導(dǎo)出搜索引擎[N];中國(guó)計(jì)算機(jī)報(bào);2010年

相關(guān)博士學(xué)位論文 前10條

1 仲兆滿;事件本體及其在查詢擴(kuò)展中的應(yīng)用[D];上海大學(xué);2011年

2 岑榮偉;基于用戶行為分析的搜索引擎評(píng)價(jià)研究[D];清華大學(xué);2010年

3 李群;主題搜索引擎聚類算法的研究[D];北京林業(yè)大學(xué);2011年

4 蘇君華;面向搜索引擎的技術(shù)接受模型研究[D];南京大學(xué);2011年

5 劉佐達(dá);分布協(xié)作式搜索引擎模型及算法研究[D];清華大學(xué);2011年

6 陳旭毅;基于索引云的企業(yè)搜索引擎實(shí)現(xiàn)研究[D];武漢大學(xué);2011年

7 郭眈;中文互聯(lián)網(wǎng)視頻搜索引擎系統(tǒng)策略研究[D];北京交通大學(xué);2012年

8 王樹梅;信息檢索相關(guān)技術(shù)研究[D];南京理工大學(xué);2007年

9 李莎莎;面向搜索引擎的自然語(yǔ)言處理關(guān)鍵技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2011年

10 白玉琪;空間信息搜索引擎研究[D];中國(guó)科學(xué)院研究生院(遙感應(yīng)用研究所);2003年

相關(guān)碩士學(xué)位論文 前10條

1 盧葦;基于雙語(yǔ)翻譯搜索引擎的智能用戶接口的研究[D];武漢理工大學(xué);2009年

2 王倩;基于概念格的個(gè)性化搜索引擎查詢擴(kuò)展研究[D];北京郵電大學(xué);2008年

3 張柯;基于概念格的語(yǔ)義相關(guān)度計(jì)算及應(yīng)用[D];河南大學(xué);2007年

4 楊光偉;基于Lucene的個(gè)性化搜索引擎的研究與實(shí)現(xiàn)[D];內(nèi)蒙古大學(xué);2009年

5 王水利;基于互信息的語(yǔ)義查詢擴(kuò)展技術(shù)研究[D];河南科技大學(xué);2011年

6 方勇;基于語(yǔ)義的信息檢索方法研究與應(yīng)用[D];浙江大學(xué);2010年

7 李雷;基于Nutch的農(nóng)業(yè)信息搜索引擎實(shí)現(xiàn)和優(yōu)化[D];吉林大學(xué);2011年

8 崔琰;基于用戶興趣及術(shù)語(yǔ)關(guān)系的查詢擴(kuò)展方法[D];河北大學(xué);2011年

9 范丹;Web檢索中的查詢擴(kuò)展及結(jié)果聚類技術(shù)研究[D];遼寧師范大學(xué);2010年

10 周劍烽;基于語(yǔ)義本體的信息檢索方法的研究[D];杭州電子科技大學(xué);2010年



本文編號(hào):2165660

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/2165660.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶4eb5f***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com