天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

農(nóng)業(yè)搜索引擎倒排索引緩沖機(jī)制研究

發(fā)布時(shí)間:2018-04-15 08:23

  本文選題:農(nóng)業(yè)搜索引擎 + 倒排索引; 參考:《新疆農(nóng)業(yè)大學(xué)學(xué)報(bào)》2011年02期


【摘要】:為了解決ASPSeek倒排索引直接采用操作系統(tǒng)文件緩沖訪問機(jī)制帶來的效率問題,本研究以125萬張中文農(nóng)業(yè)網(wǎng)頁為樣本,采用塊大小可變的倒排索引存儲(chǔ)結(jié)構(gòu),設(shè)計(jì)了基于LRU、MRU、LFU、MFU、Clock、Random、FPA替代策略的專用緩沖管理機(jī)制。對這7種替代策略的緩沖命中率及查詢訪問時(shí)間對比測試表明,當(dāng)所有詞條以相同的概率進(jìn)行檢索時(shí),Clock算法為較好的緩沖替代策略,當(dāng)詞條以特定差別概率進(jìn)行檢索時(shí),本研究提出的FPA算法為較好的緩沖替代策略。
[Abstract]:In order to solve the efficiency problem caused by the ASPSeek inverted index directly using the operating system file buffer access mechanism, this study takes 1.25 million Chinese agricultural web pages as samples and adopts a variable block size inverted index storage structure.A special buffer management mechanism based on LRUU MRU LFU MFU ClockClockFPA replacement strategy is designed.A comparative test of buffering hit ratio and query access time of the seven alternatives shows that when all the entries are retrieved with the same probability, the clock algorithm is a better buffer substitution strategy, and when the entries are retrieved with a specific difference probability,The proposed FPA algorithm is a better buffer substitution strategy.
【作者單位】: 新疆農(nóng)業(yè)大學(xué)計(jì)算機(jī)與信息工程學(xué)院;中國農(nóng)業(yè)大學(xué)信息與電氣工程學(xué)院;新疆維吾爾自治區(qū)招生辦公室;
【基金】:新疆維吾爾自治區(qū)科技攻關(guān)項(xiàng)目(200931103)
【分類號(hào)】:TP391.3

【參考文獻(xiàn)】

相關(guān)期刊論文 前6條

1 張震波;楊鶴標(biāo);馬振華;;基于LRU算法的Web系統(tǒng)緩存機(jī)制[J];計(jì)算機(jī)工程;2006年19期

2 劉小珠;彭智勇;陳旭;;高效的隨機(jī)訪問分塊倒排文件自索引技術(shù)[J];計(jì)算機(jī)學(xué)報(bào);2010年06期

3 欒華;杜小勇;馮玉;王珊;;關(guān)系數(shù)據(jù)庫緩沖區(qū)置換策略的性能評測(英文)[J];計(jì)算機(jī)科學(xué)與探索;2008年02期

4 周鵬;吳華瑞;趙春江;楊寶祝;朱華吉;;基于Nutch農(nóng)業(yè)搜索引擎的研究與設(shè)計(jì)[J];計(jì)算機(jī)工程與設(shè)計(jì);2009年03期

5 韓向春;邊瑋;沈峰;樊書娟;;代理緩存替換一致性算法的研究[J];計(jì)算機(jī)工程與設(shè)計(jì);2009年11期

6 吳文娟;車明;;搜索引擎倒排索引技術(shù)的改進(jìn)[J];微處理機(jī);2006年06期

【共引文獻(xiàn)】

相關(guān)期刊論文 前10條

1 彭玉容;楊捧;高媛;;農(nóng)業(yè)搜索引擎的發(fā)展現(xiàn)狀及關(guān)鍵技術(shù)研究[J];安徽農(nóng)業(yè)科學(xué);2010年20期

2 常燕;劉純波;梁星濤;劉素紅;;應(yīng)用于村鎮(zhèn)信息自助平臺(tái)的電子地圖構(gòu)件關(guān)鍵技術(shù)研究[J];地理信息世界;2009年06期

3 李超;黃桂敏;賓辰忠;;一種基于改進(jìn)LRU的P2P緩存機(jī)制[J];桂林電子科技大學(xué)學(xué)報(bào);2011年03期

4 付光;;面向招聘信息主題搜索引擎的研究與設(shè)計(jì)[J];廣西教育;2011年18期

5 張琦;王梅;樂嘉錦;劉國華;;列存儲(chǔ)數(shù)據(jù)倉庫查詢執(zhí)行中重用緩沖區(qū)調(diào)度算法[J];計(jì)算機(jī)研究與發(fā)展;2011年10期

6 孔云;楊婷;;開源信息檢索技術(shù)在高校圖書館的應(yīng)用——以昆明理工大學(xué)圖書館為例[J];湖南科技學(xué)院學(xué)報(bào);2011年08期

7 王遠(yuǎn)定;梁久禎;;利用關(guān)鍵詞倒排表實(shí)時(shí)檢索中文網(wǎng)頁[J];計(jì)算機(jī)工程與應(yīng)用;2010年28期

8 楊溢;王志良;王魯;張富深;;面向智能空間的異構(gòu)網(wǎng)絡(luò)同構(gòu)化通信框架[J];計(jì)算機(jī)科學(xué);2012年04期

9 張璞;;基于Oracle DCN的緩存一致性技術(shù)[J];計(jì)算機(jī)工程;2008年22期

10 周進(jìn)剛;邢鐵軍;紀(jì)勇;趙大哲;;一種結(jié)構(gòu)化數(shù)據(jù)緩存方法[J];計(jì)算機(jī)工程;2010年20期

相關(guān)會(huì)議論文 前1條

1 ;A Method for Building the Index Dictionary Files on Domain-specific Search Engine[A];中國自動(dòng)化學(xué)會(huì)控制理論專業(yè)委員會(huì)B卷[C];2011年

相關(guān)碩士學(xué)位論文 前10條

1 徐萬錦;基于Ad Hoc網(wǎng)絡(luò)的移動(dòng)P2P系統(tǒng)協(xié)同緩存研究[D];西安電子科技大學(xué);2009年

2 席敏;基于單漢字索引的全文檢索系統(tǒng)的研究與實(shí)現(xiàn)[D];西安電子科技大學(xué);2010年

3 尉建興;基于Lucene搜索引擎的研究與應(yīng)用[D];太原理工大學(xué);2011年

4 王洋;軍隊(duì)科技成果知識(shí)共享管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];吉林大學(xué);2011年

5 李帥;基于語義相似度的查詢擴(kuò)展優(yōu)化[D];杭州電子科技大學(xué);2011年

6 李春豐;面向動(dòng)態(tài)文本的在線索引若干問題研究[D];廣東工業(yè)大學(xué);2011年

7 薛煜陽;農(nóng)業(yè)搜索引擎倒排索引緩沖機(jī)制研究[D];新疆農(nóng)業(yè)大學(xué);2011年

8 陳車前;基于Nutch的并行搜索系統(tǒng)的優(yōu)化設(shè)計(jì)[D];華南理工大學(xué);2011年

9 董長春;基于Hadoop的倒排索引技術(shù)的研究[D];遼寧大學(xué);2011年

10 陳必坤;基于Nutch的圖情博客搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)[D];鄭州大學(xué);2011年

【二級(jí)參考文獻(xiàn)】

相關(guān)期刊論文 前10條

1 王書芹;姜秀柱;徐敏;;不同代理緩存一致性技術(shù)中的網(wǎng)絡(luò)流量[J];福建電腦;2007年07期

2 張國印,陳先,皮鵬;基于詞頻統(tǒng)計(jì)的個(gè)性化信息過濾技術(shù)[J];哈爾濱工程大學(xué)學(xué)報(bào);2003年01期

3 郭來德;劉輝林;劉蘭哲;王光興;;農(nóng)業(yè)信息搜索引擎設(shè)計(jì)與實(shí)現(xiàn)[J];河北工程大學(xué)學(xué)報(bào)(自然科學(xué)版);2007年03期

4 王本年,曹先彬;一種域分布式合作Web緩存系統(tǒng)[J];計(jì)算機(jī)研究與發(fā)展;2002年03期

5 楊春貴;吳產(chǎn)樂;彭鴻雁;;一種有效的Web代理緩存替換算法[J];計(jì)算機(jī)工程;2007年03期

6 胡濤;路紅英;;基于Nutch的搜索引擎的研究[J];計(jì)算機(jī)時(shí)代;2007年01期

7 楊鴻雁,尚俊平,徐延華,王萌,張宇;農(nóng)業(yè)專業(yè)搜索引擎建設(shè)探討[J];農(nóng)業(yè)圖書情報(bào)學(xué)刊;2005年04期

8 劉小珠;彭智勇;;全文索引技術(shù)時(shí)空效率分析[J];軟件學(xué)報(bào);2009年07期

9 李世明;趙恒永;李世友;;專題搜索引擎中信息過濾的研究與實(shí)現(xiàn)[J];計(jì)算機(jī)工程與設(shè)計(jì);2006年08期

10 張超群;李陶深;張?jiān)龇?;自適應(yīng)一致性替換算法的設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)工程與設(shè)計(jì);2007年07期

相關(guān)碩士學(xué)位論文 前1條

1 蘇曉珂;基于Nutch的主題爬蟲研究與實(shí)現(xiàn)[D];昆明理工大學(xué);2007年

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 吳恒山,劉興宇,左瓊;一種基于可擴(kuò)展散列表的倒排索引更新策略[J];計(jì)算機(jī)工程;2004年08期

2 王智強(qiáng),劉建毅;一種實(shí)時(shí)更新索引結(jié)構(gòu)的設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)系統(tǒng)應(yīng)用;2005年10期

3 王宏宇;;基于Native-XML數(shù)據(jù)庫倒排索引算法研究[J];情報(bào)科學(xué);2006年07期

4 蘇潭英;郭憲勇;金鑫;;一種基于Lucene的中文全文檢索系統(tǒng)[J];計(jì)算機(jī)工程;2007年23期

5 黃少林;王華;張玉紅;蔣一峰;;基于Lucene的索引系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];現(xiàn)代情報(bào);2009年07期

6 王濤;吳潔明;;搜索引擎建立倒排索引的算法研究[J];現(xiàn)代計(jì)算機(jī)(專業(yè)版);2008年01期

7 王路芳;張虎;;一種面向搜索引擎的基于集合模型的搜索算法[J];山西農(nóng)業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版);2009年06期

8 吐爾洪·吾司曼;維尼拉·木沙江;;維、哈、柯多語種搜索引擎中索引器的研究[J];新疆大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年02期

9 余淼;楊丹;趙俊芹;;垂直搜索引擎的關(guān)鍵技術(shù)研究[J];軟件導(dǎo)刊;2007年23期

10 寧可為;;自動(dòng)答疑系統(tǒng)知識(shí)庫文本的索引研究[J];電腦知識(shí)與技術(shù);2009年35期

相關(guān)會(huì)議論文 前10條

1 劉小珠;孫莎;曾承;彭智勇;;基于緩存的倒排索引機(jī)制研究[A];第二十四屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2007年

2 李棟;史曉東;;對搜索引擎中倒排索引更新策略的研究和改進(jìn)[A];第二十二屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2005年

3 董祥千;左志宏;劉強(qiáng)國;;Lucene倒排索引文件的實(shí)現(xiàn)與優(yōu)化[A];四川省通信學(xué)會(huì)2006年學(xué)術(shù)年會(huì)論文集(二)[C];2006年

4 辛欣;李涓子;;基于Java語言全文信息檢索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[A];促進(jìn)企業(yè)信息化進(jìn)程——第十屆中國Java技術(shù)及應(yīng)用大會(huì)文集[C];2007年

5 維尼拉·木沙江;吳俊森;吐爾根·依布拉音;;維吾爾文搜索引擎的倒排索引設(shè)計(jì)與實(shí)現(xiàn)[A];民族語言文字信息技術(shù)研究——第十一屆全國民族語言文字信息學(xué)術(shù)研討會(huì)論文集[C];2007年

6 孫宇;劉憬;張宇;劉挺;;基于分詞和倒排索引的短文本檢索技術(shù)的研究與實(shí)現(xiàn)[A];黑龍江省計(jì)算機(jī)學(xué)會(huì)2007年學(xué)術(shù)交流年會(huì)論文集[C];2007年

7 李遠(yuǎn)寧;劉汀;蔣樹強(qiáng);黃慶明;;基于“Bag of Words”的視頻匹配方法[A];全國網(wǎng)絡(luò)與信息安全技術(shù)研討會(huì)論文集(下冊)[C];2007年

8 李勇;陳文斌;;嵌入式平臺(tái)上的地址搜索[A];中國地理信息系統(tǒng)協(xié)會(huì)第四次會(huì)員代表大會(huì)暨第十一屆年會(huì)論文集[C];2007年

9 吐爾地·托合提;維尼拉·木沙江;艾斯卡爾·艾木都拉;;維、哈、柯全文搜索引擎中查詢處理研究與實(shí)現(xiàn)[A];第四屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集(上)[C];2008年

10 朱虹;吳林;;DM4全文檢索機(jī)制的設(shè)計(jì)[A];第二十二屆中國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2005年

相關(guān)重要報(bào)紙文章 前1條

1 清華大學(xué)計(jì)算機(jī)系智能技術(shù)與系統(tǒng)國家重點(diǎn)實(shí)驗(yàn)室 張敏 金奕江;尋“寶”有術(shù)[N];計(jì)算機(jī)世界;2003年

相關(guān)博士學(xué)位論文 前7條

1 吳煒;密文全文檢索系統(tǒng)中的索引機(jī)制研究[D];華中科技大學(xué);2009年

2 龍柏;并行計(jì)算平臺(tái)上的數(shù)據(jù)索引技術(shù)研究[D];中國科學(xué)技術(shù)大學(xué);2011年

3 鄺礫;基于接口和行為語義的Web服務(wù)發(fā)現(xiàn)與適配研究[D];浙江大學(xué);2009年

4 胥正川;基于關(guān)系數(shù)據(jù)庫的XML數(shù)據(jù)存儲(chǔ)、更新和檢索[D];復(fù)旦大學(xué);2003年

5 陳旭毅;基于索引云的企業(yè)搜索引擎實(shí)現(xiàn)研究[D];武漢大學(xué);2011年

6 劉紅;近重復(fù)視頻檢測算法研究[D];復(fù)旦大學(xué);2012年

7 李群;主題搜索引擎聚類算法的研究[D];北京林業(yè)大學(xué);2011年

相關(guān)碩士學(xué)位論文 前10條

1 董長春;基于Hadoop的倒排索引技術(shù)的研究[D];遼寧大學(xué);2011年

2 潘勝一;基于倒排索引的壓縮算法性能研究[D];杭州電子科技大學(xué);2009年

3 薛煜陽;農(nóng)業(yè)搜索引擎倒排索引緩沖機(jī)制研究[D];新疆農(nóng)業(yè)大學(xué);2011年

4 吳俊森;維哈柯多語種搜索引擎倒排索引模塊的實(shí)現(xiàn)[D];新疆大學(xué);2007年

5 劉雪芹;單漢字全文檢索技術(shù)研究[D];河北工業(yè)大學(xué);2005年

6 盧光華;基于Lucene的全文檢索研究與應(yīng)用[D];吉林大學(xué);2009年

7 呂曉旭;基于倒排索引的關(guān)系數(shù)據(jù)庫全文檢索查詢效率研究[D];北京工業(yè)大學(xué);2009年

8 江毅銘;專業(yè)搜索引擎索引技術(shù)的研究與實(shí)現(xiàn)[D];北京化工大學(xué);2005年

9 吳寶貴;搜索引擎中索引技術(shù)研究與實(shí)現(xiàn)[D];西安電子科技大學(xué);2008年

10 王穎;中文局域網(wǎng)搜索引擎設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2009年

,

本文編號(hào):1753318

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/1753318.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶6519b***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com