基于Lucene對(duì)文件全文檢索的研究與應(yīng)用
本文關(guān)鍵詞:基于Lucene對(duì)文件全文檢索的研究與應(yīng)用
更多相關(guān)文章: 搜索引擎 全文搜索 分詞 索引 優(yōu)化
【摘要】:分析了Lucene的原理,針對(duì)Lucene的IndexReader、IndexSearcher、IndexWriter、Directory的各種不足,研究了不同優(yōu)化方案,并通過重寫源碼中的QueryParser限制效率低下的通配符查詢及模糊查詢,提高了搜索響應(yīng)速度,最后,文章研究了Lucene的多個(gè)應(yīng)用領(lǐng)域。
【作者單位】: 南陽電視廣播大學(xué);
【關(guān)鍵詞】: 搜索引擎 全文搜索 分詞 索引 優(yōu)化
【分類號(hào)】:TP391.3
【正文快照】: ^0引5隨著網(wǎng)絡(luò)技術(shù)飛速發(fā)展,產(chǎn)生了大量數(shù)字信息,如何從這浩如煙海的文木丨〖息中快速而又準(zhǔn)確地獲取想要的信息’成為人們關(guān)注的焦點(diǎn),也一直是國內(nèi)外不斷研究的課題,因此,全文檢索技術(shù)成為國內(nèi)外學(xué)者研究的熱點(diǎn)^ ,^_1全文檢索技術(shù)的研究現(xiàn)狀全文檢索的主要目的是建立索引與
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前1條
1 王莉云;王華;陳剛;姚乃明;;基于Lucene的全文檢索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)工程與設(shè)計(jì);2007年24期
【共引文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 王銳;張穎慧;陳麗;;一種基于配置策略的網(wǎng)絡(luò)資源數(shù)據(jù)搜索方法[J];電信科學(xué);2011年11期
2 楊元峰;趙敏涯;廖黎莉;;基于Lucene的客服知識(shí)庫系統(tǒng)結(jié)構(gòu)設(shè)計(jì)[J];福建電腦;2012年01期
3 李勇;王移芝;;基于Lucene的網(wǎng)絡(luò)教學(xué)資源檢索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];計(jì)算機(jī)與信息技術(shù);2008年11期
4 劉高原;何偉娜;鄭浩;劉覺夫;;Nutch0.9中二分法中文分詞的實(shí)現(xiàn)[J];計(jì)算機(jī)時(shí)代;2009年04期
5 孫殿哲;魏海平;陳巖;;Nutch中庖丁解牛中文分詞的實(shí)現(xiàn)與評(píng)測(cè)[J];計(jì)算機(jī)與現(xiàn)代化;2010年06期
6 劉洋;;Nutch0.9中二分法中文分詞的實(shí)現(xiàn)[J];科技信息;2009年36期
7 趙旭;王慶樺;;向LUCENE搜索引擎中加入中文同義詞查詢[J];科技信息;2011年07期
8 王錫鋼;王正;陳虎;;關(guān)于搜索引擎的中文分詞與頁面排序的研究[J];計(jì)算機(jī)應(yīng)用與軟件;2013年09期
9 李穎;李志蜀;鄧歡;;基于Lucene的中文分詞方法設(shè)計(jì)與實(shí)現(xiàn)[J];四川大學(xué)學(xué)報(bào)(自然科學(xué)版);2008年05期
10 黃少林;王華;張玉紅;蔣一峰;;基于Lucene的索引系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];現(xiàn)代情報(bào);2009年07期
中國重要會(huì)議論文全文數(shù)據(jù)庫 前1條
1 ;THE APPLICATION OF FULLl-TEXT INDEX WITH RULE LIBRATY IN INTEGRATED GEOGRAPHIC INFORMATION COLLECTION DATABASE ENGINE[A];《測(cè)繪通報(bào)》測(cè)繪科學(xué)前沿技術(shù)論壇摘要集[C];2008年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 孫華昱;Lucene在醫(yī)學(xué)影像資源檢索平臺(tái)中的應(yīng)用[D];沈陽工業(yè)大學(xué);2011年
2 耿愛媛;基于GA-BP神經(jīng)網(wǎng)絡(luò)的智能評(píng)語生成的研究[D];天津財(cái)經(jīng)大學(xué);2011年
3 余坦;個(gè)性化技術(shù)資料支持幫助系統(tǒng)的研究與實(shí)現(xiàn)[D];湖南大學(xué);2009年
4 武毅;基于Lucene.Net的全文檢索研究與應(yīng)用[D];國防科學(xué)技術(shù)大學(xué);2011年
5 羅會(huì)紅;基于SSH和Lucene垂直搜索引擎研究[D];長沙理工大學(xué);2011年
6 于雪麗;LUCENE中文分詞在科研文檔全文檢索系統(tǒng)的應(yīng)用研究[D];青島大學(xué);2011年
7 楊詠;基于Lucene的知識(shí)庫設(shè)計(jì)與實(shí)現(xiàn)[D];華南理工大學(xué);2011年
8 董瑩;面向基層部隊(duì)官兵的健康信息構(gòu)建[D];中國人民解放軍軍事醫(yī)學(xué)科學(xué)院;2011年
9 卿竹;重慶市標(biāo)準(zhǔn)管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];重慶大學(xué);2008年
10 沃迪;新一代IETM結(jié)構(gòu)及關(guān)鍵技術(shù)研究[D];哈爾濱工程大學(xué);2009年
【二級(jí)參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前1條
1 柯和平;基于全文檢索和流媒體技術(shù)的素材庫設(shè)計(jì)建設(shè)[J];計(jì)算機(jī)工程與設(shè)計(jì);2004年09期
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 林文淵;;網(wǎng)絡(luò)搜索引擎的原理分析和實(shí)現(xiàn)[J];商業(yè)文化(學(xué)術(shù)版);2010年12期
2 曹曉聲;喬杰華;;網(wǎng)絡(luò)數(shù)據(jù)的挖掘[J];遼寧工程技術(shù)大學(xué)學(xué)報(bào);2006年S1期
3 劉高原;張國平;;基于Nutch的搜索引擎技術(shù)[J];平頂山學(xué)院學(xué)報(bào);2008年05期
4 胡長春;劉功申;;面向搜索引擎Lucene的中文分析器[J];計(jì)算機(jī)工程與應(yīng)用;2009年12期
5 孫建;秦琪;袁方;;基于Lucene的知識(shí)搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)[J];安徽電氣工程職業(yè)技術(shù)學(xué)院學(xué)報(bào);2011年01期
6 楊晶;呂天君;蔣占生;;Web搜索引擎原理及應(yīng)用研究[J];軟件導(dǎo)刊;2008年07期
7 王豐;戴兵;;國內(nèi)中文搜索引擎研究[J];電腦知識(shí)與技術(shù)(學(xué)術(shù)交流);2007年08期
8 雷麗秀;;互聯(lián)網(wǎng)搜索引擎技術(shù)及展望[J];科技信息(學(xué)術(shù)研究);2008年20期
9 陳春陽;;對(duì)互聯(lián)網(wǎng)搜索引擎的初步認(rèn)識(shí)[J];硅谷;2009年10期
10 任曉娜;;基于Lucene的全文搜索引擎的研究與實(shí)現(xiàn)[J];湖北廣播電視大學(xué)學(xué)報(bào);2010年05期
中國重要會(huì)議論文全文數(shù)據(jù)庫 前10條
1 彭軻;廖聞劍;;淺析搜索引擎[A];中國通信學(xué)會(huì)第五屆學(xué)術(shù)年會(huì)論文集[C];2008年
2 李丹;;如何利用搜索引擎查找中醫(yī)藥信息[A];中國中醫(yī)藥信息研究會(huì)第二屆理事大會(huì)暨學(xué)術(shù)交流會(huì)議論文匯編[C];2003年
3 鄧長壽;郭景峰;楊焱林;鄧安遠(yuǎn);;下一代Web搜索引擎初探[A];第十八屆全國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2001年
4 維尼拉·木沙江;吐爾洪·吾司曼;;維、哈、柯文搜索引擎中網(wǎng)頁爬行器的設(shè)計(jì)與實(shí)現(xiàn)[A];少數(shù)民族青年自然語言處理技術(shù)研究與進(jìn)展——第三屆全國少數(shù)民族青年自然語言信息處理、第二屆全國多語言知識(shí)庫建設(shè)聯(lián)合學(xué)術(shù)研討會(huì)論文集[C];2010年
5 謝麗星;孫茂松;佟子健;王燦輝;;基于用戶查詢?nèi)罩竞湾^文字的漢語縮略語識(shí)別[A];中國計(jì)算機(jī)語言學(xué)研究前沿進(jìn)展(2007-2009)[C];2009年
6 湯薇;曾艷;;構(gòu)建校園網(wǎng)搜索引擎必要性分析[A];廣西計(jì)算機(jī)學(xué)會(huì)2008年年會(huì)論文集[C];2008年
7 姚樹宇;趙少東;;一種使用分布式技術(shù)的搜索引擎[A];2005年全國開放式分布與并行計(jì)算學(xué)術(shù)會(huì)議論文集[C];2005年
8 倪俊峰;;基于黃頁搜索引擎的關(guān)鍵字排名廣告系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[A];2005年中國索引學(xué)會(huì)年會(huì)暨學(xué)術(shù)研討會(huì)論文集[C];2005年
9 張怡;查貴庭;;SEO在信息服務(wù)中的應(yīng)用研究[A];2010年中國索引學(xué)會(huì)年會(huì)暨學(xué)術(shù)研討會(huì)論文集[C];2010年
10 陳援非;何哲;朱珍民;;基于普適計(jì)算的個(gè)性化搜索技術(shù)[A];第二屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2006)——第2屆中國普適計(jì)算學(xué)術(shù)會(huì)議(PCC'06)論文集[C];2006年
中國重要報(bào)紙全文數(shù)據(jù)庫 前10條
1 章森 王偉;搜索引擎的工作機(jī)制[N];計(jì)算機(jī)世界;2006年
2 李一鑫;搜索排名的紅與黑[N];財(cái)經(jīng)時(shí)報(bào);2007年
3 周文林;搜狗3.0能否撼動(dòng)搜索市場[N];經(jīng)濟(jì)參考報(bào);2007年
4 惠正一;比爾·蓋茨:微軟不怕Google[N];第一財(cái)經(jīng)日?qǐng)?bào);2005年
5 賽迪顧問股份有限公司互聯(lián)網(wǎng)與電子商務(wù)咨詢中心 常燕杰;搜索,還是門戶[N];中國計(jì)算機(jī)報(bào);2005年
6 陳珊;浙江移動(dòng)推出手機(jī)搜索引擎服務(wù)[N];人民郵電;2005年
7 趙法忠;搜索引擎還需悠著點(diǎn)[N];中國經(jīng)營報(bào);2005年
8 金朝力;搜索引擎火拼搜索質(zhì)量[N];北京商報(bào);2006年
9 本報(bào)記者 趙曉輝 孟昭麗;搜索引擎駛?cè)搿氨茱L(fēng)港”[N];中國證券報(bào);2006年
10 孫t;搜索引擎驚喜侵權(quán)官司止于“避風(fēng)港”?[N];第一財(cái)經(jīng)日?qǐng)?bào);2006年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 李群;主題搜索引擎聚類算法的研究[D];北京林業(yè)大學(xué);2011年
2 陳旭毅;基于索引云的企業(yè)搜索引擎實(shí)現(xiàn)研究[D];武漢大學(xué);2011年
3 岑榮偉;基于用戶行為分析的搜索引擎評(píng)價(jià)研究[D];清華大學(xué);2010年
4 蘇君華;面向搜索引擎的技術(shù)接受模型研究[D];南京大學(xué);2011年
5 劉佐達(dá);分布協(xié)作式搜索引擎模型及算法研究[D];清華大學(xué);2011年
6 黃建年;農(nóng)業(yè)古籍的計(jì)算機(jī)斷句標(biāo)點(diǎn)與分詞標(biāo)引研究[D];南京農(nóng)業(yè)大學(xué);2009年
7 郭眈;中文互聯(lián)網(wǎng)視頻搜索引擎系統(tǒng)策略研究[D];北京交通大學(xué);2012年
8 梁金寶;藏語歷史文獻(xiàn)詞匯統(tǒng)計(jì)研究[D];中國社會(huì)科學(xué)院研究生院;2013年
9 王昤璞;基于用戶體驗(yàn)的互聯(lián)網(wǎng)搜索引擎醫(yī)學(xué)信息檢索可用性評(píng)估研究[D];吉林大學(xué);2010年
10 李莎莎;面向搜索引擎的自然語言處理關(guān)鍵技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2011年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 陳魁;智能搜索引擎系統(tǒng)的分析設(shè)計(jì)與開發(fā)[D];大連理工大學(xué);2004年
2 崔頃頃;基于個(gè)性化搜索的系統(tǒng)研究與設(shè)計(jì)[D];北京交通大學(xué);2011年
3 劉懷英;基于分布式并行計(jì)算的搜索引擎的研究與設(shè)計(jì)[D];武漢理工大學(xué);2005年
4 孫曉峰;基于輕量級(jí)框架的互動(dòng)問答平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn)[D];中國地質(zhì)大學(xué)(北京);2008年
5 孫華昱;Lucene在醫(yī)學(xué)影像資源檢索平臺(tái)中的應(yīng)用[D];沈陽工業(yè)大學(xué);2011年
6 聞崢;基于Lucene的搜索引擎優(yōu)化[D];北京交通大學(xué);2011年
7 陳焱R,
本文編號(hào):640196
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/640196.html