大型企業(yè)管理系統(tǒng)中實時搜索引擎應(yīng)用研究
發(fā)布時間:2017-04-06 09:16
本文關(guān)鍵詞:大型企業(yè)管理系統(tǒng)中實時搜索引擎應(yīng)用研究,由筆耕文化傳播整理發(fā)布。
【摘要】:信息技術(shù)的發(fā)展帶動了企業(yè)信息化的迅猛發(fā)展,在大型企業(yè)信息管理系統(tǒng)中,信息數(shù)量往往非常巨大,且數(shù)據(jù)的增長、更新速度非?臁6鴤鹘y(tǒng)的搜索引擎,對于數(shù)據(jù)檢索的實時性及精確性都存在著缺陷。另一方面,企業(yè)信息檢索系統(tǒng)提供的數(shù)據(jù)庫檢索功能在面對海量的企業(yè)信息時,它的檢索速度會大幅降低,且性能往往滿足不了用戶的需求,甚至?xí)o數(shù)據(jù)庫的其他正常使用帶來影響。針對以上情況,本文構(gòu)建了基于Lucene的實時檢索系統(tǒng)。 本文首先分析了目前企業(yè)信息系統(tǒng)中檢索系統(tǒng)存在的問題,研究了設(shè)計實時檢索系統(tǒng)的必要性,進(jìn)一步研究了搭建實時檢索系統(tǒng)所需要的關(guān)鍵技術(shù),包括索引、分詞、合并索引段等。此外,就Lucene的主要技術(shù)及實現(xiàn)方法進(jìn)行了研究與探討,在此基礎(chǔ)上,對系統(tǒng)進(jìn)行了需求分析,探討、研究了實時檢索的構(gòu)建方法,提出了優(yōu)化方案,給出了系統(tǒng)的總體解決方案及軟件分層設(shè)計。 針對普通檢索系統(tǒng)中索引處于離線工作的狀態(tài),本系統(tǒng)創(chuàng)造性地將索引的建立與查詢寫入同一進(jìn)程,并采用多個索引共同工作的方式,保證了文檔在添加、刪除、更新狀態(tài)下對應(yīng)的索引更新的即時性。還在系統(tǒng)中設(shè)計增加了搜索系統(tǒng)核心控制模塊,它是一個對外的核心類,提供了諸多方法供外界調(diào)用。該模塊對數(shù)據(jù)域及查詢服務(wù)進(jìn)行統(tǒng)一控制,實現(xiàn)了實時檢索。此外,系統(tǒng)采用Servlet和Ajax構(gòu)建檢索交互程序,在本系統(tǒng)的數(shù)據(jù)結(jié)構(gòu)的基礎(chǔ)上,構(gòu)建了靈活的查詢和管理平臺。 最后,本文對系統(tǒng)的查詢效果進(jìn)行了測試,并且針對此結(jié)果,與基本的Lucene搜索引擎查詢進(jìn)行性能及效果的比較,證明了系統(tǒng)性能明顯提高,達(dá)到了預(yù)期研究目的,滿足大數(shù)據(jù)量及實時性的需求。
【關(guān)鍵詞】:實時檢索 Lucene 數(shù)據(jù)庫 索引
【學(xué)位授予單位】:北京郵電大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2014
【分類號】:TP391.3
【目錄】:
- 摘要4-5
- ABSTRACT5-7
- 目錄7-10
- 第一章 緒論10-13
- 1.1 實時搜索的研究背景及意義10
- 1.2 發(fā)展現(xiàn)狀10-11
- 1.3 本文主要研究內(nèi)容11-12
- 1.4 論文內(nèi)容章節(jié)安排12-13
- 第二章 相關(guān)概念及支撐技術(shù)13-28
- 2.1 搜索引擎13-16
- 2.1.1 概念13
- 2.1.2 幾種主流的搜索引擎13-15
- 2.1.3 搜索引擎工作原理15-16
- 2.2 Lucene基礎(chǔ)知識16-23
- 2.2.1 Lucene簡介16
- 2.2.2 基本概念16-18
- 2.2.3 Lucene索引倒排表18-19
- 2.2.4 Lucene總體架構(gòu)19-20
- 2.2.5 關(guān)鍵技術(shù)20-23
- 2.3 數(shù)據(jù)庫23-27
- 2.3.1 概念23
- 2.3.2 發(fā)展現(xiàn)狀23-25
- 2.3.3 ORALCE關(guān)鍵技術(shù)25-27
- 2.4 JAVA設(shè)計模式27-28
- 第三章 實時檢索系統(tǒng)的需求和設(shè)計28-47
- 3.1 系統(tǒng)總體需求設(shè)計28-29
- 3.1.1 檢索需求28-29
- 3.1.2 索引需求29
- 3.1.3 數(shù)據(jù)管理需求29
- 3.2 系統(tǒng)的架構(gòu)設(shè)計29-34
- 3.2.1 總體解決方案29-32
- 3.2.2 系統(tǒng)分層設(shè)計32-34
- 3.3 搜索引擎34-37
- 3.3.1 Paoding Analyzer分詞35-36
- 3.3.2 Merge segment合并索引段36-37
- 3.4 搜索系統(tǒng)核心控制SearchCore37-38
- 3.5 索引設(shè)計38-41
- 3.6 數(shù)據(jù)庫41-44
- 3.7 查詢44-45
- 3.8 管理45-47
- 3.8.1 優(yōu)化45-46
- 3.8.2 監(jiān)視46-47
- 第四章 實時檢索系統(tǒng)的實現(xiàn)47-63
- 4.1 系統(tǒng)開發(fā)環(huán)境47-48
- 4.2 基礎(chǔ)架構(gòu)的搭建48-49
- 4.2.1 準(zhǔn)備工作48
- 4.2.2 系統(tǒng)搭建與部署48-49
- 4.2.3 數(shù)據(jù)庫的配置49
- 4.3 建立基本搜索引擎49-52
- 4.3.1 基本部署49-50
- 4.3.2 Paoding Analyzer分詞50
- 4.3.3 Merge Segment合并索引段50-52
- 4.4 搜索系統(tǒng)核心控制模塊SearchCore的配置52-55
- 4.4.1 SearchCore的基本配置52-54
- 4.4.2 SearchCore的初始化54-55
- 4.5 索引配置55-58
- 4.5.1 內(nèi)存索引中文檔的添加55-56
- 4.5.2 內(nèi)存索引與硬盤索引的合并56-57
- 4.5.3 索引的刪除57-58
- 4.6 數(shù)據(jù)庫58-59
- 4.7 查詢59-61
- 4.8 管理61-63
- 4.8.1 優(yōu)化61
- 4.8.2 監(jiān)視61-63
- 第五章 系統(tǒng)測試63-66
- 5.1 驗證測試63-64
- 5.2 性能測試64-65
- 5.2.1 數(shù)據(jù)庫內(nèi)容64-65
- 5.2.2 查詢時間65
- 5.2.3 索引建立時間65
- 5.3 結(jié)論65-66
- 第六章 總結(jié)與展望66-68
- 6.1 論文總結(jié)66
- 6.2 未來展望66-68
- 參考文獻(xiàn)68-69
- 附錄 縮略語69-70
- 致謝70
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前5條
1 王亞平;;Sybase數(shù)據(jù)庫性能優(yōu)化研究[J];計算機(jī)光盤軟件與應(yīng)用;2012年04期
2 王軍莊;常鮮戎;顧衛(wèi)國;;基于OCL技術(shù)的Oracle數(shù)據(jù)庫數(shù)據(jù)快速存取研究[J];電力系統(tǒng)保護(hù)與控制;2009年09期
3 王莉云;王華;陳剛;姚乃明;;基于Lucene的全文檢索系統(tǒng)的設(shè)計與實現(xiàn)[J];計算機(jī)工程與設(shè)計;2007年24期
4 張永霞;;關(guān)于SQL數(shù)據(jù)庫的分析與探討[J];數(shù)字技術(shù)與應(yīng)用;2011年10期
5 仇雷;;從容應(yīng)對變化——從一個簡單搜索工具架構(gòu)淺談Java設(shè)計模式[J];科技資訊;2010年13期
本文關(guān)鍵詞:大型企業(yè)管理系統(tǒng)中實時搜索引擎應(yīng)用研究,由筆耕文化傳播整理發(fā)布。
,本文編號:288636
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/288636.html
最近更新
教材專著