大數(shù)據(jù)分布式全文檢索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
本文關(guān)鍵詞:大數(shù)據(jù)分布式全文檢索系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
更多相關(guān)文章: Solr HBase 大數(shù)據(jù) 搜索 python
【摘要】:論文是基于一種開(kāi)源企業(yè)搜索引擎Solr實(shí)現(xiàn)對(duì)大數(shù)據(jù)分布式數(shù)據(jù)庫(kù)HBase中數(shù)據(jù)的檢索。論文簡(jiǎn)單地介紹了分布式存儲(chǔ)技術(shù)HBase和分布式索引技術(shù)SolrCloud,實(shí)現(xiàn)了基于Solr和Zookeeper的分布式搜索方式SolrCloud模式對(duì)HBase表的索引的建立。該系統(tǒng)通過(guò)python程序在對(duì)HBase中的Rowkey建立索引的同時(shí)還對(duì)每列數(shù)據(jù)都建立索引,實(shí)現(xiàn)了Hbase的二級(jí)索引,克服了HBase只能通過(guò)Rowkey單一查詢的不足。經(jīng)過(guò)反復(fù)測(cè)試,充分地表明了基于Solr的分布式搜索系統(tǒng)的高效性及高可靠性。
【作者單位】: 西安郵電大學(xué);
【關(guān)鍵詞】: Solr HBase 大數(shù)據(jù) 搜索 python
【分類號(hào)】:TP391.3
【正文快照】: 1引言隨著信息技術(shù)的飛速發(fā)展,信息化建設(shè)是我國(guó)現(xiàn)在非常重要的一項(xiàng)工作,而且數(shù)據(jù)已經(jīng)滲透到每一個(gè)行業(yè)和業(yè)務(wù)領(lǐng)域,成為重要的生產(chǎn)因素。隨著大數(shù)據(jù)時(shí)代的到來(lái),越來(lái)越多的數(shù)據(jù)信息呈爆炸式增長(zhǎng),人們對(duì)于數(shù)據(jù)的挖掘和運(yùn)用,也逐漸因?yàn)榛ヂ?lián)網(wǎng)和信息行業(yè)的發(fā)展得到人們的關(guān)注,因此
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前2條
1 趙凱;王敏;;基于Solr的企業(yè)級(jí)搜索引擎的設(shè)計(jì)[J];電子世界;2013年22期
2 ;[J];;年期
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前6條
1 劉博文;分布式企業(yè)搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)[D];浙江大學(xué);2015年
2 王小森;基于Solr的搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)[D];北京郵電大學(xué);2011年
3 李雪利;基于Solr的企業(yè)搜索引擎的研究與實(shí)現(xiàn)[D];浙江理工大學(xué);2013年
4 蔡學(xué)鋒;基于Solr的搜索引擎核心技術(shù)研究與應(yīng)用[D];武漢理工大學(xué);2013年
5 李晨鳴;基于solr搜索引擎的問(wèn)吧系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2012年
6 張新生;基于solr的分布式搜索引擎研究[D];華中科技大學(xué);2012年
,本文編號(hào):1063273
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/1063273.html