基于HBase的RDF數(shù)據(jù)存儲(chǔ)方案研究與設(shè)計(jì)
發(fā)布時(shí)間:2017-11-09 00:04
本文關(guān)鍵詞:基于HBase的RDF數(shù)據(jù)存儲(chǔ)方案研究與設(shè)計(jì)
更多相關(guān)文章: 語義網(wǎng) RDF數(shù)據(jù) HBase MapReduce HFile文件
【摘要】:針對(duì)RDF數(shù)據(jù)的存儲(chǔ)問題,文章提出一種利用分布式數(shù)據(jù)庫HBase以及設(shè)計(jì)數(shù)據(jù)庫的Rowkey進(jìn)行有效存儲(chǔ)的方案,主要利用HBase與RDF數(shù)據(jù)的特點(diǎn),使用經(jīng)典的BKDRHash算法對(duì)謂詞進(jìn)行散列計(jì)算,將散列值與謂詞作為主鍵,實(shí)現(xiàn)數(shù)據(jù)的存儲(chǔ)。有效設(shè)置HBase的Rowkey不僅避免出現(xiàn)節(jié)點(diǎn)堆積現(xiàn)象,BKDRHash算法的使用也保證了數(shù)據(jù)的完整性。為證明該存儲(chǔ)模式的有效性,文章實(shí)驗(yàn)選擇利用Map Reduce將數(shù)據(jù)生成HBase內(nèi)部存儲(chǔ)格式HFile文件進(jìn)行并行加載。實(shí)驗(yàn)證明,針對(duì)這樣的存儲(chǔ)模式,當(dāng)數(shù)據(jù)量很大時(shí)數(shù)據(jù)加載性能較好。使用LUBM測(cè)試集進(jìn)行仿真實(shí)驗(yàn),證明該方案是有效的。
【作者單位】: 貴州大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院;貴州大學(xué)大數(shù)據(jù)與信息工程學(xué)院;
【基金】:黔科合JZ字[2014]2001
【分類號(hào)】:TP333;TP311.13
【正文快照】: 絡(luò)安全,2016(3):59-63.0引言RDF(Resource Description Framework)是W3C提出的一個(gè)資源描述框架,通過對(duì)網(wǎng)絡(luò)資源進(jìn)行一定程度的語義描述,為計(jì)算機(jī)能夠模擬大腦理解語義信息提供可能。而隨著LOD(Linking Open Data)等項(xiàng)目的展開[1],大量的RDF數(shù)據(jù)發(fā)布,互聯(lián)網(wǎng)中包含的RDF數(shù)據(jù)已,
本文編號(hào):1159399
本文鏈接:http://www.sikaile.net/kejilunwen/jisuanjikexuelunwen/1159399.html
最近更新
教材專著