天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 計算機論文 >

基于圖數(shù)據(jù)庫的RDF數(shù)據(jù)分布式存儲

發(fā)布時間:2020-03-13 02:59
【摘要】:RDF數(shù)據(jù)模型具有天然的圖結(jié)構(gòu),因此以圖結(jié)構(gòu)存儲可以避免RDF邏輯數(shù)據(jù)模型到物理數(shù)據(jù)模型的轉(zhuǎn)換。基于圖數(shù)據(jù)庫的RDF數(shù)據(jù)分布式存儲方案,重點討論RDF圖數(shù)據(jù)流分割、圖數(shù)據(jù)庫分布式擴展、SPARQL查詢語言轉(zhuǎn)CYPHER圖形查詢語言等。實驗對比了基于Neo4j圖數(shù)據(jù)庫與基于MySQL關(guān)系型數(shù)據(jù)庫的RDF數(shù)據(jù)存儲方案的處理性能,并驗證了RDF圖數(shù)據(jù)流分割算法的有效性。
【圖文】:

數(shù)據(jù)分布,圖數(shù),存儲方案,總體架構(gòu)


錄?個方面:(1)RDF數(shù)據(jù)集到圖數(shù)據(jù)模型的映射;(2)圖數(shù)據(jù)庫分布式存儲擴展,本文采用Neo4j圖形數(shù)據(jù)庫,并設(shè)計了一個邏輯處理層,以支持分布式存儲;(3)從圖模型視角對RDF數(shù)據(jù)集進行分割,本文采用文獻[14]提出的針對大圖數(shù)據(jù)流的分割算法,用于對RDF圖數(shù)據(jù)流的分割;(4)提供SPARQL查詢接口,CYPHER是Neo4j圖形數(shù)據(jù)庫支持的一個數(shù)據(jù)查詢語言,本文將討論SPARQL查詢語言到CYPHER查詢語言的轉(zhuǎn)換。2基于圖數(shù)據(jù)庫的RDF數(shù)據(jù)分布式存儲方案2.1系統(tǒng)總體架構(gòu)本文提出的基于圖數(shù)據(jù)庫的RDF數(shù)據(jù)分布式存儲方案總體架構(gòu)如圖1所示。圖1基于圖數(shù)據(jù)庫的RDF數(shù)據(jù)分布式存儲方案總體架構(gòu)2.2RDF數(shù)據(jù)集到圖數(shù)據(jù)模型的映射RDF數(shù)據(jù)集由很多RDF語句組成,每條RDF語句是一個三元組<主體,屬性,客體>,其中主體是被描述的資源,客體表示主體在屬性上的取值,可以是另外一個資源或者是文本。若從圖數(shù)據(jù)模型視角看,主體、客體對應(yīng)圖中的頂點,屬性對應(yīng)圖中的一條有向邊,一條RDF語句對應(yīng)于圖中的兩個頂點、從主體頂點指向客體頂點的一條有向邊。映射關(guān)系如圖2所示。圖2RDF數(shù)據(jù)集到圖數(shù)據(jù)模型的映射2.3分布式存儲為支持分布式存儲,存儲層各個RDF數(shù)據(jù)存儲節(jié)點相互獨立,在其之上增加一層邏輯處理層,往系統(tǒng)存入RDF數(shù)據(jù)時,記錄這個RDF數(shù)據(jù)的存儲位置;查詢RDF數(shù)據(jù)時,先獲取所查RDF數(shù)據(jù)可能的存儲位置,然后到對應(yīng)的存儲節(jié)點上進行查詢。系統(tǒng)需要存儲兩類數(shù)據(jù),一類是元數(shù)據(jù),主要為RDF數(shù)據(jù)的存儲位置信息,本文用Redis[15]數(shù)據(jù)庫,這是Key-Value型內(nèi)存數(shù)據(jù)庫,讀取速度快,且支持持久化,存儲時以資源ID、屬性ID作為Key,存儲位置作為Value。另一類是RDF數(shù)據(jù),本文用Neo4j圖形數(shù)據(jù)庫,存入一條RDF語句將往圖數(shù)據(jù)庫中插?

數(shù)據(jù)分布,分布式存儲,圖數(shù),數(shù)據(jù)集


儲方案2.1系統(tǒng)總體架構(gòu)本文提出的基于圖數(shù)據(jù)庫的RDF數(shù)據(jù)分布式存儲方案總體架構(gòu)如圖1所示。圖1基于圖數(shù)據(jù)庫的RDF數(shù)據(jù)分布式存儲方案總體架構(gòu)2.2RDF數(shù)據(jù)集到圖數(shù)據(jù)模型的映射RDF數(shù)據(jù)集由很多RDF語句組成,每條RDF語句是一個三元組<主體,屬性,客體>,,其中主體是被描述的資源,客體表示主體在屬性上的取值,可以是另外一個資源或者是文本。若從圖數(shù)據(jù)模型視角看,主體、客體對應(yīng)圖中的頂點,屬性對應(yīng)圖中的一條有向邊,一條RDF語句對應(yīng)于圖中的兩個頂點、從主體頂點指向客體頂點的一條有向邊。映射關(guān)系如圖2所示。圖2RDF數(shù)據(jù)集到圖數(shù)據(jù)模型的映射2.3分布式存儲為支持分布式存儲,存儲層各個RDF數(shù)據(jù)存儲節(jié)點相互獨立,在其之上增加一層邏輯處理層,往系統(tǒng)存入RDF數(shù)據(jù)時,記錄這個RDF數(shù)據(jù)的存儲位置;查詢RDF數(shù)據(jù)時,先獲取所查RDF數(shù)據(jù)可能的存儲位置,然后到對應(yīng)的存儲節(jié)點上進行查詢。系統(tǒng)需要存儲兩類數(shù)據(jù),一類是元數(shù)據(jù),主要為RDF數(shù)據(jù)的存儲位置信息,本文用Redis[15]數(shù)據(jù)庫,這是Key-Value型內(nèi)存數(shù)據(jù)庫,讀取速度快,且支持持久化,存儲時以資源ID、屬性ID作為Key,存儲位置作為Value。另一類是RDF數(shù)據(jù),本文用Neo4j圖形數(shù)據(jù)庫,存入一條RDF語句將往圖數(shù)據(jù)庫中插入兩個頂點及兩頂點之間的一條邊,并以資源ID、屬性ID分別對頂點、邊建立索引,查詢時利用索引可直接定位到某個頂點或邊。2.4邏輯處理層2.4.1分區(qū)管理RDF數(shù)據(jù)模型是一個圖模型,本文從圖模型視角對RDF數(shù)據(jù)進行分割,決策RDF數(shù)據(jù)的存儲位置,劃分的準(zhǔn)則是盡量將關(guān)聯(lián)比較緊密的頂點劃到同一個分區(qū),因為當(dāng)在RDF數(shù)據(jù)集上做推理查詢時會涉及到遍歷操作,而關(guān)聯(lián)比較緊密的頂點在遍歷路徑上的概率比較大,這樣可減少跨存儲節(jié)點之

【相似文獻】

相關(guān)期刊論文 前10條

1 王征;劉心松;李美安;;企業(yè)信息分布式存儲的熱點處理策略[J];計算機集成制造系統(tǒng);2006年09期

2 李磊;沈海斌;黃凱;嚴(yán)曉浪;Han Sangil;Ahmed A Jerraya;;分布式存儲管理在多核設(shè)計中的高層建模[J];電子與信息學(xué)報;2008年11期

3 劉翔;汪海玲;;分布式存儲中的一種數(shù)據(jù)放置策略[J];計算機與數(shù)字工程;2009年05期

4 陳衛(wèi)衛(wèi);吳海佳;胥光輝;;分布式存儲中文件分割的最優(yōu)化模型[J];解放軍理工大學(xué)學(xué)報(自然科學(xué)版);2010年04期

5 崔忠強;左德承;張展;;在云間可重構(gòu)的分布式存儲[J];系統(tǒng)工程理論與實踐;2011年S2期

6 郝杰;逯彥博;劉鑫吉;夏樹濤;;分布式存儲中的再生碼綜述[J];重慶郵電大學(xué)學(xué)報(自然科學(xué)版);2013年01期

7 唐京偉;;基于云計算的分布式存儲技術(shù)[J];中國傳媒科技;2013年15期

8 郭棟;王偉;曾國蓀;;基于一致性樹分布的數(shù)據(jù)分布式存儲方法[J];計算機應(yīng)用;2013年12期

9 蘇李亮;王云福;侯斌;;海量設(shè)計文檔分布式存儲及負(fù)載均衡的研究與實現(xiàn)[J];電信科學(xué);2013年12期

10 謝然;;敢問存儲之路在何方?見分布式存儲搖曳在數(shù)據(jù)枝頭[J];互聯(lián)網(wǎng)周刊;2014年02期

相關(guān)會議論文 前7條

1 蘇李亮;王云福;侯斌;;海量設(shè)計文檔分布式存儲及負(fù)載均衡的研究與實現(xiàn)[A];2013電力行業(yè)信息化年會論文集[C];2013年

2 蘇李亮;王云福;侯斌;;海量設(shè)計文檔分布式存儲及負(fù)載均衡的研究與實現(xiàn)[A];2013電力行業(yè)信息化年會論文集[C];2013年

3 鄭文武;李先緒;黃植勤;邱紅飛;;云存儲關(guān)鍵技術(shù)[A];2012全國無線及移動通信學(xué)術(shù)大會論文集(下)[C];2012年

4 蔣軼林;郭淑琴;;分布式存儲在數(shù)字集群移動通信系統(tǒng)中的應(yīng)用[A];浙江省電子學(xué)會2013學(xué)術(shù)年會論文集[C];2013年

5 姜繼忱;陳鋼;;P2P之路——締造“分布式對等”的Internet3.0[A];全面建設(shè)小康社會:中國科技工作者的歷史責(zé)任——中國科協(xié)2003年學(xué)術(shù)年會論文集(下)[C];2003年

6 付偉;肖儂;盧錫城;;QoS感知的副本放置問題研究綜述[A];第15屆全國信息存儲技術(shù)學(xué)術(shù)會議論文集[C];2008年

7 張彥;劉欣然;徐慧彬;;一種基于虛擬計算環(huán)境的分布式存儲體系結(jié)構(gòu)[A];2009全國計算機網(wǎng)絡(luò)與通信學(xué)術(shù)會議論文集[C];2009年

相關(guān)重要報紙文章 前8條

1 京東架構(gòu)委員會主任 云平臺首席架構(gòu)師 系統(tǒng)技術(shù)部負(fù)責(zé)人 劉海鋒;京東:分布式存儲體系成為業(yè)務(wù)基石[N];中國信息化周報;2014年

2 《網(wǎng)絡(luò)世界》記者 于翔;京東分布式存儲體系研發(fā)歷程[N];網(wǎng)絡(luò)世界;2014年

3 《網(wǎng)絡(luò)世界》記者 于翔;融合一體機投入大規(guī)模商用[N];網(wǎng)絡(luò)世界;2013年

4 記者 余榮華;大數(shù)據(jù),催生大變革[N];人民日報;2014年

5 本報記者 張佳星;新生產(chǎn)業(yè)布局如何“云”中索驥[N];科技日報;2014年

6 本報記者 甘露;物聯(lián)網(wǎng)讓管理更美妙[N];計算機世界;2013年

7 本報記者 郭濤;華為幫用戶定制HANA一體機[N];中國計算機報;2013年

8 臨江;手機瀏覽器,3G時代的采礦機?[N];人民郵電;2009年

相關(guān)博士學(xué)位論文 前8條

1 胡q

本文編號:2586672


資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/jisuanjikexuelunwen/2586672.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶18918***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com