天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于屬性表的RDF數(shù)據(jù)存儲(chǔ)系統(tǒng)研究

發(fā)布時(shí)間:2018-01-05 01:17

  本文關(guān)鍵詞:基于屬性表的RDF數(shù)據(jù)存儲(chǔ)系統(tǒng)研究 出處:《南京大學(xué)》2013年碩士論文 論文類(lèi)型:學(xué)位論文


  更多相關(guān)文章: RDF數(shù)據(jù) 屬性表 存儲(chǔ)系統(tǒng) PID控制器 Jena


【摘要】:語(yǔ)義網(wǎng)是對(duì)當(dāng)前萬(wàn)維網(wǎng)的擴(kuò)展,通過(guò)在網(wǎng)頁(yè)中加入語(yǔ)義內(nèi)容,使得計(jì)算機(jī)能夠更好地理解和處理這些信息。RDF是語(yǔ)義網(wǎng)中用來(lái)表示知識(shí)的數(shù)據(jù)模型,伴隨語(yǔ)義網(wǎng)的發(fā)展RDF正得到越來(lái)越廣泛的應(yīng)用。隨著RDF數(shù)據(jù)量的增加,如何高效地存儲(chǔ)大量RDF數(shù)據(jù)成為一個(gè)難題。本文從RDF數(shù)據(jù)的屬性表存儲(chǔ)方法出發(fā),研究針對(duì)RDF數(shù)據(jù)的屬性選擇算法、屬性表動(dòng)態(tài)調(diào)整算法及其相關(guān)技術(shù)。 已有研究表明,不同的RDF數(shù)據(jù)集和查詢(xún)往往需要不同的存儲(chǔ)方案,現(xiàn)有的RDF存儲(chǔ)方法在不同應(yīng)用場(chǎng)景下各有優(yōu)劣。屬性表存儲(chǔ)方法由于可以根據(jù)不同查詢(xún)動(dòng)態(tài)定制屬性表結(jié)構(gòu),因此備受青睞。屬性表存儲(chǔ)需要指定一個(gè)屬性選擇算法,來(lái)確定各屬性表中的屬性,目前主流的屬性選擇算法大多直接套用其他領(lǐng)域類(lèi)似問(wèn)題的解決辦法,例如數(shù)據(jù)挖掘中的關(guān)聯(lián)規(guī)則挖掘算法、分布式數(shù)據(jù)庫(kù)中的垂直分區(qū)算法等。本文提出一種新的針對(duì)RDF數(shù)據(jù)的屬性選擇算法,不僅可以根據(jù)查詢(xún)動(dòng)態(tài)選擇屬性表結(jié)構(gòu),達(dá)到為應(yīng)用定制存儲(chǔ)策略的效果,還針對(duì)RDF數(shù)據(jù)查詢(xún)引入連接操作多的問(wèn)題,優(yōu)化了屬性選擇算法,盡量減少在表中的連接。 在屬性選擇算法研究基礎(chǔ)上,本文設(shè)計(jì)了可以在系統(tǒng)的運(yùn)行過(guò)程中動(dòng)態(tài)調(diào)整屬性表結(jié)構(gòu)的方法。由于屬性表的創(chuàng)建和修改開(kāi)銷(xiāo)很大,現(xiàn)有的方法主要使用靜態(tài)的屬性表生成方法,不考慮屬性表結(jié)構(gòu)調(diào)整對(duì)系統(tǒng)性能造成的影響,這樣的算法需要在系統(tǒng)啟動(dòng)前或者停機(jī)時(shí)運(yùn)行。本文提出了一種判斷系統(tǒng)負(fù)載的算法,該算法采用類(lèi)似PID控制器的思想,可以根據(jù)各時(shí)間段內(nèi)查詢(xún)和響應(yīng)的情況定性地給出系統(tǒng)是否空閑。并且本文設(shè)計(jì)了一種屬性表的增量調(diào)整算法,可以在屬性級(jí)別給出將舊表結(jié)構(gòu)調(diào)整為新表結(jié)構(gòu)需要進(jìn)行的操作,并在每個(gè)屬性調(diào)整前檢查系統(tǒng)負(fù)載,只在空閑時(shí)進(jìn)行調(diào)整,以將屬性表動(dòng)態(tài)調(diào)整的影響降到最低。 最后,本文在現(xiàn)有的開(kāi)源語(yǔ)義網(wǎng)工具Jena中增加了屬性表存儲(chǔ)的功能,通過(guò)修改其中的查詢(xún)處理模塊,可以將查詢(xún)中合適的數(shù)據(jù)訪問(wèn)重定向到屬性表上進(jìn)行。為了考察在真實(shí)應(yīng)用場(chǎng)景下屬性表存儲(chǔ)的性能,本文還在SP2Bench SPARQL性能測(cè)試工具中增加了模擬用戶(hù)數(shù)變化的功能。結(jié)合改進(jìn)的Jena與SP2Bench的實(shí)驗(yàn)表明,本文提出的屬性表屬性選擇算法和調(diào)整時(shí)機(jī)選擇算法可以顯著地提高系統(tǒng)的性能。
[Abstract]:The semantic web is an extension of the current web, by adding semantic content in a web page, which the computer can understand and process the information.RDF is a semantic network knowledge representation model used in RDF, with the development of the semantic web is becoming more and more widely used. With the increasing amount of RDF data, how to efficiently the storage of a large number of RDF data has become a problem. This paper from the attribute table storage method of RDF data based on RDF data attribute selection algorithm, attribute table dynamic adjustment algorithm and its related technology.
Studies have shown that different RDF data sets and queries often require different storage schemes, existing RDF storage method have advantages and disadvantages in different application scenarios. The attribute table storage method because it can according to the different custom attribute dynamic query table structure, and therefore favored. Attribute table storage specifies an attribute selection algorithm to determine each attribute in the attribute table, the current mainstream attribute selection algorithm mostly directly applied to similar problems in other areas of the solution, such as association rules mining algorithm in distributed database vertical partitioning algorithm. This paper proposes a new attribute selection algorithm for RDF data, not only can query according to the dynamic selection the attribute table structure, reach for the application of custom storage strategy effect, but also for the RDF data query into the connection operation many problems, optimize the attribute selection algorithm Try to reduce the connection in the table as far as possible.
On the basis of property selection algorithm, this paper designs can be in the process of running the system to dynamically adjust the structure of the table. The attribute table creation and modification overhead, the existing methods mainly use the static attribute table generation method, without considering the attribute table structure adjustment impact on system performance, such as the algorithm needs before the system starts or stops running. This paper proposes a algorithm of load judgment system, the algorithm adopts PID controller similar ideas, according to each period of time, the query and response system is given to whether free. And this paper proposes an incremental algorithm for attribute table can be adjusted. The old table will be given at the attribute level adjustment for the new table structure need operation, and adjust the load before the check system in each attribute, only be adjusted when idle, to The impact of the dynamic adjustment of the attribute table is reduced to a minimum.
Finally, this paper adds the attribute table storage function in the existing open source semantic web tools in Jena, the query processing module to modify the query in data access can be appropriate to redirect the property tables. In order to investigate the performance in real application scenarios attribute table storage, based on the SP2Bench SPARQL performance testing tools. Increase of user number simulation function. The combination of Jena and SP2Bench show that the improved experiment, the proposed attribute table attribute selection algorithm and adjusting timing algorithm can significantly improve the performance of the system.

【學(xué)位授予單位】:南京大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2013
【分類(lèi)號(hào)】:TP333;TP273

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 宋慶美,周明剛;基于XML的三個(gè)常用元數(shù)據(jù)描述工具的評(píng)價(jià)與比較[J];情報(bào)科學(xué);2003年06期

2 梅曉勇,肖政宏;基于XML的排課系統(tǒng)研究與實(shí)現(xiàn)[J];湖南城建高等專(zhuān)科學(xué)校學(xué)報(bào);2003年03期

3 董愛(ài)兵,王小平,曹立明;基于FIPA ACL和RDF的Agent通信語(yǔ)言[J];計(jì)算機(jī)應(yīng)用研究;2005年07期

4 任磊;譚躍生;;基于RDF元數(shù)據(jù)的網(wǎng)格資源統(tǒng)一描述方法[J];內(nèi)蒙古科技大學(xué)學(xué)報(bào);2009年02期

5 任瑞娟;XML對(duì)數(shù)字圖書(shū)館的影響[J];大學(xué)圖書(shū)館學(xué)報(bào);2002年06期

6 張惠文;基于XML的元數(shù)據(jù)架構(gòu)[J];情報(bào)科學(xué);2002年10期

7 張惠文;基于XML的元數(shù)據(jù)架構(gòu)[J];現(xiàn)代情報(bào);2002年07期

8 李曉紅,侯敏;網(wǎng)絡(luò)環(huán)境下元數(shù)據(jù)格式比較研究[J];圖書(shū)館學(xué)刊;2003年05期

9 羅三定,廖程鋒;一種新的搜索引擎探討[J];情報(bào)學(xué)報(bào);2004年04期

10 周智昊;;資源描述框架的形式化表示問(wèn)題研究[J];華中農(nóng)業(yè)大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版);2007年04期

相關(guān)會(huì)議論文 前10條

1 李勛龍;郭瑞強(qiáng);丁祥武;樂(lè)嘉錦;;基于RDF模式的存儲(chǔ)方法研究[A];第二十一屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2004年

2 華雯;王琰;陳躍國(guó);陳晉川;杜小勇;;一個(gè)基于演化聚類(lèi)的RDF數(shù)據(jù)管理系統(tǒng)[A];NDBC2010第27屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(B輯)[C];2010年

3 陶導(dǎo);錢(qián)衛(wèi)寧;魏芳;周傲英;;基于關(guān)系數(shù)據(jù)庫(kù)的RDF數(shù)據(jù)存儲(chǔ)[A];第二十五屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(一)[C];2008年

4 吳剛;楊夢(mèng)冬;;RDF數(shù)據(jù)的并行處理及性能評(píng)價(jià)[A];第26屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(B輯)[C];2009年

5 周斌;雷建國(guó);;一項(xiàng)新型垃圾衍生燃料(RDF)制備工藝系統(tǒng)[A];2010中國(guó)環(huán)境科學(xué)學(xué)會(huì)學(xué)術(shù)年會(huì)論文集(第四卷)[C];2010年

6 黃新艷;姚文琳;徐建良;;基于漢英雙語(yǔ)語(yǔ)料庫(kù)的漢英Ontology的建立與管理[A];第七屆青年學(xué)術(shù)會(huì)議論文集[C];2005年

7 石翌軼;;基于前向鏈策略的RDF閉包生成技術(shù)研究[A];2008'中國(guó)信息技術(shù)與應(yīng)用學(xué)術(shù)論壇論文集(一)[C];2008年

8 王伯春;劉寶林;李代禧;余德洋;;不同條件下水玻璃化過(guò)程的模擬[A];第六屆全國(guó)低溫生物醫(yī)學(xué)及器械學(xué)術(shù)大會(huì)論文集[C];2009年

9 徐慧;劉會(huì)芬;肖德寶;熊磊;徐艷;;面向語(yǔ)義網(wǎng)的智能信息檢索研究[A];2007通信理論與技術(shù)新發(fā)展——第十二屆全國(guó)青年通信學(xué)術(shù)會(huì)議論文集(下冊(cè))[C];2007年

10 賈永生;齊中華;王俊杰;;淺談AutoCAD與Arc/Info數(shù)據(jù)屬性信息互轉(zhuǎn)[A];2001年?yáng)|北三省測(cè)繪學(xué)術(shù)與信息交流會(huì)論文集[C];2001年

相關(guān)重要報(bào)紙文章 前10條

1 ;惠普發(fā)布新一代數(shù)據(jù)存儲(chǔ)系統(tǒng)[N];人民郵電;2004年

2 ;存儲(chǔ)保平安[N];計(jì)算機(jī)世界;2002年

3 ;浪潮存儲(chǔ)舉辦高端存儲(chǔ)方案巡展[N];人民郵電;2006年

4 建研院;如何繪制綠籬線[N];中國(guó)花卉報(bào);2008年

5 英小勇;“數(shù)據(jù)金庫(kù)”的堅(jiān)實(shí)地基[N];計(jì)算機(jī)世界;2002年

6 本報(bào)駐英國(guó)記者 劉海英;未來(lái)的網(wǎng)絡(luò)知你心[N];科技日?qǐng)?bào);2011年

7 本報(bào)記者 錢(qián)煒;奧運(yùn)助推我網(wǎng)絡(luò)存儲(chǔ)發(fā)展[N];科技日?qǐng)?bào);2005年

8 江蘇寧滬高速公路股份有限公司 楊慶 周遠(yuǎn)航;建立公路路面信息數(shù)據(jù)庫(kù)[N];計(jì)算機(jī)世界;2006年

9 周晨;高校數(shù)字圖書(shū)館青睞IP SAN[N];科技日?qǐng)?bào);2007年

10 周青邋編譯;無(wú)重復(fù)備份是ILM成功的關(guān)鍵[N];計(jì)算機(jī)世界;2007年

相關(guān)博士學(xué)位論文 前10條

1 謝銘;關(guān)聯(lián)數(shù)據(jù)和知識(shí)表示的自動(dòng)語(yǔ)義標(biāo)注技術(shù)[D];武漢大學(xué);2012年

2 竇平安;電子商務(wù)語(yǔ)義信息共享模式[D];吉林大學(xué);2009年

3 施冬材;基于對(duì)等網(wǎng)絡(luò)的語(yǔ)義發(fā)布/訂閱系統(tǒng)的關(guān)鍵技術(shù)研究[D];浙江大學(xué);2007年

4 郭曉君;關(guān)聯(lián)課程數(shù)據(jù)組織及知識(shí)管理研究[D];武漢大學(xué);2012年

5 黃庚保;區(qū)域質(zhì)量形勢(shì)評(píng)價(jià)及預(yù)測(cè)技術(shù)研究[D];重慶大學(xué);2009年

6 趙頂位;中小學(xué)生幾何類(lèi)比推理能力診斷評(píng)價(jià)中的理論與技術(shù)研究[D];江西師范大學(xué);2011年

7 陳海霞;計(jì)算機(jī)數(shù)據(jù)存儲(chǔ)系統(tǒng)中讀寫(xiě)頭/盤(pán)間超薄氣膜動(dòng)力穩(wěn)定性研究[D];華中科技大學(xué);2004年

8 姜贏;維度本體及其應(yīng)用[D];武漢大學(xué);2009年

9 袁晶;大規(guī)模軌跡數(shù)據(jù)的檢索、挖掘和應(yīng)用[D];中國(guó)科學(xué)技術(shù)大學(xué);2012年

10 袁遠(yuǎn)明;智慧城市信息系統(tǒng)關(guān)鍵技術(shù)研究[D];武漢大學(xué);2012年

相關(guān)碩士學(xué)位論文 前10條

1 陶承愷;基于屬性表的RDF數(shù)據(jù)存儲(chǔ)系統(tǒng)研究[D];南京大學(xué);2013年

2 劉譜;高擴(kuò)展的RDF數(shù)據(jù)存儲(chǔ)系統(tǒng)研究[D];華中科技大學(xué);2012年

3 劉暢;基于大規(guī)模模糊RDF數(shù)據(jù)的推理引擎[D];上海交通大學(xué);2012年

4 楊琴;基于關(guān)系數(shù)據(jù)庫(kù)的RDF存儲(chǔ)與查詢(xún)的研究與實(shí)現(xiàn)[D];電子科技大學(xué);2010年

5 盧珊;UML類(lèi)圖模型到RDF(S)的映射方法的研究[D];東北大學(xué);2010年

6 孫博;RDF數(shù)據(jù)管理系統(tǒng)研究[D];天津大學(xué);2010年

7 吳德龍;基于存儲(chǔ)優(yōu)化模型的RDF數(shù)據(jù)查詢(xún)機(jī)制研究[D];華中科技大學(xué);2011年

8 朱敏;基于HBase的RDF數(shù)據(jù)存儲(chǔ)與查詢(xún)研究[D];南京大學(xué);2013年

9 肖竹軍;基于RDF的語(yǔ)義節(jié)點(diǎn)間關(guān)系路徑的檢索[D];武漢理工大學(xué);2011年

10 程佳;一種基于Hadoop的RDF數(shù)據(jù)劃分與存儲(chǔ)研究[D];南京大學(xué);2013年

,

本文編號(hào):1380945

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/jisuanjikexuelunwen/1380945.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)f4d91***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com