天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

面向web規(guī)模RDF數(shù)據(jù)查詢算法的研究與實現(xiàn)

發(fā)布時間:2018-04-15 00:08

  本文選題:語義網(wǎng) + RDF數(shù)據(jù)。 參考:《東北大學》2014年碩士論文


【摘要】:目前因特網(wǎng)發(fā)展出現(xiàn)瓶頸的原因之一是由于沒有賦予網(wǎng)絡上的全部資源足夠的語義信息。最主要的原因在于,現(xiàn)在的網(wǎng)絡主要是基于超鏈接實現(xiàn)的,網(wǎng)絡只是知道如何顯示資源,卻不清楚資源的實際含義。而RDF (Resource Description Framework)正是由W3C提出的語義網(wǎng)的標準描述框架。隨著信息提取技術的發(fā)展和語義網(wǎng)的不斷進步,網(wǎng)絡中涌現(xiàn)出大量的RDF數(shù)據(jù),如何存儲、管理以及檢索如此龐大的RDF數(shù)據(jù)已經(jīng)成為了一項棘手卻亟待解決的問題。SPARQL查詢是W3C提出的對RDF進行查詢的標準查詢語言。目前RDF查詢算法面臨的主要問題是:(1)不支持帶有通配符的SPARQL查詢。(2)不能支持實時在線更新。(3)可擴展性差。本文基于以上三個問題,提出了基于索引的查詢算法以及分布式環(huán)境的查詢算法。針對以上問題,首先在第三章基于索引的查詢算法中做了如下工作:(1)采取基于圖的模型來存儲RDF數(shù)據(jù)。具體地講,本文通過基于索引的鄰接表存儲RDF數(shù)據(jù)。(2)本文在原始RDF圖的基礎上,對每個實體和類頂點增加一個標記信息。隨之,提出了一種新的索引結構VS*-tree。它可以對上述帶有數(shù)字標記信息的RDF圖進行快速索引,且維護代價較低,易于更新。(3)針對帶有數(shù)字標記信息的數(shù)據(jù)圖,本節(jié)提出了一種新的剪枝規(guī)則,這種剪枝規(guī)則可以完美的嵌入到本文提出的查詢算法中,并且同時適用于普通SPARQL查詢和帶有通配符的SPARQL查詢。其次,本文充分考慮了RDF數(shù)據(jù)本身的特點,在第四章分布式環(huán)境的算法中(1)提出了一種擴展性強的RDF數(shù)據(jù)系統(tǒng),該系統(tǒng)可以通過Hadoop框架可以直接利用任何現(xiàn)有集中式算法。(2)提出的數(shù)據(jù)分割技術和存儲技術可以顯著的降低查詢過程中的數(shù)據(jù)通信量。(3)給出了一種可以自動將查詢分解成可并行執(zhí)行片段的算法,使得大量獨立執(zhí)行片段可以在不進行通信的前提下,在數(shù)據(jù)存儲節(jié)點獨立獲得查詢子結果,進一步提高了算法的可擴展性。在本文的最后,通過大量實驗驗證了本文算法的有效性及高效性。
[Abstract]:One of the reasons for the bottleneck in the development of the Internet is that it does not give sufficient semantic information to all the resources on the network.The main reason is that the current network is mainly based on hyperlinks, the network only knows how to display resources, but not the actual meaning of resources.RDF Resource Description Framework is the standard description framework of semantic Web proposed by W3C.With the development of information extraction technology and the continuous progress of semantic web, a large number of RDF data emerge in the network, how to store,Managing and retrieving such huge RDF data has become a thorny and urgent problem. Sparql query is a standard query language proposed by W3C to query RDF.At present, the main problem of RDF query algorithm is that SPARQL query with wildcard character is not supported by SPARQL query.Based on the above three problems, this paper proposes an index-based query algorithm and a distributed environment query algorithm.In order to solve the above problems, we first do the following work in the third chapter indexing based query algorithm: 1) using graph based model to store RDF data.Specifically, this paper stores RDF data through an index-based adjacency table.) on the basis of the original RDF graph, this paper adds a marker information to each entity and class vertex.Then, a new index structure, VS- tree, is proposed.This section proposes a new pruning rule for data graphs with digital tag information, which can be indexed quickly and easily updated with low maintenance cost.This pruning rule can be perfectly embedded into the query algorithm proposed in this paper and can be applied to both normal SPARQL queries and SPARQL queries with wildcard characters.Secondly, this paper takes the characteristics of RDF data into full consideration, and in chapter 4, the algorithm of distributed environment, we propose a kind of RDF data system with strong expansibility.The system can directly use any existing centralized algorithm. The data segmentation technology and the storage technology can significantly reduce the data traffic in the query process through the Hadoop framework.An algorithm that decomposes into parallel execution fragments,A large number of independent execution fragments can obtain query sub-results independently in the data storage node without communication, which further improves the scalability of the algorithm.At the end of this paper, the effectiveness and efficiency of the proposed algorithm are verified by a large number of experiments.
【學位授予單位】:東北大學
【學位級別】:碩士
【學位授予年份】:2014
【分類號】:TP393.4

【相似文獻】

相關期刊論文 前10條

1 張麗紅;;查詢算法的優(yōu)化設計[J];職大學報;2009年02期

2 陳富強;奚建清;;商覆蓋立方體中下掘與上卷操作的查詢算法設計[J];信息技術;2011年04期

3 李英女,鄭國雄;鐵路客運信息查詢算法[J];鐵路計算機應用;2000年02期

4 徐紅波;郝忠孝;;一種基于Z曲線近似k-最近對查詢算法[J];計算機研究與發(fā)展;2008年02期

5 劉平;陳旭燦;李思昆;;嵌入式空間數(shù)據(jù)庫綜合查詢算法[J];計算機工程;2008年17期

6 趙智慧;;基于對象方向方位的連續(xù)方向查詢算法[J];齊齊哈爾大學學報(自然科學版);2010年04期

7 徐紅波;韓啟龍;潘海為;;空間數(shù)據(jù)庫最優(yōu)位置查詢算法研究[J];計算機工程與應用;2011年18期

8 杜左強;基于對象的空間數(shù)據(jù)庫的方位查詢算法[J];信息技術;2004年07期

9 徐紅波;郝忠孝;;一種采用Z曲線高維空間范圍查詢算法[J];小型微型計算機系統(tǒng);2009年10期

10 高靜波,李新友,唐澤圣,周曉輝;半動態(tài)矩形交查詢算法[J];軟件學報;1997年08期

相關會議論文 前10條

1 洪潤秋;金文;陳鋼;王能斌;;迭代查詢子查詢算法的研究[A];第十一屆全國數(shù)據(jù)庫學術會議論文集[C];1993年

2 常珂;劉辰;楊正球;;基于樹狀結構的查詢算法的設計與實現(xiàn)[A];中國通信學會第六屆學術年會論文集(中)[C];2009年

3 孫煥良;劉江秀;許景科;;基于楔的時間序列流雙向封裝過濾查詢算法[A];第二十五屆中國數(shù)據(jù)庫學術會議論文集(二)[C];2008年

4 李江波;周強;陳祖舜;;漢語詞典快速查詢算法研究[A];第二屆全國學生計算語言學研討會論文集[C];2004年

5 董科;王國仁;寧博;毛克明;趙相國;;基于壓縮葉子流的XML Twig查詢[A];第二十三屆中國數(shù)據(jù)庫學術會議論文集(研究報告篇)[C];2006年

6 劉旭輝;馮建華;洪親;;一種支持更新的圖可達性查詢算法[A];第二十四屆中國數(shù)據(jù)庫學術會議論文集(技術報告篇)[C];2007年

7 劉怡;郝云飛;;一種有效的復調音樂查詢算法[A];第三屆和諧人機環(huán)境聯(lián)合學術會議(HHME2007)論文集[C];2007年

8 黃海;侯穎;朱圣平;;一種多維向量并行查詢算法[A];2010年全國開放式分布與并行計算機學術會議論文集[C];2010年

9 徐忠華;張剡;陳玲;柏文陽;;基于星型模型的輪廓連接查詢算法[A];第26屆中國數(shù)據(jù)庫學術會議論文集(A輯)[C];2009年

10 陳冬霞;吉根林;武志峰;;一種基于簽名的XML查詢算法[A];第二十一屆中國數(shù)據(jù)庫學術會議論文集(技術報告篇)[C];2004年

相關博士學位論文 前7條

1 徐紅波;基于空間填充曲線高維空間查詢算法研究[D];哈爾濱理工大學;2010年

2 劉潤濤;基于序的空間數(shù)據(jù)索引及查詢算法研究[D];哈爾濱理工大學;2009年

3 季長清;云計算環(huán)境下的大規(guī)?臻g近鄰查詢算法研究[D];大連海事大學;2014年

4 鄒磊;圖數(shù)據(jù)庫中的子圖查詢算法研究[D];華中科技大學;2009年

5 謝鯤;布魯姆過濾器查詢算法及其應用研究[D];湖南大學;2007年

6 劉艷;基于主存的高維空間連接及查詢算法研究[D];哈爾濱理工大學;2011年

7 田小梅;多布魯姆過濾器查詢算法及其應用研究[D];湖南大學;2013年

相關碩士學位論文 前10條

1 黃海龍;大規(guī)模圖的圖查詢算法研究[D];燕山大學;2015年

2 李青;分布式計算環(huán)境下海量RDF數(shù)據(jù)的skyline查詢研究[D];鄭州大學;2015年

3 鄧育;空間近似關鍵字反遠鄰查詢方法研究[D];安徽工業(yè)大學;2015年

4 于世龍;信息物理融合系統(tǒng)資源索引與查詢技術研究[D];國防科學技術大學;2013年

5 郭巖;實時數(shù)據(jù)流相似性查詢算法的研究[D];華北電力大學;2015年

6 鐘麗娟;時間序列數(shù)據(jù)相似性與聚合top-k查詢算法研究與應用[D];浙江大學;2016年

7 李海莉;面向高速骨干網(wǎng)的網(wǎng)絡流量測量關鍵技術研究[D];解放軍信息工程大學;2014年

8 孟凡帥;基于HDFS的時空數(shù)據(jù)共享與查詢隱私保護的研究與實現(xiàn)[D];東北大學;2014年

9 劉增蘭;同構發(fā)布/訂閱系統(tǒng)的系統(tǒng)最優(yōu)化與并行查詢算法的研究與實現(xiàn)[D];東北大學;2014年

10 葉向東;面向web規(guī)模RDF數(shù)據(jù)查詢算法的研究與實現(xiàn)[D];東北大學;2014年



本文編號:1751622

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/guanlilunwen/ydhl/1751622.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶06df4***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com