基于本體的海量數據融合的研究與實現
本文關鍵詞:基于本體的海量數據融合的研究與實現,由筆耕文化傳播整理發(fā)布。
【摘要】:隨著大數據時代的到來,網絡中的數據量以前所未有的速度增長,網絡中的數據源也在以前所未有的規(guī)模增長,web2.0時代的到來使得每個人都成為了信息的發(fā)布者和消費者。然而,數據源和數據量的極大豐富帶來的一個負面問題就是搜索信息所花費的時間開銷不斷增大,雖然有高性能的搜索引擎的幫助,目前搜索引擎所能得到的僅僅是包含有關鍵詞的網頁,至于真正有用信息的獲取還需要用戶來逐個進行查找篩選。 本文對海量數據的融合及其并行化技術展開了一系列的研究,旨在通過對海量的數據和多種數據源的分析,獲取以實體對象為基本單位的全面信息,通過對多個數據源中數據的分析來還原出實體對象的完整信息,向用戶提供完整高效的信息查詢服務。 本文首先在單機本體構建流程的基礎上提出了并行化的本體構建算法,在構建好的本體的基礎上提出了并行化的本體融合過程,該過程采用基于人工指導的半自動融合算法,由計算機來完成大量重復的融合計算。在得到的融合數據的基礎上,介紹了針對融合數據所進行的復雜網絡分析,以一個或一組特定的對象為分析目標,采用迭代漸進式的分析方法,發(fā)揮了融合數據所具有的多種信息的優(yōu)勢,并將分析結果以可視化的方式直觀的展示出來。 最后,本文給出了基于本體的海量數據融合系統(tǒng)的原型系統(tǒng)的設計與實現。結合MapReduce框架對海量的數據預處理,并實現了MapReduce計算框架下的本體構建與本體融合算法和復雜網絡分析算法,采用B/S的架構,借助于HTML5的強大功能和豐富的表現力,向用戶以最直觀的方式展示融合結果和分析結果。 本文將傳統(tǒng)的本體構建方法與大數據分析相結合,提出了并行化的本體構建與融合算法,實現了對于海量數據的高效分析與融合,并在此基礎上進行了融合數據的應用設計.
【關鍵詞】:本體構建 本體融合 數據融合 并行計算
【學位授予單位】:北京郵電大學
【學位級別】:碩士
【學位授予年份】:2014
【分類號】:TP202
【目錄】:
- 摘要4-5
- ABSTRACT5-9
- 第一章 緒論9-16
- 1.1 選題背景及意義9-11
- 1.2 相關工作11-13
- 1.2.1 本體構建11
- 1.2.2 并行計算11-12
- 1.2.3 實體消歧12-13
- 1.3 論文的研究內容13-15
- 1.4 論文組織結構15-16
- 第二章 相關技術綜述16-24
- 2.1 本體介紹與應用16-17
- 2.2 數據融合17-18
- 2.3 NoSQL非關系型數據庫18-20
- 2.4 Hadoop介紹20-23
- 2.4.1 MapReduce20-22
- 2.4.2 HDFS22-23
- 2.5 本章小結23-24
- 第三章 并行化本體的構建與融合技術24-37
- 3.1 數據的預處理25-26
- 3.1.1 模塊描述25-26
- 3.1.2 具體流程26
- 3.2 單機環(huán)境下的本體構建算法26-28
- 3.2.1 算法思想26-27
- 3.2.2 流程描述27-28
- 3.3 并行環(huán)境下的本體構建算法28-30
- 3.3.1 算法思想28
- 3.3.2 流程描述28-29
- 3.3.3 本體的持久化29-30
- 3.4 并行環(huán)境下的本體融合算法30-36
- 3.4.1 算法思想30-33
- 3.4.2 流程描述33-35
- 3.4.3 同名實體消歧35-36
- 3.5 本章小結36-37
- 第四章 基于融合數據的對象關系分析37-47
- 4.1 對象關系網絡的提取37-39
- 4.2 事件驅動的節(jié)點關系分析39-41
- 4.3 網絡基本參數計算41-46
- 4.3.1 節(jié)點的度42-43
- 4.3.2 網絡的集聚系數43-44
- 4.3.3 PageRank排序44-46
- 4.4 本章小結46-47
- 第五章 原型系統(tǒng)的架構與功能設計47-52
- 5.1 系統(tǒng)的整體設計47-48
- 5.2 系統(tǒng)的詳細設計48-51
- 5.2.1 數據預處理48-49
- 5.2.2 并行化的本體構建49-50
- 5.2.3 并行化的本體融合50-51
- 5.2.4 對象關系分析51
- 5.3 本章小結51-52
- 第六章 原型系統(tǒng)的實現52-70
- 6.1 程序各個模塊實現52-56
- 6.1.1 數據源鏈接與預處理模塊52
- 6.1.2 本體構建模塊52-53
- 6.1.3 本體融合模塊53-54
- 6.1.4 關系分析模塊54-55
- 6.1.5 數據查詢模塊55-56
- 6.2 系統(tǒng)開發(fā)與部署環(huán)境56
- 6.3 系統(tǒng)性能測試56-58
- 6.3.1 本體構建的性能比較56-57
- 6.3.2 本體融合的性能比較57-58
- 6.4 系統(tǒng)效果展示58-69
- 6.4.1 數據預處理界面58-59
- 6.4.2 本體構架界面59-61
- 6.4.3 本體融合界面61-63
- 6.4.4 關系網絡分析界面63-69
- 6.5 本章小結69-70
- 第七章 結束語70-72
- 7.1 論文的工作內容70-71
- 7.2 下一步的工作展望71-72
- 參考文獻72-75
- 致謝75-76
【參考文獻】
中國期刊全文數據庫 前10條
1 郭黎;崔鐵軍;王玉海;盧晨琰;;多源空間數據融合技術探討[J];地理信息世界;2007年01期
2 王慶先;孫世新;尚明生;劉宴兵;;并行計算模型研究[J];計算機科學;2004年09期
3 黃德才;戚華春;;PageRank算法研究[J];計算機工程;2006年04期
4 李曉輝;王淑艷;;大數據及其挑戰(zhàn)[J];科技風;2012年23期
5 王志超;于劍;柴變芳;;基于集聚系數的鏈接社區(qū)發(fā)現方法[J];南京大學學報(自然科學版);2013年04期
6 ;第32次中國互聯網絡發(fā)展狀況統(tǒng)計報告[J];互聯網天地;2013年10期
7 丁晟春;李岳盟;甘利人;;基于頂層本體的領域本體綜合構建方法研究[J];情報理論與實踐;2007年02期
8 杜文華;本體構建方法比較研究[J];情報雜志;2005年10期
9 李曉輝;王盼卿;王寅龍;;基于本體的裝備領域信息集成研究[J];計算機技術與發(fā)展;2011年04期
10 王光磊;;MongoDB數據庫的應用研究和方案優(yōu)化[J];中國科技信息;2011年20期
中國博士學位論文全文數據庫 前2條
1 朱天;社會網絡中節(jié)點角色以及群體演化研究[D];北京郵電大學;2011年
2 張永新;面向Web數據集成的數據融合問題研究[D];山東大學;2012年
本文關鍵詞:基于本體的海量數據融合的研究與實現,由筆耕文化傳播整理發(fā)布。
,本文編號:393805
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/393805.html