天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

面向批量處理的大數(shù)據(jù)中心檢索關(guān)鍵技術(shù)研究

發(fā)布時間:2017-09-15 15:16

  本文關(guān)鍵詞:面向批量處理的大數(shù)據(jù)中心檢索關(guān)鍵技術(shù)研究


  更多相關(guān)文章: 大數(shù)據(jù) 數(shù)據(jù)中心 檢索 信息過濾 負載均衡 關(guān)聯(lián)分析 Hadoop


【摘要】:隨著大數(shù)據(jù)時代的到來,數(shù)據(jù)開始成為計算的中心。大數(shù)據(jù)中心能對超大規(guī)模的異構(gòu)數(shù)據(jù)集進行存儲和處理,并發(fā)地向大量用戶提供全天候服務,是大數(shù)據(jù)充分發(fā)揮價值的關(guān)鍵。批量處理是大數(shù)據(jù)中心上的重要計算形態(tài),涉及對超大規(guī)模數(shù)據(jù)集的精確、深入分析。這就要求首先對數(shù)據(jù)進行高速、高效、高精度的檢索。檢索是批量處理的基礎環(huán)節(jié),制約著大數(shù)據(jù)的使用價值。大數(shù)據(jù)中心復雜的數(shù)據(jù)結(jié)構(gòu)、巨大且不斷擴張的集群規(guī)模和為大量用戶提供全天候服務的需求為檢索技術(shù)提出了巨大挑戰(zhàn),因此大數(shù)據(jù)中心的檢索關(guān)鍵技術(shù)研究已成為人們關(guān)注的重點。為減輕大量檢索請求對索引系統(tǒng)造成的負擔,均衡大數(shù)據(jù)中心節(jié)點間的負載,增強檢索系統(tǒng)和大數(shù)據(jù)平臺的可擴展性和可靠性,本文主要進行了如下研究:1.為減輕大量檢索請求對索引系統(tǒng)造成的負擔,提高高并發(fā)環(huán)境下的數(shù)據(jù)查詢性能,提出了一種面向批量處理的大數(shù)據(jù)混合檢索模型(Mix Retrieval Model, MRM),該模型主要由多維查詢過濾模型(Big Data Information Multi-rule Filtering Model, BDIMFM)和層次索引機制組成。BDIMFM降低了檢索請求對無關(guān)索引結(jié)構(gòu)造成的負擔,層次索引機制實現(xiàn)了對檢索請求的精確定位,從而在保證精度的前提下,降低檢索任務對性能的消耗,提高了高并發(fā)環(huán)境下的檢索性能。實驗證明,在大數(shù)據(jù)中心批量處理環(huán)境下,該模型可以有效提高檢索效率,降低大數(shù)據(jù)存儲和處理平臺負擔。2.為提高負載均衡效果,減輕負載遷移對大數(shù)據(jù)中心造成的負擔,針對大數(shù)據(jù)中心上數(shù)據(jù)文件間普遍存在關(guān)聯(lián)的特征,提出了一種基于關(guān)聯(lián)分析的大數(shù)據(jù)中心負載均衡算法(Relationship Based multi-Indicator Load Capacity algorithm, RBmILC)。算法主要由負載監(jiān)測、負載預測和負載遷移模塊構(gòu)成。實現(xiàn)了對數(shù)據(jù)文件和數(shù)據(jù)節(jié)點間關(guān)聯(lián)關(guān)系的分析和量化,并在此基礎上實現(xiàn)對大數(shù)據(jù)中心負載的預測和有效的負載遷移,避免了負載重復遷移對資源的消耗,提高負載遷移效率,改善負載均衡效果,提高數(shù)據(jù)提取性能。實驗結(jié)果表明,本算法能夠獲得更好的負載均衡效果。3.為提高大數(shù)據(jù)中心索引系統(tǒng)的可擴展性和可靠性,支持大數(shù)據(jù)中心的規(guī)模不斷增長和多用戶全天候服務,設計了一種多層次Hadoop系統(tǒng)。設計了SeMNode作為連接Master和Slave層的樞紐,負責Region層的元數(shù)據(jù)管理和任務分發(fā)。實現(xiàn)Master節(jié)點的功能垂直劃分和部分轉(zhuǎn)移,減輕了Master節(jié)點負擔,縮短了故障恢復時間。通過對Hadoop中的相關(guān)函數(shù)進行修改和重寫,并對可擴展性及可靠性進行實驗,證明該系統(tǒng)可有效改善Master節(jié)點的負載情況和故障恢復耗時,提高Hadoop的可擴展性和可靠性。
【關(guān)鍵詞】:大數(shù)據(jù) 數(shù)據(jù)中心 檢索 信息過濾 負載均衡 關(guān)聯(lián)分析 Hadoop
【學位授予單位】:解放軍信息工程大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:TP311.13
【目錄】:
  • 摘要4-5
  • Abstract5-10
  • 第一章 緒論10-20
  • 1.1 研究背景及意義10-12
  • 1.2 國內(nèi)外研究現(xiàn)狀12-18
  • 1.2.1 大數(shù)據(jù)中心檢索問題12-15
  • 1.2.2 大數(shù)據(jù)中心計算平臺15-18
  • 1.3 本文的主要工作18
  • 1.4 本文的組織結(jié)構(gòu)18-20
  • 第二章 相關(guān)知識20-32
  • 2.1 大數(shù)據(jù)概述20-23
  • 2.1.1 大數(shù)據(jù)的定義及特征20-21
  • 2.1.2 大數(shù)據(jù)關(guān)鍵技術(shù)21-23
  • 2.2 大數(shù)據(jù)中心概述23-25
  • 2.2.1 大數(shù)據(jù)中心的定義及特征23-24
  • 2.2.2 大數(shù)據(jù)中心上計算的特征24-25
  • 2.3 數(shù)據(jù)檢索關(guān)鍵技術(shù)25-28
  • 2.3.1 數(shù)據(jù)查詢技術(shù)26-28
  • 2.3.2 數(shù)據(jù)布局技術(shù)28
  • 2.4 Hadoop28-31
  • 2.4.1 Hadoop系統(tǒng)架構(gòu)28-29
  • 2.4.2 Hadoop主要組件29-31
  • 2.4.3 Hadoop的調(diào)度方法31
  • 2.5 本章小結(jié)31-32
  • 第三章 面向批量處理的大數(shù)據(jù)混合索引模型32-50
  • 3.1 一種多規(guī)則信息過濾模型BDIMFM32-36
  • 3.1.1 基本思想32-33
  • 3.1.2 多維查詢過濾機制33-36
  • 3.2 BDIMFM的部署策略36-39
  • 3.3 大數(shù)據(jù)混合索引模型MRM39-42
  • 3.3.1 MRM的體系結(jié)構(gòu)39-40
  • 3.3.2 MRM的創(chuàng)建40-42
  • 3.4 查詢流程42-43
  • 3.5 實驗與性能分析43-49
  • 3.5.1 實驗環(huán)境43-45
  • 3.5.2 實驗方法與性能分析45-49
  • 3.6 本章小結(jié)49-50
  • 第四章 基于關(guān)聯(lián)分析的大數(shù)據(jù)中心負載均衡算法50-66
  • 4.1 Hadoop的負載均衡策略50-52
  • 4.2 基于關(guān)聯(lián)分析的Hadoop負載均衡算法52-61
  • 4.2.1 問題建模53-55
  • 4.2.2 RBmILC算法基本思想55
  • 4.2.3 負載監(jiān)測模塊55-57
  • 4.2.4 負載預測模塊57-60
  • 4.2.5 負載遷移模塊60-61
  • 4.3 實驗與性能分析61-64
  • 4.3.1 實驗環(huán)境61-62
  • 4.3.2 實驗方法與性能分析62-64
  • 4.4 本章小結(jié)64-66
  • 第五章 一種多層次Hadoop系統(tǒng)設計66-82
  • 5.1 Hadoop可擴展性及可靠性分析66-68
  • 5.1.1 數(shù)據(jù)管理66
  • 5.1.2 任務管理66-68
  • 5.2 多層次Hadoop68-75
  • 5.2.1 體系結(jié)構(gòu)68-69
  • 5.2.2 通信機制69-73
  • 5.2.3 備份機制73-74
  • 5.2.4 選舉機制74-75
  • 5.3 關(guān)鍵組件設計75-77
  • 5.3.1 Master層75-76
  • 5.3.2 Region層76-77
  • 5.3.3 Slave層77
  • 5.4 實驗與性能分析77-81
  • 5.4.1 實驗環(huán)境77-78
  • 5.4.2 實驗方法與性能分析78-81
  • 5.5 本章小結(jié)81-82
  • 第六章 總結(jié)與展望82-84
  • 6.1 本文工作總結(jié)82-83
  • 6.2 下一步工作83-84
  • 致謝84-85
  • 參考文獻85-89
  • 作者簡歷89

【參考文獻】

中國期刊全文數(shù)據(jù)庫 前8條

1 陳曦;陳華鈞;顧s頬Z;張寧豫;陳嬌彥;于彤;;一種基于Hadoop的語義大數(shù)據(jù)分布式推理框架[J];計算機研究與發(fā)展;2013年S2期

2 林偉偉;劉波;;基于動態(tài)帶寬分配的Hadoop數(shù)據(jù)負載均衡方法[J];華南理工大學學報(自然科學版);2012年09期

3 亓開元;趙卓峰;房俊;馬強;;針對高速數(shù)據(jù)流的大規(guī)模數(shù)據(jù)實時處理方法[J];計算機學報;2012年03期

4 李文中;郭勝;許平;陸桑璐;陳道蓄;;服務組合中一種自適應的負載均衡算法[J];軟件學報;2006年05期

5 劉仲,周興銘;基于動態(tài)區(qū)間映射的數(shù)據(jù)對象布局算法[J];軟件學報;2005年11期

6 潘泉,葉西寧,張洪才;廣義概率數(shù)據(jù)關(guān)聯(lián)算法[J];電子學報;2005年03期

7 李德仁,王樹良,李德毅,王新洲;論空間數(shù)據(jù)挖掘和知識發(fā)現(xiàn)的理論與方法[J];武漢大學學報(信息科學版);2002年03期

8 李德毅;知識表示中的不確定性[J];中國工程科學;2000年10期

,

本文編號:857293

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/shoufeilunwen/xixikjs/857293.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶5e0a0***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com