天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 計算機論文 >

基于MapReduce模型的并行計算平臺的設計與實現(xiàn)

發(fā)布時間:2020-04-13 02:25
【摘要】: 隨著互聯(lián)網(wǎng)的迅猛發(fā)展,每天由網(wǎng)絡產(chǎn)生的數(shù)據(jù)量越來越龐大;ヂ(lián)網(wǎng)企業(yè)面對這些浩繁的數(shù)據(jù),常常陷入“數(shù)據(jù)豐富,信息貧乏”的尷尬境地。設計一個通用可擴展的平臺,來有效地處理海量數(shù)據(jù),不斷地從中挖掘出對運營商有價值的信息,成為互聯(lián)網(wǎng)企業(yè)發(fā)展的必然選擇。 MapReduce是由Google公司首先提出的,一種能在大型計算機集群上并發(fā)地處理海量數(shù)據(jù)的框架模型。使用者通過指定一個map函數(shù)將輸入數(shù)據(jù)轉化成為一系列中間鍵-值對,然后由一個自定義的reduce函數(shù)將具有相同鍵的值聚集起來,將結果輸出。很多現(xiàn)實世界對海量數(shù)據(jù)的處理,都可以用這種模型來表示。 本文在分析MapReduce模型的基礎上,結合自身的特點,提出了一種并發(fā)處理海量數(shù)據(jù)的更通用、更可擴展的平臺。 首先,我們提出了海量數(shù)據(jù)并發(fā)處理平臺的體系結構。該結構為客戶端-任務調(diào)度與執(zhí)行層-數(shù)據(jù)存儲層三層架構。在客戶端,通過可配置的XML文檔提交用戶任務。在進行任務調(diào)度與執(zhí)行層設計時,我們首先提出了幾點關鍵的策略,如通用平臺策略、負載均衡策略、中間結果處理策略和容錯策略。接著,我們提出了主控節(jié)點-分派節(jié)點.服務節(jié)點的三點式架構。其中,主控節(jié)點負責收集與處理其他節(jié)點的各種信息;分派節(jié)點負責解析、分派任務,獲取任務執(zhí)行結果;服務節(jié)點負責任務的具體執(zhí)行。三種節(jié)點互相配合,共同完成數(shù)據(jù)的并發(fā)處理。 接著,我們設計了存儲海量數(shù)據(jù)的分布式文件系統(tǒng)。分布式文件系統(tǒng)具有優(yōu)異的性能和吞吐率,較高的穩(wěn)定性和良好的可擴展性。 最后,我們在已經(jīng)搭建好的平臺上,進行了若干測試系統(tǒng)性能的實驗。我們通過單機與并發(fā)執(zhí)行用戶任務的對比實驗,說明了并行計算平臺的高效。我們通過執(zhí)行不同類型的任務,說明了如何在集群規(guī)模一定的情況下,實現(xiàn)性能調(diào)優(yōu)。
【學位授予單位】:浙江大學
【學位級別】:碩士
【學位授予年份】:2008
【分類號】:TP338.6

【引證文獻】

相關期刊論文 前10條

1 李s,

本文編號:2625471


資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/jisuanjikexuelunwen/2625471.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶a4b9c***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com