天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 計算機論文 >

CPU-GPU異構并行計算體系的設計與實現

發(fā)布時間:2017-04-16 10:00

  本文關鍵詞:CPU-GPU異構并行計算體系的設計與實現,由筆耕文化傳播整理發(fā)布。


【摘要】:隨著終端設備中CPU和GPU硬件的不斷升級,如何為低技術門檻用戶提供高性能計算成為了當前的研究熱點。在綠色高性能計算時代,CPU-GPU異構計算體系能夠提供良好的通用性、性能和效能,具有廣闊的發(fā)展前景。本文以現有桌面系統(tǒng)中的CPU和GPU硬件資源為基礎,從任務劃分和數據傳輸兩方面對原有CPU-GPU異構并行技術進行了優(yōu)化,降低用戶對數據分配和處理的復雜度,設計并實現了CPU-GPU異構并行計算體系,提高了終端設備的處理能力。本文的研究內容及成果主要有以下幾個方面:(1)在分析和研究了桌面系統(tǒng)中多核CPU、GPU架構,以及原有CPU-GPU異構并行技術的基礎上,優(yōu)化異構并行計算的解決方法,設計了異構并行計算架構,通過部署基于異構桌面系統(tǒng)的結點組成了并行計算體系。(2)任務分配上,計算體系按照任務的可并行性對任務進行劃分,根據各異構結點的計算資源和帶寬條件,從并行執(zhí)行時間出發(fā),對任務調度算法進行優(yōu)化,設計負載平衡調度方案,以實現資源的最優(yōu)配置。(3)計算體系在存儲資源上,整體采用分布式存儲的方式,桌面系統(tǒng)內CPU-GPU異構并行采用虛擬統(tǒng)一存儲的方式,通過全局分布式存儲與局部共享存儲來平衡整體性能與編程復雜性。(4)體系采用CUDA+MPI的方式對分布式并行通信進行了優(yōu)化,實現異步處理模式,以及GPU-GPU之間的數據直接傳輸;結點內在原有CPU-GPU異構通信方式的基礎上,優(yōu)化了基于總線方式的異構通信方法,通過全局數組映射數據存儲的方式,減少數據傳輸次數,節(jié)約計算時間。本文針對體系中并行執(zhí)行效率和通信傳輸性能,通過自建數據特征匹配庫對該異構并行計算體系進行了測試。通過實驗數據的對比,相比傳統(tǒng)CPU-GPU異構并行計算結構,本文所做的優(yōu)化設計明顯提高了計算性能;異構并行計算體系的性能也優(yōu)于傳統(tǒng)以CPU主導的單GPU和單CPU并行計算體系。
【關鍵詞】:并行計算 高性能計算 CPU-GPU異構 負載平衡算法
【學位授予單位】:江蘇科技大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:TP391.41;TP338.6
【目錄】:
  • 摘要6-7
  • Abstract7-13
  • 第1章 緒論13-21
  • 1.1 課題研究背景和意義13-14
  • 1.2 國內外研究現狀及發(fā)展趨勢14-19
  • 1.2.1 CPU并行計算發(fā)展及研究現狀15-16
  • 1.2.2 GPU并行計算發(fā)展及研究現狀16-17
  • 1.2.3 異構并行計算的研究現狀及不足17-19
  • 1.3 本文的主要工作19
  • 1.4 論文的組織結構19-21
  • 第2章 并行計算關鍵技術的研究21-37
  • 2.1 多核CPU并行計算的關鍵技術21-23
  • 2.2 多核GPU并行計算的關鍵技術23-26
  • 2.3 現有并行計算體系結構26-28
  • 2.3.1 現有高性能計算體系結構26-27
  • 2.3.2 分布式并行計算體系結構27-28
  • 2.4 并行計算訪存模型28-31
  • 2.5 并行計算通信研究31-36
  • 2.5.1 并行計算體系數據傳輸研究31-33
  • 2.5.2 消息傳輸編程原理33-36
  • 2.6 本章小結36-37
  • 第3章 異構并行計算設計與實現37-45
  • 3.1 CPU-GPU異構方法的優(yōu)化37
  • 3.2 CPU-GPU異構并行架構37-39
  • 3.3 負載平衡設計39-40
  • 3.3.1 CPU-GPU任務劃分39
  • 3.3.2 CPU-GPU通信傳輸設計39-40
  • 3.4 CPU-GPU存儲模型40
  • 3.5 整體流程40-41
  • 3.6 數據測試與分析41-44
  • 3.6.1 實驗測試環(huán)境41-42
  • 3.6.2 實驗測試結果42-43
  • 3.6.3 結果分析43-44
  • 3.7 本章小結44-45
  • 第4章 體系的整體設計與實現45-63
  • 4.1 設計思路45-47
  • 4.1.1 體系設計目標45-46
  • 4.1.2 設計細節(jié)分析46-47
  • 4.2 體系架構設計與分析47-49
  • 4.3 異構并行計算體系網絡架構49-50
  • 4.3.1 以太網下計算結點I/O架構49
  • 4.3.2 Infiniband計算結點I/O架構49-50
  • 4.4 負載平衡50-56
  • 4.4.1 任務分析和劃分52-53
  • 4.4.2 數據傳輸控制53-56
  • 4.5 詳細設計56-61
  • 4.5.1 整體設計56-58
  • 4.5.2 負載平衡算法設計58-61
  • 4.6 整體流程61
  • 4.7 本章小結61-63
  • 第5章 體系平臺測試和總結63-67
  • 5.1 測試環(huán)境準備63-64
  • 5.2 體系性能測試64-65
  • 5.3 測試數據分析65-66
  • 5.4 本章小結66-67
  • 總結與展望67-69
  • 參考文獻69-72
  • 攻讀碩士學位期間發(fā)表的論文72-74
  • 致謝74

【參考文獻】

中國期刊全文數據庫 前2條

1 陳華平 ;黃劉生 ;安虹 ;陳國良;;并行分布計算中的任務調度及其分類[J];計算機科學;2001年01期

2 柴亞輝;沈文楓;張倬;唐振;;Cell BE高性能計算實驗平臺設計與實現[J];實驗室研究與探索;2011年05期


  本文關鍵詞:CPU-GPU異構并行計算體系的設計與實現,由筆耕文化傳播整理發(fā)布。

,

本文編號:310539

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/jisuanjikexuelunwen/310539.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶56b90***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com