天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 計算機論文 >

基于GPU-like和GPU-CPU架構的異構片上網(wǎng)絡的設計與研究

發(fā)布時間:2017-04-11 07:06

  本文關鍵詞:基于GPU-like和GPU-CPU架構的異構片上網(wǎng)絡的設計與研究,由筆耕文化傳播整理發(fā)布。


【摘要】:進入二十一世紀以來,多核處理器的設計發(fā)展邁向了兩種不同的方向:一種是保持應用總體按序執(zhí)行的CPU,另一種則是更適用于并行計算的GPU。GPU自誕生伊始便在浮點計算性能上超越了CPU,GPU并行執(zhí)行與CPU順序執(zhí)行性能之間巨大的鴻溝使得大量的程序開發(fā)人員將程序中計算密集型的部分交付給GPU進行計算。計算機體系結構已經(jīng)從傳統(tǒng)的多核CPU-like時代跨越到多核GPU-like和GPU-CPU異構時代。而當前設計的處理器芯片大都通過片上網(wǎng)絡來訪問共享資源,因此片上網(wǎng)絡的配置對其性能和功耗有著重要影響。近期提出的異構片上網(wǎng)絡不僅其性能進一步接近于傳統(tǒng)的有緩沖區(qū)片上網(wǎng)絡,而且其面積開銷和功耗也明顯下降。然而,面向GPU-like架構和GPU-CPU異構體系結構的異構片上網(wǎng)絡設計目前尚未深入研究。GPU-like架構和GPU-CPU架構芯片為片上網(wǎng)絡的設計提出了新的挑戰(zhàn)。其一,Dennard定律的終結引發(fā)了處理器多核時代的暗硅問題,芯片的功耗限制使芯片上的晶體管點亮的數(shù)目達到了極限,導致處理器核心僅能在較短的時間里全部激活,大部分時間內,一些處理器核心區(qū)域無法激活,處于黑暗狀態(tài)。而片上網(wǎng)絡功耗在芯片整體功耗中比重很高,這驅使我們盡量降低片上網(wǎng)絡的功耗,為核心保留更多的功耗預算。其二,與CPU相比,GPU線程數(shù)量更多,并行度高,這種特性使得GPU與末級高速緩沖存儲器和存儲控制器間的指令與數(shù)據(jù)交換更加頻繁;贑PU多核處理器的片上網(wǎng)絡上的交通比較平均,而基于整合了GPU和CPU異構芯片的片上網(wǎng)絡上的交通熱點相對更集中,GPU迥異于CPU的特性改變了片上網(wǎng)絡中的交通特征。如何使異構片上網(wǎng)絡得以適應新型的GPU-like和GPU-CPU架構是當前亟待解決的問題。為此,本文首先針對芯片的暗硅問題,基于GPU-like芯片按照GPGPU負載對暗硅的適應程度將其分為暗硅敏感型、暗硅遲鈍型和暗硅適應型三類。通過分析不同放置方式的異構片上網(wǎng)絡對負載性能和片上網(wǎng)絡功耗的影響,來探究異構片上網(wǎng)絡對GPU-like芯片暗硅程度的影響。實驗結果顯示,相比于傳統(tǒng)的有緩沖區(qū)片上網(wǎng)絡,異構片上網(wǎng)絡可以有效降低GPU-like芯片的暗硅程度,使芯片至少可以在額定功耗預算下多激活一個處理器核心。對于暗硅敏感型負載,在額定功耗預算下,使用異構片上網(wǎng)絡至少提升了10%的性能,為額定功耗預算下片上網(wǎng)絡類型的選擇提供了參考。其次,基于GPU-CPU架構芯片,通過調整有緩沖區(qū)和無緩沖區(qū)路由器的放置方式,對多種基于"熱土豆"路由的靜態(tài)異構片上網(wǎng)絡的性能和功耗進行了評估,實驗結果對于進一步探索片上互聯(lián)的設計空間是大有裨益的。最后,本文提出一種面向異構片上網(wǎng)絡的基于信用的單向流控機制(UFC)來控制網(wǎng)絡擁塞,從而保證有緩沖區(qū)路由器始終有空閑的緩沖區(qū)保存來自于相鄰無緩沖區(qū)路由器的分片。實驗結果顯示,相比于"熱土豆"路由,UFC可以將異構片上網(wǎng)絡的性能平均提升14.1%,而網(wǎng)絡的功耗平均提升僅有5.3%。
【關鍵詞】:GPU 片上網(wǎng)絡 異構性 拓撲結構 流量控制
【學位授予單位】:北京工業(yè)大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:TP332
【目錄】:
  • 摘要4-6
  • Abstract6-10
  • 第1章 緒論10-18
  • 1.1 課題背景和研究意義10-13
  • 1.1.1 選題背景10-11
  • 1.1.2 研究意義11
  • 1.1.3 研究內容11-13
  • 1.2 國內外研究現(xiàn)狀13-17
  • 1.2.1 無緩沖區(qū)片上網(wǎng)絡13-16
  • 1.2.2 異構片上網(wǎng)絡16
  • 1.2.3 片上網(wǎng)絡流量控制機制16-17
  • 1.3 論文的結構安排17-18
  • 第2章 多核處理器與片上網(wǎng)絡18-32
  • 2.1 引言18
  • 2.2 多核處理器18-21
  • 2.2.1 多核處理器基礎18-20
  • 2.2.2 多核處理器的應用20-21
  • 2.3 片上網(wǎng)絡21-31
  • 2.3.1 片上網(wǎng)絡基礎21-22
  • 2.3.2 片上網(wǎng)絡拓撲結構22-24
  • 2.3.3 片上網(wǎng)絡交換機制24-25
  • 2.3.4 片上網(wǎng)絡虛擬通道25-26
  • 2.3.5 片上網(wǎng)絡路由算法26-31
  • 2.4 本章小結31-32
  • 第3章 從片上網(wǎng)絡異構性的角度對暗硅程度緩解的探究32-42
  • 3.1 引言32
  • 3.2 動機32-33
  • 3.3 實驗環(huán)境33-35
  • 3.4 實驗結果與分析35-40
  • 3.4.1 片上網(wǎng)絡功耗分析35-37
  • 3.4.2 程序性能分析37-39
  • 3.4.3 固定功耗預算下片上網(wǎng)絡類型的選擇39-40
  • 3.5 本章小結40-42
  • 第4章 基于GPU-CPU架構的異構片上網(wǎng)絡及流量控制設計42-56
  • 4.1 引言42
  • 4.2 靜態(tài)異構片上網(wǎng)絡設計42-45
  • 4.2.1 無緩沖區(qū)路由器設計42-43
  • 4.2.2 有緩沖區(qū)路由器設計43-44
  • 4.2.3 有緩沖區(qū)路由器及無緩沖區(qū)路由器的放置方式44-45
  • 4.3 單向流量控制機制45-47
  • 4.3.1 面向異構片上網(wǎng)絡的基于信用的流量控制機制45-46
  • 4.3.2 單向流量控制機制描述46-47
  • 4.3.3 死鎖與活鎖47
  • 4.4 實驗結果與分析47-55
  • 4.4.1 實驗環(huán)境47-48
  • 4.4.2 基準測試程序48-49
  • 4.4.3 度量標準49-50
  • 4.4.4 實驗結果50-55
  • 4.5 本章小結55-56
  • 結論56-58
  • 參考 文獻58-64
  • 攻讀碩士學位期間所取得的成果64-66
  • 致謝66

【參考文獻】

中國期刊全文數(shù)據(jù)庫 前1條

1 歐陽一鳴;張一棟;梁華國;黃正峰;常郝;;基于虛通道故障粒度劃分的3D NoC容錯路由器設計[J];計算機研究與發(fā)展;2014年09期


  本文關鍵詞:基于GPU-like和GPU-CPU架構的異構片上網(wǎng)絡的設計與研究,由筆耕文化傳播整理發(fā)布。

,

本文編號:298556

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/jisuanjikexuelunwen/298556.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶c31de***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com