基于粒子模擬問題的GPU高性能計(jì)算系統(tǒng)
發(fā)布時(shí)間:2020-12-10 11:32
計(jì)算科學(xué)同理論和物理實(shí)驗(yàn)并列已成為科學(xué)研究的第三支柱。由于它對(duì)計(jì)算的需求是無窮無盡的,因此高性能計(jì)算成為計(jì)算科學(xué)中非常關(guān)鍵的推動(dòng)力量。提高計(jì)算速度的方法一般采用更快的處理器等硬件設(shè)備或者采用更優(yōu)化的程序設(shè)計(jì)方法和函數(shù)庫。近年來,CPU一直按照摩爾定律所預(yù)測的速度發(fā)展,但是采用提高CPU制程和主頻的來提高CPU的計(jì)算能力的傳統(tǒng)辦法遇到工藝上的壁壘,暫時(shí)無法突破。另一方面,采用上述方法所導(dǎo)致的功耗與發(fā)熱量過大,也制約了CPU的快速發(fā)展。GPU原本是一種處理圖形任務(wù)的處理器。由于它的特殊架構(gòu),使其非常適合于高效率低成本的高性能并行數(shù)值計(jì)算,因此最近幾年得到快速的發(fā)展,也逐漸成為高性能計(jì)算一個(gè)重要分支。分子動(dòng)力學(xué)與宇宙學(xué)作為計(jì)算科學(xué)兩個(gè)重要的應(yīng)用領(lǐng)域,通常需要解決復(fù)雜的科學(xué)計(jì)算與數(shù)據(jù)處理問題。粒子模擬問題是這兩個(gè)應(yīng)用領(lǐng)域經(jīng)常遇到的計(jì)算模擬問題,然而目前采用基于CPU的高性能計(jì)算技術(shù)不能滿足上述領(lǐng)域快速地解決粒子計(jì)算模擬問題的要求,從而大大制約了科學(xué)研究的進(jìn)程。因此,本文就這一粒子模擬問題所遇到的計(jì)算瓶頸,提出了一套基于GPU高性能計(jì)算的解決方案。本文將首先設(shè)計(jì)搭建基于GPU的高性能計(jì)算硬件平臺(tái)...
【文章來源】:復(fù)旦大學(xué)上海市 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:54 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
Top500總計(jì)算能力、排名第一、排名第500的系統(tǒng)圖
如圖2.1所示,比如45nm,就是該制造工藝下可以實(shí)現(xiàn)的最小GATE長度為45nm。GATE加上高電壓的時(shí)候,它的下方會(huì)為SourCe和Drain兩極架起一座電子橋,仿佛按下了一個(gè)開關(guān),這樣S/D兩極就可以導(dǎo)通。電子穿過S/D用的時(shí)間越短,一個(gè)MOS管的動(dòng)作就越快,整個(gè)芯片就會(huì)越快。想要縮短電子穿過S/D的時(shí)間,只有縮短距離,即GATE的長度。所以為了保證芯片取得相應(yīng)制程下的最快的速度
GPU計(jì)算系統(tǒng)不是說不需要CPU而直接采用GPU來搭建系作用在整個(gè)計(jì)算系統(tǒng)中弱化了,由本來所擔(dān)任計(jì)算的關(guān)鍵角色制GPU計(jì)算設(shè)備的角色。用戶向CPU服務(wù)器遞交所要計(jì)算的服務(wù)器來分配計(jì)算任務(wù)給所控制的GPU計(jì)算設(shè)備,GPU計(jì)算回到CPU服務(wù)器上,最終返回給用戶。CPU服務(wù)器在計(jì)算的算的數(shù)據(jù)讀入服務(wù)器內(nèi)存,然后通過PCI一E接口數(shù)據(jù)交換到存中,GPU計(jì)算時(shí),在其顯存中讀取數(shù)據(jù)來進(jìn)行計(jì)算。所搭建的GPU高性能計(jì)算系統(tǒng)分為兩種,主要是針對(duì)不同的應(yīng)單任務(wù)的計(jì)算系統(tǒng),主要是針對(duì)計(jì)算任務(wù)不多的使用者所提出計(jì)算系統(tǒng)成本比較低。如圖3.2(a)所示,搭建時(shí)采用一塊Tesl集成在CPU服務(wù)器的主板上。第二種是多任務(wù)的計(jì)算系統(tǒng),多的使用者,但是相對(duì)于單任務(wù)系統(tǒng)的成本提高不少。主要采用1070設(shè)備外接集成到CPU服務(wù)器上。
【參考文獻(xiàn)】:
期刊論文
[1]圖形處理器用于通用計(jì)算的技術(shù)、現(xiàn)狀及其挑戰(zhàn)[J]. 吳恩華. 軟件學(xué)報(bào). 2004(10)
本文編號(hào):2908622
【文章來源】:復(fù)旦大學(xué)上海市 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:54 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
Top500總計(jì)算能力、排名第一、排名第500的系統(tǒng)圖
如圖2.1所示,比如45nm,就是該制造工藝下可以實(shí)現(xiàn)的最小GATE長度為45nm。GATE加上高電壓的時(shí)候,它的下方會(huì)為SourCe和Drain兩極架起一座電子橋,仿佛按下了一個(gè)開關(guān),這樣S/D兩極就可以導(dǎo)通。電子穿過S/D用的時(shí)間越短,一個(gè)MOS管的動(dòng)作就越快,整個(gè)芯片就會(huì)越快。想要縮短電子穿過S/D的時(shí)間,只有縮短距離,即GATE的長度。所以為了保證芯片取得相應(yīng)制程下的最快的速度
GPU計(jì)算系統(tǒng)不是說不需要CPU而直接采用GPU來搭建系作用在整個(gè)計(jì)算系統(tǒng)中弱化了,由本來所擔(dān)任計(jì)算的關(guān)鍵角色制GPU計(jì)算設(shè)備的角色。用戶向CPU服務(wù)器遞交所要計(jì)算的服務(wù)器來分配計(jì)算任務(wù)給所控制的GPU計(jì)算設(shè)備,GPU計(jì)算回到CPU服務(wù)器上,最終返回給用戶。CPU服務(wù)器在計(jì)算的算的數(shù)據(jù)讀入服務(wù)器內(nèi)存,然后通過PCI一E接口數(shù)據(jù)交換到存中,GPU計(jì)算時(shí),在其顯存中讀取數(shù)據(jù)來進(jìn)行計(jì)算。所搭建的GPU高性能計(jì)算系統(tǒng)分為兩種,主要是針對(duì)不同的應(yīng)單任務(wù)的計(jì)算系統(tǒng),主要是針對(duì)計(jì)算任務(wù)不多的使用者所提出計(jì)算系統(tǒng)成本比較低。如圖3.2(a)所示,搭建時(shí)采用一塊Tesl集成在CPU服務(wù)器的主板上。第二種是多任務(wù)的計(jì)算系統(tǒng),多的使用者,但是相對(duì)于單任務(wù)系統(tǒng)的成本提高不少。主要采用1070設(shè)備外接集成到CPU服務(wù)器上。
【參考文獻(xiàn)】:
期刊論文
[1]圖形處理器用于通用計(jì)算的技術(shù)、現(xiàn)狀及其挑戰(zhàn)[J]. 吳恩華. 軟件學(xué)報(bào). 2004(10)
本文編號(hào):2908622
本文鏈接:http://www.sikaile.net/kejilunwen/jisuanjikexuelunwen/2908622.html
最近更新
教材專著