CPU/GPU異構(gòu)集群并行計(jì)算模型研究
發(fā)布時(shí)間:2022-01-16 17:02
國(guó)民經(jīng)濟(jì)和科學(xué)技術(shù)的快速發(fā)展對(duì)高性能計(jì)算機(jī)的性能提出了更高的要求,采用通用CPU研制高性能計(jì)算機(jī)的傳統(tǒng)方法,在能耗、散熱、成本等方面遇到了重大的挑戰(zhàn)。異構(gòu)體系結(jié)構(gòu)結(jié)合了通用處理器和加速處理器兩者的優(yōu)勢(shì),逐漸成為高性能計(jì)算機(jī)領(lǐng)域的主流體系結(jié)構(gòu)。GPU以其強(qiáng)大的運(yùn)算能力、高存儲(chǔ)帶寬、低功耗以及較好的可編程性,在異構(gòu)計(jì)算機(jī)系統(tǒng)設(shè)計(jì)中確立了主導(dǎo)地位。在綠色高性能計(jì)算時(shí)代,CPU/GPU異構(gòu)系統(tǒng)是一種非常有發(fā)展前景的并行計(jì)算機(jī)類型。大型CPU/GPU異構(gòu)系統(tǒng)強(qiáng)大的計(jì)算能力為大規(guī)?茖W(xué)和工程計(jì)算提供了很好的機(jī)遇,然而其復(fù)雜的硬件結(jié)構(gòu)和獨(dú)特的程序執(zhí)行特點(diǎn)又給眾多高性能計(jì)算研究人員提出了巨大的難題。作為并行計(jì)算的一個(gè)分支,并行計(jì)算模型是對(duì)底層并行計(jì)算機(jī)系統(tǒng)的抽象,其用少量參數(shù)反映并行計(jì)算機(jī)系統(tǒng)的資源和性能特征,是聯(lián)系并行編程模型與底層并行計(jì)算機(jī)系統(tǒng)的紐帶,對(duì)算法設(shè)計(jì)者意義重大。并行計(jì)算模型一般具有通用性,然而,對(duì)于新興的CPU/GPU異構(gòu)高性能計(jì)算系統(tǒng),由于包含了三個(gè)層次的異構(gòu)特點(diǎn),現(xiàn)有相關(guān)模型已無法準(zhǔn)確描述其結(jié)構(gòu)特點(diǎn)和性能影響因素,因此迫切需要針對(duì)該類高性能計(jì)算系統(tǒng)開展并行計(jì)算模型研究,從而為當(dāng)前以...
【文章來源】:國(guó)防科技大學(xué)湖南省 211工程院校 985工程院校
【文章頁數(shù)】:74 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
TOP500超級(jí)計(jì)算機(jī)體系結(jié)構(gòu)的發(fā)展趨勢(shì)
像 邊 緣 檢 測(cè)、 圖 形 去 噪 [ 13 ] 、以 及圖 像匹 配 等都 能很 好 地移 高 的 加 速比 。 另 外 也有 研 究 者 對(duì)在 CU D A 提供 的 CU B L A 運(yùn) 算 的 優(yōu) 化 , 甚 至 有 些 研 究 者 提 出 了 關(guān) 于 CU D A 并 行 圖 些應(yīng) 用 的 實(shí) 現(xiàn)都 得 益 于 GP U 在高 性 能 計(jì) 算方 面 所 具有 的 優(yōu) , 2 ) 高 密 集的 運(yùn) 算 ,3 ) 超 長(zhǎng)圖 形 流水 線。 G P U 與 CP U 的 電 路相 對(duì) 簡(jiǎn)單 , 而且 對(duì) Ca c h e 的 需 求 較 小, 所 以大 部 分 晶電 路 和 多條 流 水 線 ,使 GP U 的計(jì) 算 速度 有 了 突 破性 的 飛 躍 運(yùn)算 的 能力 。 學(xué) 計(jì) 算對(duì) 計(jì) 算的 要求 永 無止 境 ,從 圖 1. 2[ 1] 可以 看 出, 科學(xué) 以 指數(shù) 級(jí) 增長(zhǎng) 的 , 空氣 動(dòng) 力學(xué) 分 析, 激 光光 學(xué) ,生 物 分子 能 力 達(dá) 到 1- 2 0 P et af l o ps , 對(duì)于 空 氣動(dòng) 力 學(xué) 設(shè) 計(jì) , 計(jì) 算 宇 宙流 模 擬則 需 要 1- 10 0 E xa f l o p s 的計(jì) 算能 力 , 計(jì) 算化 學(xué) 領(lǐng)域 算 要 求 ,假 如 不能 很好 地 對(duì)一 些 應(yīng)用 進(jìn) 行并 行 優(yōu)化 , 單 從由 CP U 平 臺(tái) 完成 , 因此 GP U 在 這 些 高 計(jì) 算密 度 需求 領(lǐng) 域。
表 1. 2 20 1 2 年 TO P5 0 0 排名 前 五 位 超 級(jí) 計(jì) 算 機(jī) 的 內(nèi) 核 數(shù) 從圖 1. 3[ 1] 超級(jí) 計(jì) 算 機(jī)計(jì) 算 能 力可 以 看 出, 93 年初 第 一 期 T OP 50 0 中 ,當(dāng) 的 超 級(jí)計(jì) 算 機(jī)是 5 9. 7G F L O P S ,而 0. 4 GF L O P S 則是 排 名最 后 一位 , 當(dāng) 時(shí) T O的 計(jì) 算能 力也 僅 是 1 . 17 T FL O P S , 0 5 年 T OP 5 00 中排 在 最后 一 位的 超級(jí) 計(jì) 比 這一 數(shù) 值要 高 。 到 了 20 12 年 6 月份 第 39 期的 T OP 50 0 中, 最 快的 超級(jí) 計(jì) 經(jīng) 達(dá) 到了 1 6. 3 2P FL O P S ,而 T OP 50 0 總的 峰值 計(jì) 算能 力 已經(jīng) 突 破 10 0P FL OP 12 3P FL OP S 。R AN K N AM E SP E C S C O U N T R Y C O R E S R m ax P fl o p/ 1 Se q u oi a IB M B lu e Ge n e/ Q P ow e r B Q C1 6 C 1 .6 GH zU SA 1 ,5 7 2 ,8 6 4 1 6 .3 32 K co m p u te r Fu ji t s u SP AR C 6 4 V II I f x 2 .0 GH z J ap a n 7 0 5 ,0 2 4 1 0 .5 1 03 M ir aIB M B lu eG e n e/ Q P ow e r B Q C1 6 C 1 .6 GH zU SA 7 8 6 ,4 3 2 8 .1 5 34 Su p er M U CIB M iD at aP le x D X 3 6 0 M 4 ,X eo nE 5 -2 6 8 0 8 C 2 .7 GH zG er m a n y 1 4 7 ,4 5 6 2 .8 9 75 T ia n h e -1 AN U D T Y H M P P , X eo n X 5 6 7 06 C 2 .9 3 GH z , N V ID IA 2 0 50 C h in a 1 8 6 ,3 6 8 2 .5 6 6
【參考文獻(xiàn)】:
期刊論文
[1]The TianHe-1A Supercomputer: Its Hardware and Software[J]. 楊學(xué)軍,廖湘科,盧凱,胡慶豐,宋君強(qiáng),蘇金樹. Journal of Computer Science & Technology. 2011(03)
[2]Dawning Nebulae:A PetaFLOPS Supercomputer with a Heterogeneous Structure[J]. 孫凝輝,邢晶,霍志剛,譚光明,熊勁,李波,馬燦. Journal of Computer Science & Technology. 2011(03)
[3]并行計(jì)算模型對(duì)比分析[J]. 王歡,都志輝. 計(jì)算機(jī)科學(xué). 2005(12)
[4]圖形處理器用于通用計(jì)算的技術(shù)、現(xiàn)狀及其挑戰(zhàn)[J]. 吳恩華. 軟件學(xué)報(bào). 2004(10)
[5]一種實(shí)用的并行計(jì)算模型[J]. 計(jì)永昶,丁衛(wèi)群,陳國(guó)良,安虹. 計(jì)算機(jī)學(xué)報(bào). 2001(04)
博士論文
[1]面向CPU/GPU異構(gòu)體系結(jié)構(gòu)的并行計(jì)算關(guān)鍵技術(shù)研究[D]. 盧風(fēng)順.國(guó)防科學(xué)技術(shù)大學(xué) 2012
[2]面向CPU-GPU異構(gòu)并行系統(tǒng)的編程模型與編譯優(yōu)化關(guān)鍵技術(shù)研究[D]. 唐滔.國(guó)防科學(xué)技術(shù)大學(xué) 2012
[3]并行計(jì)算可擴(kuò)展性分析與優(yōu)化[D]. 王之元.國(guó)防科學(xué)技術(shù)大學(xué) 2011
本文編號(hào):3593080
【文章來源】:國(guó)防科技大學(xué)湖南省 211工程院校 985工程院校
【文章頁數(shù)】:74 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
TOP500超級(jí)計(jì)算機(jī)體系結(jié)構(gòu)的發(fā)展趨勢(shì)
像 邊 緣 檢 測(cè)、 圖 形 去 噪 [ 13 ] 、以 及圖 像匹 配 等都 能很 好 地移 高 的 加 速比 。 另 外 也有 研 究 者 對(duì)在 CU D A 提供 的 CU B L A 運(yùn) 算 的 優(yōu) 化 , 甚 至 有 些 研 究 者 提 出 了 關(guān) 于 CU D A 并 行 圖 些應(yīng) 用 的 實(shí) 現(xiàn)都 得 益 于 GP U 在高 性 能 計(jì) 算方 面 所 具有 的 優(yōu) , 2 ) 高 密 集的 運(yùn) 算 ,3 ) 超 長(zhǎng)圖 形 流水 線。 G P U 與 CP U 的 電 路相 對(duì) 簡(jiǎn)單 , 而且 對(duì) Ca c h e 的 需 求 較 小, 所 以大 部 分 晶電 路 和 多條 流 水 線 ,使 GP U 的計(jì) 算 速度 有 了 突 破性 的 飛 躍 運(yùn)算 的 能力 。 學(xué) 計(jì) 算對(duì) 計(jì) 算的 要求 永 無止 境 ,從 圖 1. 2[ 1] 可以 看 出, 科學(xué) 以 指數(shù) 級(jí) 增長(zhǎng) 的 , 空氣 動(dòng) 力學(xué) 分 析, 激 光光 學(xué) ,生 物 分子 能 力 達(dá) 到 1- 2 0 P et af l o ps , 對(duì)于 空 氣動(dòng) 力 學(xué) 設(shè) 計(jì) , 計(jì) 算 宇 宙流 模 擬則 需 要 1- 10 0 E xa f l o p s 的計(jì) 算能 力 , 計(jì) 算化 學(xué) 領(lǐng)域 算 要 求 ,假 如 不能 很好 地 對(duì)一 些 應(yīng)用 進(jìn) 行并 行 優(yōu)化 , 單 從由 CP U 平 臺(tái) 完成 , 因此 GP U 在 這 些 高 計(jì) 算密 度 需求 領(lǐng) 域。
表 1. 2 20 1 2 年 TO P5 0 0 排名 前 五 位 超 級(jí) 計(jì) 算 機(jī) 的 內(nèi) 核 數(shù) 從圖 1. 3[ 1] 超級(jí) 計(jì) 算 機(jī)計(jì) 算 能 力可 以 看 出, 93 年初 第 一 期 T OP 50 0 中 ,當(dāng) 的 超 級(jí)計(jì) 算 機(jī)是 5 9. 7G F L O P S ,而 0. 4 GF L O P S 則是 排 名最 后 一位 , 當(dāng) 時(shí) T O的 計(jì) 算能 力也 僅 是 1 . 17 T FL O P S , 0 5 年 T OP 5 00 中排 在 最后 一 位的 超級(jí) 計(jì) 比 這一 數(shù) 值要 高 。 到 了 20 12 年 6 月份 第 39 期的 T OP 50 0 中, 最 快的 超級(jí) 計(jì) 經(jīng) 達(dá) 到了 1 6. 3 2P FL O P S ,而 T OP 50 0 總的 峰值 計(jì) 算能 力 已經(jīng) 突 破 10 0P FL OP 12 3P FL OP S 。R AN K N AM E SP E C S C O U N T R Y C O R E S R m ax P fl o p/ 1 Se q u oi a IB M B lu e Ge n e/ Q P ow e r B Q C1 6 C 1 .6 GH zU SA 1 ,5 7 2 ,8 6 4 1 6 .3 32 K co m p u te r Fu ji t s u SP AR C 6 4 V II I f x 2 .0 GH z J ap a n 7 0 5 ,0 2 4 1 0 .5 1 03 M ir aIB M B lu eG e n e/ Q P ow e r B Q C1 6 C 1 .6 GH zU SA 7 8 6 ,4 3 2 8 .1 5 34 Su p er M U CIB M iD at aP le x D X 3 6 0 M 4 ,X eo nE 5 -2 6 8 0 8 C 2 .7 GH zG er m a n y 1 4 7 ,4 5 6 2 .8 9 75 T ia n h e -1 AN U D T Y H M P P , X eo n X 5 6 7 06 C 2 .9 3 GH z , N V ID IA 2 0 50 C h in a 1 8 6 ,3 6 8 2 .5 6 6
【參考文獻(xiàn)】:
期刊論文
[1]The TianHe-1A Supercomputer: Its Hardware and Software[J]. 楊學(xué)軍,廖湘科,盧凱,胡慶豐,宋君強(qiáng),蘇金樹. Journal of Computer Science & Technology. 2011(03)
[2]Dawning Nebulae:A PetaFLOPS Supercomputer with a Heterogeneous Structure[J]. 孫凝輝,邢晶,霍志剛,譚光明,熊勁,李波,馬燦. Journal of Computer Science & Technology. 2011(03)
[3]并行計(jì)算模型對(duì)比分析[J]. 王歡,都志輝. 計(jì)算機(jī)科學(xué). 2005(12)
[4]圖形處理器用于通用計(jì)算的技術(shù)、現(xiàn)狀及其挑戰(zhàn)[J]. 吳恩華. 軟件學(xué)報(bào). 2004(10)
[5]一種實(shí)用的并行計(jì)算模型[J]. 計(jì)永昶,丁衛(wèi)群,陳國(guó)良,安虹. 計(jì)算機(jī)學(xué)報(bào). 2001(04)
博士論文
[1]面向CPU/GPU異構(gòu)體系結(jié)構(gòu)的并行計(jì)算關(guān)鍵技術(shù)研究[D]. 盧風(fēng)順.國(guó)防科學(xué)技術(shù)大學(xué) 2012
[2]面向CPU-GPU異構(gòu)并行系統(tǒng)的編程模型與編譯優(yōu)化關(guān)鍵技術(shù)研究[D]. 唐滔.國(guó)防科學(xué)技術(shù)大學(xué) 2012
[3]并行計(jì)算可擴(kuò)展性分析與優(yōu)化[D]. 王之元.國(guó)防科學(xué)技術(shù)大學(xué) 2011
本文編號(hào):3593080
本文鏈接:http://www.sikaile.net/kejilunwen/jisuanjikexuelunwen/3593080.html
最近更新
教材專著