使用GTC-P應(yīng)用評(píng)估曙光E級(jí)原型機(jī)的性能
發(fā)布時(shí)間:2021-02-12 09:53
曙光E級(jí)原型機(jī)是我國(guó)"十三五"計(jì)劃中3臺(tái)原型系統(tǒng)之一,該系統(tǒng)采用異構(gòu)計(jì)算架構(gòu),CPU和加速器選用AMD授權(quán)的國(guó)產(chǎn)海光處理器架構(gòu)。除了采用基準(zhǔn)測(cè)試程序?qū)π酒M(jìn)行測(cè)試外,為探究真實(shí)應(yīng)用在該原型機(jī)上的性能,移植了激光等離子體應(yīng)用GTC-P,對(duì)比了GTC-P在海光CPU和DCU與Intel 6148 CPU和NVIDIA V100 GPU上的性能,并在原型機(jī)的多結(jié)點(diǎn)上進(jìn)行了擴(kuò)展性分析。性能評(píng)估工作反映了高性能計(jì)算應(yīng)用在曙光E級(jí)原型機(jī)上的實(shí)際運(yùn)行性能。
【文章來源】:計(jì)算機(jī)工程與科學(xué). 2020,42(01)北大核心
【文章頁(yè)數(shù)】:7 頁(yè)
【文章目錄】:
1 引言
2 背景介紹
2.1 GTC-P應(yīng)用
2.2 曙光E級(jí)原型機(jī)
2.2.1 總體架構(gòu)
2.2.2 海光CPU
2.2.3 海光DCU
3 基準(zhǔn)測(cè)試結(jié)果
3.1 雙精度浮點(diǎn)計(jì)算能力
3.2 訪存帶寬與延遲
4 同構(gòu)并行GTC-P
4.1 移植
4.2 單核性能分析
4.3 多核性能分析
4.4 多結(jié)點(diǎn)擴(kuò)展性分析
5 異構(gòu)并行GTC-P
5.1 移植
5.2 性能分析
6 相關(guān)工作
7 結(jié)束語
【參考文獻(xiàn)】:
期刊論文
[1]太湖之光上利用OpenACC移植和優(yōu)化GTC-P[J]. 王一超,林新華,蔡林金,Tang William,Ethier Stephane,王蓓,施忠偉,松崗聰. 計(jì)算機(jī)研究與發(fā)展. 2018(04)
本文編號(hào):3030671
【文章來源】:計(jì)算機(jī)工程與科學(xué). 2020,42(01)北大核心
【文章頁(yè)數(shù)】:7 頁(yè)
【文章目錄】:
1 引言
2 背景介紹
2.1 GTC-P應(yīng)用
2.2 曙光E級(jí)原型機(jī)
2.2.1 總體架構(gòu)
2.2.2 海光CPU
2.2.3 海光DCU
3 基準(zhǔn)測(cè)試結(jié)果
3.1 雙精度浮點(diǎn)計(jì)算能力
3.2 訪存帶寬與延遲
4 同構(gòu)并行GTC-P
4.1 移植
4.2 單核性能分析
4.3 多核性能分析
4.4 多結(jié)點(diǎn)擴(kuò)展性分析
5 異構(gòu)并行GTC-P
5.1 移植
5.2 性能分析
6 相關(guān)工作
7 結(jié)束語
【參考文獻(xiàn)】:
期刊論文
[1]太湖之光上利用OpenACC移植和優(yōu)化GTC-P[J]. 王一超,林新華,蔡林金,Tang William,Ethier Stephane,王蓓,施忠偉,松崗聰. 計(jì)算機(jī)研究與發(fā)展. 2018(04)
本文編號(hào):3030671
本文鏈接:http://www.sikaile.net/kejilunwen/jisuanjikexuelunwen/3030671.html
最近更新
教材專著