面向異構(gòu)眾核超級(jí)計(jì)算機(jī)的大規(guī)模稀疏計(jì)算性能優(yōu)化研究
發(fā)布時(shí)間:2021-08-19 12:46
隨著超級(jí)計(jì)算機(jī)技術(shù)的發(fā)展,大數(shù)據(jù)應(yīng)用中大規(guī)模稀疏問(wèn)題的求解成為可能,而稀疏問(wèn)題的不規(guī)則計(jì)算和訪(fǎng)存特性又給應(yīng)用實(shí)現(xiàn)和性能優(yōu)化帶來(lái)了挑戰(zhàn)。異構(gòu)眾核是超級(jí)計(jì)算機(jī)系統(tǒng)中的常見(jiàn)架構(gòu),其設(shè)計(jì)向應(yīng)用開(kāi)發(fā)者提出了高要求,如何發(fā)揮其強(qiáng)大的計(jì)算能力成為一個(gè)難題。分析了稀疏計(jì)算的性能優(yōu)化挑戰(zhàn),介紹了基于典型異構(gòu)眾核計(jì)算機(jī)系統(tǒng)的3種大規(guī)模稀疏處理類(lèi)應(yīng)用設(shè)計(jì)和性能優(yōu)化案例,以期為在新一代異構(gòu)眾核系統(tǒng)上開(kāi)展大規(guī)模稀疏計(jì)算問(wèn)題求解提供借鑒。
【文章來(lái)源】:大數(shù)據(jù). 2020,6(04)
【文章頁(yè)數(shù)】:16 頁(yè)
【部分圖文】:
SW26010架構(gòu)
3 異構(gòu)眾核架構(gòu)及挑戰(zhàn)本文以典型的異構(gòu)眾核超級(jí)計(jì)算機(jī)——“神威·太湖之光”中的申威26010眾核處理器(SW26010)為例,介紹異構(gòu)眾核架構(gòu)及其應(yīng)用開(kāi)發(fā)的挑戰(zhàn)。
考慮到SW26010的特性,參考文獻(xiàn)[12]針對(duì)不同計(jì)算核心提出了3種不同的劃分策略,如圖5所示。這里假設(shè)主存內(nèi)的三維AOS數(shù)據(jù)按照z-x-y的維度順序存儲(chǔ),core(i,j)表示處理器陣列中第i行第j列的從核。右端相關(guān)運(yùn)算核心中,相應(yīng)的模板計(jì)算有13個(gè)依賴(lài)點(diǎn),整個(gè)求解區(qū)域被分為內(nèi)部區(qū)域(inner)和halo區(qū),halo區(qū)是不同節(jié)點(diǎn)計(jì)算區(qū)域的鄰接部分,由頂部、底部和東西南北6個(gè)面組成,這些部分都涉及數(shù)據(jù)通信。不需要通信的內(nèi)部區(qū)域采用2.5D分塊與雙緩沖策略結(jié)合的方法,如圖5(a)所示,分塊大小由LDM大小、向量化程度、雙緩沖占用率和DMA效率綜合考慮決定,最終采用4×4的大小。MAT運(yùn)算核心沒(méi)有halo區(qū),因此沿軸按“柱”方向進(jìn)行1D分塊,如圖5(b)所示。這里的分塊大小應(yīng)當(dāng)是4的倍數(shù),以方便向量化。ILU核心實(shí)現(xiàn)了線(xiàn)程間和線(xiàn)程內(nèi)部的并行,分塊方式如圖5(c)所示。在xy平面上,分塊把整個(gè)求解區(qū)域劃分成8×8的子區(qū)域,每個(gè)子區(qū)域中沿z軸的一“柱”剛好對(duì)應(yīng)8×8=64個(gè)SW26010處理器眾核。在這種粒度的劃分下,求解流水線(xiàn)開(kāi)始/結(jié)束時(shí)從核間的負(fù)載不均衡可以被最小化,水平和豎直方向上的兩層流水線(xiàn)可以高效地工作。類(lèi)似地,前代/回代過(guò)程(下三角/上三角矩陣求解)采取類(lèi)似的劃分方法。圖4 DD-MG算法示意圖[12]
【參考文獻(xiàn)】:
期刊論文
[1]大數(shù)據(jù)環(huán)境下的存儲(chǔ)系統(tǒng)構(gòu)建:挑戰(zhàn)、方法和趨勢(shì)[J]. 陳游旻,李飛,舒繼武. 大數(shù)據(jù). 2019(04)
[2]面向大數(shù)據(jù)的異構(gòu)內(nèi)存系統(tǒng)[J]. 王孝遠(yuǎn),廖小飛,劉海坤,金海. 大數(shù)據(jù). 2018(04)
[3]面向大數(shù)據(jù)應(yīng)用的混合內(nèi)存架構(gòu)特征分析[J]. 李鑫,陳璇,黃志球. 大數(shù)據(jù). 2018(03)
[4]The Sunway Taihu Light supercomputer:system and applications[J]. Haohuan FU,Junfeng LIAO,Jinzhe YANG,Lanning WANG,Zhenya SONG,Xiaomeng HUANG,Chao YANG,Wei XUE,Fangfang LIU,Fangli QIAO,Wei ZHAO,Xunqiang YIN,Chaofeng HOU,Chenglong ZHANG,Wei GE,Jian ZHANG,Yangang WANG,Chunbo ZHOU,Guangwen YANG. Science China(Information Sciences). 2016(07)
本文編號(hào):3351437
【文章來(lái)源】:大數(shù)據(jù). 2020,6(04)
【文章頁(yè)數(shù)】:16 頁(yè)
【部分圖文】:
SW26010架構(gòu)
3 異構(gòu)眾核架構(gòu)及挑戰(zhàn)本文以典型的異構(gòu)眾核超級(jí)計(jì)算機(jī)——“神威·太湖之光”中的申威26010眾核處理器(SW26010)為例,介紹異構(gòu)眾核架構(gòu)及其應(yīng)用開(kāi)發(fā)的挑戰(zhàn)。
考慮到SW26010的特性,參考文獻(xiàn)[12]針對(duì)不同計(jì)算核心提出了3種不同的劃分策略,如圖5所示。這里假設(shè)主存內(nèi)的三維AOS數(shù)據(jù)按照z-x-y的維度順序存儲(chǔ),core(i,j)表示處理器陣列中第i行第j列的從核。右端相關(guān)運(yùn)算核心中,相應(yīng)的模板計(jì)算有13個(gè)依賴(lài)點(diǎn),整個(gè)求解區(qū)域被分為內(nèi)部區(qū)域(inner)和halo區(qū),halo區(qū)是不同節(jié)點(diǎn)計(jì)算區(qū)域的鄰接部分,由頂部、底部和東西南北6個(gè)面組成,這些部分都涉及數(shù)據(jù)通信。不需要通信的內(nèi)部區(qū)域采用2.5D分塊與雙緩沖策略結(jié)合的方法,如圖5(a)所示,分塊大小由LDM大小、向量化程度、雙緩沖占用率和DMA效率綜合考慮決定,最終采用4×4的大小。MAT運(yùn)算核心沒(méi)有halo區(qū),因此沿軸按“柱”方向進(jìn)行1D分塊,如圖5(b)所示。這里的分塊大小應(yīng)當(dāng)是4的倍數(shù),以方便向量化。ILU核心實(shí)現(xiàn)了線(xiàn)程間和線(xiàn)程內(nèi)部的并行,分塊方式如圖5(c)所示。在xy平面上,分塊把整個(gè)求解區(qū)域劃分成8×8的子區(qū)域,每個(gè)子區(qū)域中沿z軸的一“柱”剛好對(duì)應(yīng)8×8=64個(gè)SW26010處理器眾核。在這種粒度的劃分下,求解流水線(xiàn)開(kāi)始/結(jié)束時(shí)從核間的負(fù)載不均衡可以被最小化,水平和豎直方向上的兩層流水線(xiàn)可以高效地工作。類(lèi)似地,前代/回代過(guò)程(下三角/上三角矩陣求解)采取類(lèi)似的劃分方法。圖4 DD-MG算法示意圖[12]
【參考文獻(xiàn)】:
期刊論文
[1]大數(shù)據(jù)環(huán)境下的存儲(chǔ)系統(tǒng)構(gòu)建:挑戰(zhàn)、方法和趨勢(shì)[J]. 陳游旻,李飛,舒繼武. 大數(shù)據(jù). 2019(04)
[2]面向大數(shù)據(jù)的異構(gòu)內(nèi)存系統(tǒng)[J]. 王孝遠(yuǎn),廖小飛,劉海坤,金海. 大數(shù)據(jù). 2018(04)
[3]面向大數(shù)據(jù)應(yīng)用的混合內(nèi)存架構(gòu)特征分析[J]. 李鑫,陳璇,黃志球. 大數(shù)據(jù). 2018(03)
[4]The Sunway Taihu Light supercomputer:system and applications[J]. Haohuan FU,Junfeng LIAO,Jinzhe YANG,Lanning WANG,Zhenya SONG,Xiaomeng HUANG,Chao YANG,Wei XUE,Fangfang LIU,Fangli QIAO,Wei ZHAO,Xunqiang YIN,Chaofeng HOU,Chenglong ZHANG,Wei GE,Jian ZHANG,Yangang WANG,Chunbo ZHOU,Guangwen YANG. Science China(Information Sciences). 2016(07)
本文編號(hào):3351437
本文鏈接:http://www.sikaile.net/kejilunwen/jisuanjikexuelunwen/3351437.html
最近更新
教材專(zhuān)著