高性能計算系統(tǒng)內(nèi)存子系統(tǒng)的性能預測模型研究
發(fā)布時間:2020-05-22 07:45
【摘要】: 隨著高性能計算技術(shù)在社會生產(chǎn)生活各方面的應用日益廣泛,高性能計算的性能評測尤其是性能預測在高性能計算領域內(nèi)逐漸受到重視。目前研究最廣泛的是使用性能模型進行預測。建立性能模型,只需要收集關于應用程序及目標機器的一些相關信息進行分析,然后通過一些計算得出應用程序在目標機器上運行所需要的時間。相對于其他方法來說,整個預測過程花費的時間大大縮短,而且其預測精度也比較高。 現(xiàn)有的一些性能模型與程序所使用的數(shù)值算法密切相關,建立過程需要花費大量的專家人力,模型計算時間較長,無法實現(xiàn)自動化;另一些性能模型所使用的工具和建模方法基于某種類型的計算平臺,且只對其少數(shù)戰(zhàn)略同盟直接可用。 本文著重于高性能計算機系統(tǒng)的內(nèi)存系統(tǒng)性能模型,分析了使用機器特征操作能力與應用程序中循環(huán)的內(nèi)存訪問模式相結(jié)合的性能模型框架,并在充分分析的基礎上,對性能模型工具進行了移植,在Intel X86結(jié)構(gòu)上實現(xiàn)了對應的模型計算工具,對應用程序中的循環(huán)而不是基本塊進行處理,精簡所需要考慮的內(nèi)存訪問特征;并針對該性能模型框架中為獲取應用程序內(nèi)存訪問模式使用的Multi-MAPS測試工具可能存在的、不能覆蓋所有的HPC應用程序中的內(nèi)存訪問模式的問題進行了討論并提出了解決辦法。 實驗數(shù)據(jù)表明,使用移植到Intel X86結(jié)構(gòu)上的性能模型進行性能預測能夠達到預期的精度;通過插值的算法后可以使用已獲取Multi-MAPS循環(huán)中的數(shù)據(jù)來計算其他應用程序中其他可能的內(nèi)存訪問模式所對應的機器內(nèi)存帶寬,從而可以加快整個性能模型計算的時間。
【圖文】:
3.使用模擬器如simPlescalar[9〕進行模擬simplescalar工具集能為計算機系統(tǒng)性能及功耗分析、體系結(jié)構(gòu)建模等提供了有效的支持。由于模擬是使實際應用程序在模擬的硬件環(huán)境下進行實際的運行,所以使用模擬的方法可以獲得很精確的性能預測時間,而且通過修改模擬器的參數(shù),可以對當時還沒有生產(chǎn)出來的硬件進行性能預測。但是一般的科學計算程序運行時間較長,而使用模擬器對程序的每一條指令進行模擬執(zhí)行則更會大大增加整個過程的時間(一般會產(chǎn)生10一100倍的時間延長)。尤其是精確到時鐘周期的模擬,由于要模擬處理器的所有行為,整個模擬過程所花費的時間大約是實際應用程序執(zhí)行時間的10“倍〔10〕。為了避免如此之大的延時,通常只使用時鐘周期精度的模擬器模擬執(zhí)行應用程序數(shù)分鐘,然后根據(jù)在這段時間里獲得的一些應用程序信息來進行性能預測。但是顯然對于大多數(shù)的科學計算程序,其中某一部分的行為無法代表整個程序的行為,因此獲得的預測精度不高。4.建立性能模型進行計算
存性能模型與通信系統(tǒng)性能模型中的系統(tǒng)特征文件和程序特性操作文件以獲得該應用程序最終的運行時間預測。其中使用 MetasimConvolver對內(nèi)存性能模型中的系統(tǒng)特征文件和程序特性操作的合成過程如表2一3和圖2一7所示。對應于表2一3和圖2一7所示的系統(tǒng)特征文件和程序特性操作進行合成可以用下面的計算公式來表示:執(zhí)行時間=藝(Mem伽職/MemRate照)(公式2一2)i=1執(zhí)行時間二藝{(、,伽BB,/、m,a,。。盡)+(、a,伽職/。。a,,a,。)}i=l(公式2一3)其中
【學位授予單位】:復旦大學
【學位級別】:碩士
【學位授予年份】:2008
【分類號】:TP302.1
【圖文】:
3.使用模擬器如simPlescalar[9〕進行模擬simplescalar工具集能為計算機系統(tǒng)性能及功耗分析、體系結(jié)構(gòu)建模等提供了有效的支持。由于模擬是使實際應用程序在模擬的硬件環(huán)境下進行實際的運行,所以使用模擬的方法可以獲得很精確的性能預測時間,而且通過修改模擬器的參數(shù),可以對當時還沒有生產(chǎn)出來的硬件進行性能預測。但是一般的科學計算程序運行時間較長,而使用模擬器對程序的每一條指令進行模擬執(zhí)行則更會大大增加整個過程的時間(一般會產(chǎn)生10一100倍的時間延長)。尤其是精確到時鐘周期的模擬,由于要模擬處理器的所有行為,整個模擬過程所花費的時間大約是實際應用程序執(zhí)行時間的10“倍〔10〕。為了避免如此之大的延時,通常只使用時鐘周期精度的模擬器模擬執(zhí)行應用程序數(shù)分鐘,然后根據(jù)在這段時間里獲得的一些應用程序信息來進行性能預測。但是顯然對于大多數(shù)的科學計算程序,其中某一部分的行為無法代表整個程序的行為,因此獲得的預測精度不高。4.建立性能模型進行計算
存性能模型與通信系統(tǒng)性能模型中的系統(tǒng)特征文件和程序特性操作文件以獲得該應用程序最終的運行時間預測。其中使用 MetasimConvolver對內(nèi)存性能模型中的系統(tǒng)特征文件和程序特性操作的合成過程如表2一3和圖2一7所示。對應于表2一3和圖2一7所示的系統(tǒng)特征文件和程序特性操作進行合成可以用下面的計算公式來表示:執(zhí)行時間=藝(Mem伽職/MemRate照)(公式2一2)i=1執(zhí)行時間二藝{(、,伽BB,/、m,a,。。盡)+(、a,伽職/。。a,,a,。)}i=l(公式2一3)其中
【學位授予單位】:復旦大學
【學位級別】:碩士
【學位授予年份】:2008
【分類號】:TP302.1
【相似文獻】
相關期刊論文 前10條
1 黃翔;張文博;張波;魏峻;;基于方面模板的分布式組件系統(tǒng)性能預測方法[J];計算機科學;2009年08期
2 謝茗濤;高性能計算頂級會議在京 IBM論道“深度計算”[J];計算機與網(wǎng)絡;2000年10期
3 陳曉鵬;中國高性能計算沖擊新高標[J];中國計算機用戶;2003年29期
4 ;高性能計算可服務于全民[J];中國教育網(wǎng)絡;2009年12期
5 ;高性能發(fā)展重在應用 浪潮與中科院建立高性能戰(zhàn)略合作[J];科技浪潮;2009年03期
6 ;曙光推動高性能計算走向普及[J];中國信息界;2005年16期
7 王r
本文編號:2675672
本文鏈接:http://www.sikaile.net/kejilunwen/jisuanjikexuelunwen/2675672.html
最近更新
教材專著