基于龍芯3B處理器的Linpack優(yōu)化實(shí)現(xiàn)
本文選題:計算機(jī)系統(tǒng)結(jié)構(gòu) + 龍芯B處理器。 參考:《深圳大學(xué)學(xué)報(理工版)》2014年03期
【摘要】:HPL是高性能計算廣泛采用的Linpack測試軟件包.針對龍芯3B處理器體系結(jié)構(gòu)的特點(diǎn),為Linpack中的核心部分——矩陣乘法設(shè)計矩陣分塊策略,利用龍芯3B的cache鎖機(jī)制將頻繁調(diào)用的數(shù)據(jù)分塊鎖在cache中,從而顯著降低cache缺失率.同時為龍芯3B處理器中的訪存加速部件設(shè)計了高效的預(yù)取算法,以實(shí)現(xiàn)計算時間掩蓋訪存時間.另外,分別對Linpack所調(diào)用的dtrsm和行交換等熱點(diǎn)函數(shù)進(jìn)行優(yōu)化,并通過參數(shù)訓(xùn)練來優(yōu)化Linpack參數(shù).實(shí)驗(yàn)結(jié)果表明,在龍芯3B處理器上,單節(jié)點(diǎn)4核以及雙節(jié)點(diǎn)8核的Linpack實(shí)測性能均達(dá)到理論峰值的60%左右,優(yōu)化后的Linpack性能較優(yōu)化前提升了10倍左右.
[Abstract]:HPL is a widely used Linpack test software package for high performance computing. According to the characteristics of the architecture of Ronson 3B processor, matrix partitioning strategy is designed for matrix multiplication, which is the core part of Linpack. The frequently invoked data block is locked in cache by using the cache locking mechanism of Ronson 3B, thus significantly reducing the cache deletion rate. At the same time, an efficient prefetching algorithm is designed for the memory access acceleration part of the Godson 3B processor to realize the computation of time masking memory access time. In addition, the hot functions such as dtrsm and row exchange called by Linpack are optimized, and the parameters of Linpack are optimized by parameter training. The experimental results show that the measured Linpack performance of single-node 4-core and two-node 8-core on Ronson 3B processor reaches about 60% of the theoretical peak, and the optimized Linpack performance is about 10 times higher than that before optimization.
【作者單位】: 深圳大學(xué)計算機(jī)與軟件學(xué)院 廣東省普及型高性能計算機(jī)實(shí)驗(yàn)室;
【基金】:國家高技術(shù)研究發(fā)展計劃資助項目(2012AA01A30904) 廣東省院士工作站建設(shè)項目(2012B090500020)~~
【分類號】:TP332
【參考文獻(xiàn)】
相關(guān)期刊論文 前6條
1 李文龍,劉利,湯志忠;軟件流水中的循環(huán)展開優(yōu)化[J];北京航空航天大學(xué)學(xué)報;2004年11期
2 張文力;陳明宇;樊建平;;HPL測試性能仿真與預(yù)測[J];計算機(jī)研究與發(fā)展;2006年03期
3 陳國良;蔡曄;羅秋明;;國產(chǎn)個人高性能計算機(jī)系統(tǒng)研制[J];深圳大學(xué)學(xué)報(理工版);2011年06期
4 蔡曄;劉剛;毛睿;羅秋明;陳國良;;KD-90普及型個人高性能計算機(jī)系統(tǒng)設(shè)計與性能優(yōu)化[J];深圳大學(xué)學(xué)報(理工版);2013年02期
5 何頌頌;顧乃杰;朱海濤;劉燕君;;面向龍芯3A體系結(jié)構(gòu)的BLAS庫優(yōu)化[J];小型微型計算機(jī)系統(tǒng);2012年03期
6 朱海濤;陳云霽;錢誠;王玲;胡偉武;;基于向量擴(kuò)展多核處理器的矩陣乘法算法優(yōu)化研究[J];中國科學(xué)技術(shù)大學(xué)學(xué)報;2011年02期
【共引文獻(xiàn)】
相關(guān)期刊論文 前10條
1 萬曉姣;;基于linux系統(tǒng)集群的架構(gòu)與實(shí)現(xiàn)[J];電子世界;2012年10期
2 李錚;薛質(zhì);;基于Linux的高性能集群的構(gòu)建和性能優(yōu)化[J];信息技術(shù);2012年03期
3 郭淑婷;;DSP匯編語言優(yōu)化設(shè)計[J];河南師范大學(xué)學(xué)報(自然科學(xué)版);2009年01期
4 陳堅禎;陽平;李斌;沈丹平;;多核并行計算下的流量傳感器流場模擬研究[J];衡陽師范學(xué)院學(xué)報;2011年06期
5 孟金濤;賀鵬程;劉濤;;Nehalem平臺的Linpack參數(shù)訓(xùn)練與優(yōu)化[J];華中科技大學(xué)學(xué)報(自然科學(xué)版);2010年S1期
6 周國建;吳少剛;李祖松;史崗;;基于四階段人工優(yōu)化的軟件流水技術(shù)[J];計算機(jī)工程;2009年05期
7 高一波;丁亞平;于美麗;;杜利特爾算法在條件優(yōu)化中的應(yīng)用[J];計算機(jī)與應(yīng)用化學(xué);2009年11期
8 嚴(yán)歷;郭力;;三維宏觀擬顆粒模擬程序計算代碼優(yōu)化研究與實(shí)現(xiàn)[J];計算機(jī)與應(yīng)用化學(xué);2009年12期
9 馬曉靜;;一種雷達(dá)信號處理機(jī)的軟件設(shè)計[J];雷達(dá)與對抗;2012年01期
10 王申;漆鋒濱;谷洪峰;潘治;;Linpack并行性能模型及其預(yù)測[J];計算機(jī)工程;2012年16期
相關(guān)博士學(xué)位論文 前5條
1 陳堅禎;一種新型多電極插入式電磁流量傳感器及其基礎(chǔ)研究[D];上海大學(xué);2009年
2 朱虎明;基于集群計算的免疫優(yōu)化算法及其應(yīng)用研究[D];西安電子科技大學(xué);2010年
3 廖銀;動態(tài)二進(jìn)制翻譯建模及其并行化研究[D];中國科學(xué)技術(shù)大學(xué);2013年
4 張志敏;化學(xué)計量學(xué)算法實(shí)現(xiàn)的軟件開發(fā)基礎(chǔ)研究[D];中南大學(xué);2012年
5 賈海鵬;面向GPU計算平臺的若干并行優(yōu)化關(guān)鍵技術(shù)研究[D];中國海洋大學(xué);2012年
相關(guān)碩士學(xué)位論文 前10條
1 馬慶懷;基于CPU與GPU混合架構(gòu)集群的性能測試與優(yōu)化[D];中國地質(zhì)大學(xué)(北京);2011年
2 劉灝;基于NiosⅡ的光纖熔接機(jī)圖像測量及軟件系統(tǒng)設(shè)計[D];西北大學(xué);2011年
3 沈旭;無人機(jī)滅火控制系統(tǒng)及其關(guān)鍵技術(shù)研究[D];長安大學(xué);2011年
4 韓永杰;LLVM編譯系統(tǒng)結(jié)構(gòu)分析及ARCA3后端移植[D];哈爾濱工業(yè)大學(xué);2010年
5 許玉婷;GPS同步算法的ASIP實(shí)現(xiàn)[D];哈爾濱工業(yè)大學(xué);2010年
6 李錚;基于Linux的小型高性能集群的研究和優(yōu)化[D];上海交通大學(xué);2012年
7 史建國;X10語言機(jī)制研究和實(shí)現(xiàn)優(yōu)化[D];國防科學(xué)技術(shù)大學(xué);2011年
8 余小喜;面向嵌入式系統(tǒng)的迭代式循環(huán)展開優(yōu)化[D];國防科學(xué)技術(shù)大學(xué);2011年
9 馬萌;面向程序訪存特征的存儲優(yōu)化技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2011年
10 周正;HCO網(wǎng)絡(luò)操作系統(tǒng)的Cx51實(shí)現(xiàn)[D];合肥工業(yè)大學(xué);2006年
【二級參考文獻(xiàn)】
相關(guān)期刊論文 前6條
1 蔡曄;史崗;;基于鎖的Cache一致性協(xié)議的硬件優(yōu)化策略[J];高技術(shù)通訊;2009年09期
2 陳國良;蔡曄;羅秋明;;國產(chǎn)個人高性能計算機(jī)系統(tǒng)研制[J];深圳大學(xué)學(xué)報(理工版);2011年06期
3 張俊霞;張煥杰;李會民;;基于龍芯2F的國產(chǎn)萬億次高性能計算機(jī)KD-50-I的研制[J];中國科學(xué)技術(shù)大學(xué)學(xué)報;2008年01期
4 孫凝暉;陳國良;;PHPC:一種普及型高性能計算機(jī)[J];中國科學(xué)技術(shù)大學(xué)學(xué)報;2008年07期
5 顧乃杰;李凱;陳國良;吳超;;基于龍芯2F體系結(jié)構(gòu)的BLAS庫優(yōu)化[J];中國科學(xué)技術(shù)大學(xué)學(xué)報;2008年07期
6 張俊霞;李春生;張煥杰;;KD-50-I-E:一臺增強(qiáng)型高性能計算機(jī)[J];中國科學(xué)技術(shù)大學(xué)學(xué)報;2009年08期
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 沈緒榜;嵌入式MPP處理器的發(fā)展[J];電子產(chǎn)品世界;2005年21期
2 于永斌;徐潔;吳曉華;王華;丁旭陽;;多核時代的“計算機(jī)系統(tǒng)結(jié)構(gòu)”課程[J];計算機(jī)教育;2011年06期
3 羅沛霖;羅晉;凱睿;Steve Novack;Victor Berman;;混合式可重構(gòu)數(shù)字多核并行處理器平臺[J];前沿科學(xué);2008年04期
4 ;通過FLIX指令結(jié)構(gòu)提高可配置處理器計算性能[J];電子設(shè)計技術(shù);2006年02期
5 許珊琳;;ARM公司的多處理技術(shù)[J];中國集成電路;2006年05期
6 ;龍芯2號增強(qiáng)型處理器Loongson2E[J];中國集成電路;2008年02期
7 王瑩;;Wind River為Altera軟核NiosII提供Linux支持[J];電子產(chǎn)品世界;2009年04期
8 郭從征;王沁;;低速率聲碼器芯片設(shè)計[J];河北工業(yè)大學(xué)成人教育學(xué)院學(xué)報;2005年04期
9 趙德斌,陳耀強(qiáng),胡良校;Feig快速DCT算法及其處理器的體系結(jié)構(gòu)設(shè)計[J];計算機(jī)研究與發(fā)展;1998年12期
10 Peter Coffee;;快不是唯一標(biāo)準(zhǔn)[J];每周電腦報;1999年44期
相關(guān)會議論文 前10條
1 彭林;張小強(qiáng);劉德峰;謝倫國;田祖?zhèn)?;一種挖掘多核處理器存儲級并行的算法[A];第15屆全國信息存儲技術(shù)學(xué)術(shù)會議論文集[C];2008年
2 陳虎;歐彥麟;陳海波;;面向多核處理器平臺的并行Hash JOIN算法設(shè)計與實(shí)現(xiàn)[A];NDBC2010第27屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(B輯)[C];2010年
3 陳虎;羅偉良;干蕓蕓;;Multi_MINT:一個基于MINT的多核處理器模擬器[A];第十五屆計算機(jī)工程與工藝年會暨第一屆微處理器技術(shù)論壇論文集(B輯)[C];2011年
4 何軍;王飆;;通用多核處理器發(fā)展現(xiàn)狀和趨勢研究[A];第十五屆計算機(jī)工程與工藝年會暨第一屆微處理器技術(shù)論壇論文集(A輯)[C];2011年
5 周巍;孫冰;戰(zhàn)立明;呂建華;王國仁;于戈;;基于DOM模型的XML查詢處理器的設(shè)計與實(shí)現(xiàn)[A];第十八屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2001年
6 王海鵬;倪遠(yuǎn)平;;U-boot在mini2440平臺上的移植方法[A];2010年西南三省一市自動化與儀器儀表學(xué)術(shù)年會論文集[C];2010年
7 胡杏;胡瑜;李曉維;;基于存儲級并行的同時多線程電壓緊急容錯技術(shù)[A];第十四屆全國容錯計算學(xué)術(shù)會議(CFTC'2011)論文集[C];2011年
8 王慶;季振洲;劉濤;;面向嵌入式多核存儲層次的OpenMP優(yōu)化研究[A];2010年第16屆全國信息存儲技術(shù)大會(IST2010)論文集[C];2010年
9 李勇;劉勝;甄體智;;C64x+DSP內(nèi)核分析及其性能評價[A];第15屆全國信息存儲技術(shù)學(xué)術(shù)會議論文集[C];2008年
10 張民選;;前言[A];第十五屆計算機(jī)工程與工藝年會暨第一屆微處理器技術(shù)論壇論文集(A輯)[C];2011年
相關(guān)重要報紙文章 前10條
1 本報記者 溫慶生 特約記者 王握文;“算盤王國”新傳奇[N];光明日報;2010年
2 學(xué)健 編譯;Linux:一種趨勢[N];計算機(jī)世界;2001年
3 心元;PC“心臟”的搏擊[N];計算機(jī)世界;2004年
4 本報記者 湯銘;“天河一號” 躍居世界榜首[N];計算機(jī)世界;2010年
5 ;Microsoft Embeded OS縮小的桌面系統(tǒng)[N];中國計算機(jī)報;2001年
6 本報記者 薛仁 王握文 特約通訊員 司宏偉;超越之路[N];解放軍報;2010年
7 本報記者 張群英;10年布局IBM豪賭“一種服務(wù)器”[N];網(wǎng)絡(luò)世界;2002年
8 ;HP為Itanium提供Linux開發(fā)工具包[N];計算機(jī)世界;2000年
9 井之;新一代安騰處理器[N];網(wǎng)絡(luò)世界;2002年
10 本報記者 向利 實(shí)習(xí)記者 孫冠杰;“天河”因自主創(chuàng)新而騰飛[N];中國知識產(chǎn)權(quán)報;2010年
相關(guān)博士學(xué)位論文 前10條
1 徐光;分片式流處理器體系結(jié)構(gòu)[D];中國科學(xué)技術(shù)大學(xué);2010年
2 孫濤;面向動態(tài)異構(gòu)眾核處理器的任務(wù)調(diào)度研究[D];中國科學(xué)技術(shù)大學(xué);2013年
3 劉德峰;面向存儲級并行的多核處理器關(guān)鍵技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2011年
4 李靜梅;多核處理器的設(shè)計技術(shù)研究[D];哈爾濱工程大學(xué);2010年
5 朱海濤;面向高密度計算的多核處理器結(jié)構(gòu)研究[D];中國科學(xué)技術(shù)大學(xué);2011年
6 劉谷;可重構(gòu)眾核流處理器上的編譯與程序優(yōu)化技術(shù)[D];中國科學(xué)技術(shù)大學(xué);2013年
7 陳虎;面向應(yīng)用的指令集處理器關(guān)鍵技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2011年
8 黃立波;片上集群體系結(jié)構(gòu)關(guān)鍵技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2010年
9 張惠臻;可重構(gòu)指令集處理器設(shè)計中的軟件重定向關(guān)鍵技術(shù)研究[D];中國科學(xué)技術(shù)大學(xué);2010年
10 許牧;可重構(gòu)眾核流處理器體系結(jié)構(gòu)關(guān)鍵技術(shù)研究[D];中國科學(xué)技術(shù)大學(xué);2012年
相關(guān)碩士學(xué)位論文 前10條
1 趙麗麗;基于TTA內(nèi)核的流處理器設(shè)計的研究[D];上海交通大學(xué);2010年
2 董珍;異構(gòu)多核處理器的任務(wù)調(diào)度分配問題及算法研究[D];哈爾濱工程大學(xué);2010年
3 尤凱迪;高性能低功耗多核處理器研究[D];復(fù)旦大學(xué);2011年
4 鐘松延;可配置可擴(kuò)展處理器編譯器設(shè)計[D];天津大學(xué);2012年
5 劉子揚(yáng);基于虛擬計算群的眾核處理器動態(tài)在線任務(wù)調(diào)度算法研究[D];上海交通大學(xué);2013年
6 盛肖煒;多核處理器內(nèi)部核間通信研究[D];沈陽理工大學(xué);2013年
7 董正楊;亂序處理器指令吞吐量平穩(wěn)化的動態(tài)調(diào)節(jié)方法研究[D];華中科技大學(xué);2012年
8 閔銀皮;同構(gòu)通用流多核處理器存儲部件關(guān)鍵技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2012年
9 葉新棟;一種Java處理器的體系結(jié)構(gòu)設(shè)計與研究[D];復(fù)旦大學(xué);2011年
10 馬媛;基于多核處理器平臺的分流模塊的設(shè)計與實(shí)現(xiàn)[D];北京交通大學(xué);2012年
,本文編號:1915787
本文鏈接:http://www.sikaile.net/kejilunwen/jisuanjikexuelunwen/1915787.html