向量并行度指導(dǎo)的循環(huán)SIMD向量化方法
本文關(guān)鍵詞: SIMD擴展部件 向量并行度 Loop-aware 循環(huán)展開 出處:《軟件學(xué)報》2017年04期 論文類型:期刊論文
【摘要】:SIMD擴展部件是集成到通用處理器中的加速部件,旨在發(fā)掘多媒體和科學(xué)計算等領(lǐng)域程序的數(shù)據(jù)級并行.當前,兩種基本的向量發(fā)掘方法分別是發(fā)掘迭代間并行的Loop-based方法和發(fā)掘迭代內(nèi)并行的SLP方法.Loopaware方法是對SLP方法的改進,其思想是:首先,通過循環(huán)展開將迭代間并行轉(zhuǎn)換為迭代內(nèi)并行,使循環(huán)體內(nèi)的同構(gòu)語句條數(shù)足夠多;再利用SLP方法進行向量發(fā)掘.但當循環(huán)展開不合法或者并行度低于向量化因子時,Loop-aware方法無法實現(xiàn)程序向量并行性的發(fā)掘.因此提出了向量并行度指導(dǎo)的循環(huán)向量化方法,依據(jù)迭代間并行度、迭代內(nèi)并行度和向量化因子構(gòu)建循環(huán)向量化方法選擇方案,同時提出了不充分向量化方法發(fā)掘并行度低于向量化因子的循環(huán)向量并行性,最后,依據(jù)向量并行度對生成的向量循環(huán)進行展開.經(jīng)過標準測試集測試,向量并行度指導(dǎo)的循環(huán)SIMD向量化方法比Loop-aware方法的識別率提升了107.5%,性能提升了12.1%.
[Abstract]:The SIMD extension is an accelerator integrated into a general-purpose processor designed to explore data-level parallelism in fields such as multimedia and scientific computing. The two basic vector mining methods are to discover the parallel Loop-based method between iterations and the SLP method. Loopaware method is the improvement of the SLP method. The main ideas are as follows: first of all, The parallelism between iterations is transformed into intra-iteration parallelism by loop expansion, so that the number of isomorphic statements in the loop is sufficient. Then the SLP method is used for vector discovery. However, when the cyclic expansion is illegal or the degree of parallelism is lower than the vectorization factor, Loop-aware cannot realize the discovery of program vector parallelism. Therefore, a cyclic vectorization method guided by vector parallelism is proposed. According to the degree of parallelism between iterations, the degree of parallelism within iterations and the vectorization factor, the selection scheme of cyclic vectorization method is constructed. At the same time, an inadequate vectorization method is proposed to discover the parallelism of cyclic vectors with less parallelism than the vectorization factor. Finally, The vector cycle is expanded according to the degree of vector parallelism. Through the standard test set test, the recognition rate of the vector parallelism directed cyclic SIMD vectorization method is 107.5% higher than that of the Loop-aware method, and the performance is improved by 12.1%.
【作者單位】: 數(shù)學(xué)工程與先進計算國家重點實驗室(解放軍信息工程大學(xué));防空兵指揮學(xué)院;
【基金】:“核高基”國家科技重大專項(2009ZX01036)~~
【分類號】:TP332
【參考文獻】
相關(guān)期刊論文 前5條
1 高偉;趙榮彩;韓林;龐建民;丁銳;;SIMD自動向量化編譯優(yōu)化概述[J];軟件學(xué)報;2015年06期
2 徐華葉;鄭啟龍;丁陳飛;徐東鵬;;面向多簇超長指令字DSP的向量化優(yōu)化算法[J];計算機系統(tǒng)應(yīng)用;2013年12期
3 彭飛;顧乃杰;高翔;孫明明;;龍芯3B的SIMD編譯優(yōu)化及分析[J];小型微型計算機系統(tǒng);2012年12期
4 辛乃軍;陳旭燦;孫海燕;陽柳;羅杰;淡孝強;王霽;;基于GCC的高性能DSP Matrix向量指令集擴展[J];計算機工程與科學(xué);2012年01期
5 李玉祥;施慧;陳莉;;面向向量化的局部數(shù)據(jù)重組[J];小型微型計算機系統(tǒng);2009年08期
【共引文獻】
相關(guān)期刊論文 前10條
1 陳華軍;王琦;洪超;方萌;;基于全局數(shù)據(jù)重組的循環(huán)傾斜優(yōu)化[J];計算機與現(xiàn)代化;2017年06期
2 李忠武;;基于匯編語言教學(xué)中優(yōu)化語言代碼方法探討與研究[J];電子測試;2017年10期
3 呂鵬偉;劉從新;趙一明;沈緒榜;;基于動態(tài)規(guī)劃的自動向量化方法[J];北京理工大學(xué)學(xué)報;2017年05期
4 張素平;韓林;丁麗麗;王鵬翔;;新型超字級并行改進算法[J];計算機應(yīng)用;2017年02期
5 賀婷;;基于數(shù)據(jù)級自動向量化的編譯優(yōu)化研究綜述[J];智能計算機與應(yīng)用;2016年06期
6 唐佳;王凡;劉福烈;;三維波動方程正演的三級并行加速[J];石油地球物理勘探;2016年05期
7 范超;趙榮彩;單征;李朋遠;;結(jié)構(gòu)體向量化中的存儲優(yōu)化[J];小型微型計算機系統(tǒng);2016年09期
8 呂鵬偉;劉從新;沈緒榜;;一種新型自動向量化編譯算法[J];武漢大學(xué)學(xué)報(理學(xué)版);2016年05期
9 丁麗麗;韓林;王冬;張素平;王鵬翔;于海寧;;依賴距離主導(dǎo)的向量化方法研究[J];計算機應(yīng)用研究;2017年05期
10 張素平;王冬;丁麗麗;王鵬翔;宮一;于海寧;;一種基于SLP的新型編譯框架[J];計算機應(yīng)用研究;2017年01期
【二級參考文獻】
相關(guān)期刊論文 前5條
1 徐華葉;鄭啟龍;丁陳飛;徐東鵬;;面向多簇超長指令字DSP的向量化優(yōu)化算法[J];計算機系統(tǒng)應(yīng)用;2013年12期
2 彭飛;顧乃杰;高翔;孫明明;;龍芯3B的SIMD編譯優(yōu)化及分析[J];小型微型計算機系統(tǒng);2012年12期
3 辛乃軍;陳旭燦;孫海燕;陽柳;羅杰;淡孝強;王霽;;基于GCC的高性能DSP Matrix向量指令集擴展[J];計算機工程與科學(xué);2012年01期
4 李玉祥;施慧;陳莉;;面向向量化的局部數(shù)據(jù)重組[J];小型微型計算機系統(tǒng);2009年08期
5 鄒瓊;董峻峰;;針對龍芯2號結(jié)構(gòu)特征的GCC優(yōu)化[J];小型微型計算機系統(tǒng);2007年12期
【相似文獻】
相關(guān)期刊論文 前10條
1 張為華;臧斌宇;王曄;錢興隆;朱傳琪;;基于共享向量的二維SIMD調(diào)度算法[J];計算機學(xué)報;2006年10期
2 李璞;孫亞輝;;64位環(huán)境SIMD性能優(yōu)化技術(shù)研究[J];計算機與信息技術(shù);2007年04期
3 卜士喜;竺紅衛(wèi);;軟件SIMD的研究及應(yīng)用[J];計算機工程;2010年19期
4 侯永生;趙榮彩;黃磊;韓林;;面向SIMD擴展部件的循環(huán)優(yōu)化研究[J];計算機科學(xué);2014年05期
5 張為華;臧斌宇;;共享主存多SIMD結(jié)構(gòu)及編譯技術(shù)研究[J];計算機科學(xué)與探索;2009年01期
6 郭陽;丁偉;李振濤;;高性能算術(shù)SIMD模塊的電路設(shè)計[J];微電子學(xué)與計算機;2010年09期
7 侯永生;趙榮彩;高偉;朱嘉楓;;SIMD擴展部件數(shù)據(jù)依賴關(guān)系約束條件研究[J];信息工程大學(xué)學(xué)報;2014年01期
8 吳松,章勇,姚慶棟;嵌入式SIMD控制核的設(shè)計研究[J];浙江大學(xué)學(xué)報(工學(xué)版);2001年02期
9 周西漢,劉勃,周荷琴,袁非牛;一種基于奔騰SIMD指令的快速背景提取方法[J];計算機工程與應(yīng)用;2004年27期
10 張倩;;二維SIMD結(jié)構(gòu)的低功耗調(diào)度[J];計算機工程;2009年10期
相關(guān)會議論文 前7條
1 梅家祥;王永文;邢座程;;SIMD模式下訪存單元的驗證[A];第十五屆計算機工程與工藝年會暨第一屆微處理器技術(shù)論壇論文集(A輯)[C];2011年
2 付光遠;;基于SIMD-MPP并行模型的圖像調(diào)度與映射方法研究[A];2006年全國開放式分布與并行計算機學(xué)術(shù)會議論文集(三)[C];2006年
3 高巍;宋妍;;基于SIMD體系結(jié)構(gòu)的數(shù)據(jù)相關(guān)控制語句轉(zhuǎn)化方法[A];2009年全國開放式分布與并行計算機學(xué)術(shù)會議論文集(上冊)[C];2009年
4 朱明慧;;ADI浮點DSP軟件編程中的指令并行與SIMD應(yīng)用[A];中國航空學(xué)會信號與信息處理專業(yè)全國第八屆學(xué)術(shù)會議論文集[C];2004年
5 李彥潔;龐一;孫立峰;;多視點視頻編碼中的SIMD優(yōu)化研究[A];第四屆和諧人機環(huán)境聯(lián)合學(xué)術(shù)會議論文集[C];2008年
6 Liangchun Xu;Hongping Zhang;Wenfei Guo;Di Zhang;;A new SIMD correlatoralgorithm for GNSS software receivers toprocess complex IF data[A];第四屆中國衛(wèi)星導(dǎo)航學(xué)術(shù)年會論文集-S7 北斗/GNSS用戶終端技術(shù)[C];2013年
7 吳鐵彬;劉衡竹;楊惠;張劍鋒;侯申;;一種快速SIMD浮點乘加器的設(shè)計與實現(xiàn)[A];第十五屆計算機工程與工藝年會暨第一屆微處理器技術(shù)論壇論文集(B輯)[C];2011年
相關(guān)博士學(xué)位論文 前8條
1 楊惠;面向性能的SIMD DSP指令流調(diào)度技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2014年
2 侯永生;多重循環(huán)SIMD向量化方法及性能優(yōu)化技術(shù)研究[D];解放軍信息工程大學(xué);2014年
3 張為華;共享主存多SIMD結(jié)構(gòu)編譯優(yōu)化及結(jié)構(gòu)研究[D];復(fù)旦大學(xué);2006年
4 李玉祥;面向非多媒體程序的SIMD向量化方法及優(yōu)化技術(shù)研究[D];中國科學(xué)技術(shù)大學(xué);2008年
5 張凱;向量SIMD DSP上高效矩陣運算技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2013年
6 朱嘉華;SIMD編譯優(yōu)化方法研究[D];復(fù)旦大學(xué);2005年
7 姜偉華;針對實際多媒體程序和多媒體擴展指令集的SIMD編譯優(yōu)化[D];復(fù)旦大學(xué);2005年
8 魏帥;面向SIMD的向量化算法及重組技術(shù)研究[D];解放軍信息工程大學(xué);2012年
相關(guān)碩士學(xué)位論文 前10條
1 沈陽;基于SIMD指令的多核軟件渲染器的設(shè)計與實現(xiàn)[D];浙江大學(xué);2015年
2 王力;SIMD指令在生物序列串匹配里的應(yīng)用[D];北京理工大學(xué);2015年
3 黃娟娟;多線程多SIMD自動向量化技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2013年
4 趙芮;一款高性能64位DSP中SIMD結(jié)構(gòu)FMAC的設(shè)計與驗證[D];國防科學(xué)技術(shù)大學(xué);2014年
5 林宗華;X-DSP定點乘累加的設(shè)計優(yōu)化與驗證[D];國防科學(xué)技術(shù)大學(xué);2014年
6 宋貴環(huán);YHFT-Matrix2編譯器SIMD優(yōu)化技術(shù)研究與實現(xiàn)[D];國防科學(xué)技術(shù)大學(xué);2014年
7 黃勝兵;面向BWDSP的SIMD編譯優(yōu)化技術(shù)研究與實現(xiàn)[D];中國科學(xué)技術(shù)大學(xué);2016年
8 胡辰;基于異構(gòu)SIMD并行的高分辨率星載SAR原始數(shù)據(jù)快速模擬研究[D];北京化工大學(xué);2016年
9 李國君;基于異構(gòu)SIMD并行的高分辨率星載SAR快速成像研究[D];北京化工大學(xué);2016年
10 徐沛文;32位高性能DSP SIMD向量存儲器的設(shè)計和驗證[D];國防科學(xué)技術(shù)大學(xué);2015年
,本文編號:1514864
本文鏈接:http://www.sikaile.net/kejilunwen/jisuanjikexuelunwen/1514864.html