SIMD向量指令的非滿載使用方法研究
本文選題:大規(guī)模SIMD + 并行; 參考:《計算機科學》2015年07期
【摘要】:大規(guī)模SIMD體系結構提供了更強的向量并行硬件支持,但是,大量迭代次數不足的循環(huán)由于不能提供足夠的并行性,難以用等價的向量方式實現。為了更有效地利用SIMD,提出了一種非滿載地使用SIMD指令的向量化方法。研究了向量寄存器的使用方式,基于非滿載的向量寄存器使用方式實現了非滿載的向量操作和短循環(huán)的向量化,并將非滿載的向量化方法用于一般循環(huán)的向量化。提供了收益分析方法來為本向量化方法作精確指導。實驗結果表明了該方法的有效性,所選測試用例的目標循環(huán)被向量化,平均加速比達到1.2。
[Abstract]:Large-scale SIMD architecture provides stronger vector parallel hardware support, but the cycle with insufficient number of iterations cannot be implemented in a vector equivalent way because it can not provide enough parallelism.In order to make more efficient use of SIMD, a vectorization method using SIMD instructions is proposed.The use of vector registers is studied. Vector operations with non-full loads and vectorization of short cycles are realized based on the non-full load vector registers, and the non-full load vector quantization method is applied to the vectorization of general cycles.The income analysis method is provided to provide accurate guidance for this vectorization method.The experimental results show that the method is effective and the target cycle of the selected test cases is vectorized with an average speedup of 1.2.
【作者單位】: 信息工程大學數學工程與先進計算國家重點實驗室;
【基金】:國家高技術研究發(fā)展計劃(863)(2009AA01220) “核高基”重大專項(2009zx10036-001-001)資助
【分類號】:TP332
【參考文獻】
相關期刊論文 前1條
1 辛乃軍;陳旭燦;孫海燕;陽柳;羅杰;淡孝強;王霽;;基于GCC的高性能DSP Matrix向量指令集擴展[J];計算機工程與科學;2012年01期
相關博士學位論文 前1條
1 魏帥;面向SIMD的向量化算法及重組技術研究[D];解放軍信息工程大學;2012年
【共引文獻】
相關期刊論文 前4條
1 徐穎;李春江;董鈺山;周思齊;;GCC編譯器中編譯指導的自動向量化實現[J];計算機科學;2014年S2期
2 徐金龍;趙榮彩;韓林;;分段約束的超字并行向量發(fā)掘路徑優(yōu)化算法[J];計算機應用;2015年04期
3 高偉;趙榮彩;韓林;龐建民;丁銳;;SIMD自動向量化編譯優(yōu)化概述[J];軟件學報;2015年06期
4 徐金龍;趙榮彩;丁銳;;面向循環(huán)的混合向量化方法研究[J];小型微型計算機系統(tǒng);2014年12期
相關碩士學位論文 前2條
1 高偉;面向SIMD的自動向量化優(yōu)化技術研究[D];解放軍信息工程大學;2013年
2 劉蘇;基于ARM11和Linux的網絡視頻監(jiān)控系統(tǒng)[D];江西理工大學;2014年
【二級參考文獻】
相關期刊論文 前7條
1 付雄;王汝傳;;一種基于局部性的數據重組框架[J];計算機科學;2009年02期
2 魏帥;趙榮彩;姚遠;侯永生;;面向SIMD的數組重組和對齊優(yōu)化[J];計算機科學;2012年02期
3 錢興隆;臧斌宇;朱傳琪;;一種SIMD優(yōu)化中的向量寄存器部分重用方法[J];計算機工程與科學;2007年05期
4 姜偉華,梅超,郭一,朱嘉華,臧斌宇,朱傳琪;一種針對多媒體擴展指令集和實際多媒體程序的自動向量化方法[J];計算機學報;2005年08期
5 魏帥;趙榮彩;姚遠;;面向國產CPU SW-1600的向量重組[J];計算機應用與軟件;2011年11期
6 魏帥;魏然;侯永生;;面向科學計算程序的向量化[J];信息工程大學學報;2011年06期
7 李玉祥;施慧;陳莉;;面向非多媒體程序的SIMD向量化算法的研究及改進[J];小型微型計算機系統(tǒng);2009年10期
相關博士學位論文 前3條
1 朱嘉華;SIMD編譯優(yōu)化方法研究[D];復旦大學;2005年
2 付雄;利用程序分析和優(yōu)化提高Cache性能[D];中國科學技術大學;2007年
3 李玉祥;面向非多媒體程序的SIMD向量化方法及優(yōu)化技術研究[D];中國科學技術大學;2008年
相關碩士學位論文 前2條
1 楊明;基于存儲訪問的SIMD優(yōu)化技術研究[D];解放軍信息工程大學;2011年
2 趙常智;支持SIMD的DSP編譯優(yōu)化技術的研究與實現[D];國防科學技術大學;2005年
【相似文獻】
相關期刊論文 前10條
1 吳松,章勇,姚慶棟;嵌入式SIMD控制核的設計研究[J];浙江大學學報(工學版);2001年02期
2 張倩;;二維SIMD結構的低功耗調度[J];計算機工程;2009年10期
3 李初輝;王偉;肖瑋;;一種共享主存二維SIMD結構資源分配算法的改進與實現[J];計算機工程與科學;2008年09期
4 陳向;沈立;李家文;;SIMD數據置換操作的自動生成和優(yōu)化[J];計算機科學;2011年05期
5 桑紅石,沈緒榜,陳朝陽;LS SIMD陣列微處理器控制信號時序分析[J];小型微型計算機系統(tǒng);2001年12期
6 單睿;一種基于SIMD結構的可重組乘累加器設計[J];微計算機應用;2003年03期
7 鄭偉,姚慶棟,張明,蔣志迪,李東曉,賴莉亞,周莉;一種支持SIMD指令的低功耗分裂式ALU設計[J];計算機工程;2004年17期
8 王光;;一種基于PIM技術的SIMD核設計[J];中國科學技術大學學報;2013年07期
9 于澤德;;基于SIMD-MC~2的并行FFT算法[J];現代計算機(專業(yè)版);2008年10期
10 王光;;一種基于嵌入式微處理器SIMD核的可重構數據總線設計[J];電子產品世界;2012年11期
相關會議論文 前3條
1 梅家祥;王永文;邢座程;;SIMD模式下訪存單元的驗證[A];第十五屆計算機工程與工藝年會暨第一屆微處理器技術論壇論文集(A輯)[C];2011年
2 吳鐵彬;劉衡竹;楊惠;張劍鋒;侯申;;一種快速SIMD浮點乘加器的設計與實現[A];第十五屆計算機工程與工藝年會暨第一屆微處理器技術論壇論文集(B輯)[C];2011年
3 張科勛;李勇;郭海勇;;一種半定制與全定制相結合的SIMD乘法器設計[A];第十五屆計算機工程與工藝年會暨第一屆微處理器技術論壇論文集(A輯)[C];2011年
相關碩士學位論文 前9條
1 張倩;二維SIMD結構的低功耗調度[D];復旦大學;2008年
2 李璋輝;支持浮點融合乘加的SIMD運算部件設計優(yōu)化及實現[D];國防科學技術大學;2013年
3 楊明;基于存儲訪問的SIMD優(yōu)化技術研究[D];解放軍信息工程大學;2011年
4 劉楷;基于SIMD結構的高性能DSP處理器評測程序的優(yōu)化與實現[D];西安電子科技大學;2012年
5 陳向;SIMD數據置換指令的自動生成與優(yōu)化[D];國防科學技術大學;2010年
6 劉洋徐瑞;高性能DSP中SIMD關鍵計算部件的研究[D];國防科學技術大學;2012年
7 成興華;FT-XDSP高性能64位定點SIMD乘加部件的設計與實現[D];國防科學技術大學;2013年
8 劉純悅;基于SIMD的媒體處理器的數據存儲與組織體系結構優(yōu)化研究[D];浙江大學;2007年
9 黃遠廣;多寬度SIMD結構DSP向量存儲器的設計與實現[D];國防科學技術大學;2012年
,本文編號:1755636
本文鏈接:http://www.sikaile.net/kejilunwen/jisuanjikexuelunwen/1755636.html