SIMD非對齊訪存結(jié)構(gòu)設計與實現(xiàn)
本文關(guān)鍵詞:SIMD非對齊訪存結(jié)構(gòu)設計與實現(xiàn)
更多相關(guān)文章: 高性能計算 數(shù)據(jù)級并行 向量化 單指令流多數(shù)據(jù)流擴展 非對齊訪存 Gem模擬器
【摘要】:單指令流多數(shù)據(jù)流(SIMD)是實現(xiàn)數(shù)據(jù)級并行的有效方法,但訪問地址非對齊的數(shù)據(jù)嚴重影響程序的向量化,造成處理器性能下降。為降低非對齊訪存延時,對高性能應用程序的訪存結(jié)構(gòu)進行建模,設計并實現(xiàn)SIMD分離緩沖行非對齊訪存結(jié)構(gòu)與雙體cache非對齊訪存結(jié)構(gòu)。實驗結(jié)果表明,在雙體cache非對齊訪存結(jié)構(gòu)下,通過兩數(shù)組相加與SIMD向量化實現(xiàn)的非對齊訪存代碼可達到對齊訪存代碼性能的99%,提高了SIMD向量化的訪存效率。
【作者單位】: 國防科學技術(shù)大學計算機學院;
【關(guān)鍵詞】: 高性能計算 數(shù)據(jù)級并行 向量化 單指令流多數(shù)據(jù)流擴展 非對齊訪存 Gem模擬器
【基金】:國家自然科學基金資助項目“面向超高性能計算的眾線程寬向量微體系結(jié)構(gòu)研究”(61170045)
【分類號】:TP332;TP333
【正文快照】: 中文引用格式:余成龍,王永文.SIMD非對齊訪存結(jié)構(gòu)設計與實現(xiàn)[J].計算機工程,2016,42(9):1-4.英文引用格式:Yu Chenglong,Wang Yongwen.Design and Implementation of SIMD Unaligned Memory Access Structure[J].Computer Engineering,2016,42(9):1-4.1概述單指令流多數(shù)據(jù)流(S
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 張為華;臧斌宇;王曄;錢興隆;朱傳琪;;基于共享向量的二維SIMD調(diào)度算法[J];計算機學報;2006年10期
2 李璞;孫亞輝;;64位環(huán)境SIMD性能優(yōu)化技術(shù)研究[J];計算機與信息技術(shù);2007年04期
3 卜士喜;竺紅衛(wèi);;軟件SIMD的研究及應用[J];計算機工程;2010年19期
4 侯永生;趙榮彩;黃磊;韓林;;面向SIMD擴展部件的循環(huán)優(yōu)化研究[J];計算機科學;2014年05期
5 張為華;臧斌宇;;共享主存多SIMD結(jié)構(gòu)及編譯技術(shù)研究[J];計算機科學與探索;2009年01期
6 郭陽;丁偉;李振濤;;高性能算術(shù)SIMD模塊的電路設計[J];微電子學與計算機;2010年09期
7 侯永生;趙榮彩;高偉;朱嘉楓;;SIMD擴展部件數(shù)據(jù)依賴關(guān)系約束條件研究[J];信息工程大學學報;2014年01期
8 吳松,章勇,姚慶棟;嵌入式SIMD控制核的設計研究[J];浙江大學學報(工學版);2001年02期
9 周西漢,劉勃,周荷琴,袁非牛;一種基于奔騰SIMD指令的快速背景提取方法[J];計算機工程與應用;2004年27期
10 張倩;;二維SIMD結(jié)構(gòu)的低功耗調(diào)度[J];計算機工程;2009年10期
中國重要會議論文全文數(shù)據(jù)庫 前7條
1 梅家祥;王永文;邢座程;;SIMD模式下訪存單元的驗證[A];第十五屆計算機工程與工藝年會暨第一屆微處理器技術(shù)論壇論文集(A輯)[C];2011年
2 付光遠;;基于SIMD-MPP并行模型的圖像調(diào)度與映射方法研究[A];2006年全國開放式分布與并行計算機學術(shù)會議論文集(三)[C];2006年
3 高巍;宋妍;;基于SIMD體系結(jié)構(gòu)的數(shù)據(jù)相關(guān)控制語句轉(zhuǎn)化方法[A];2009年全國開放式分布與并行計算機學術(shù)會議論文集(上冊)[C];2009年
4 朱明慧;;ADI浮點DSP軟件編程中的指令并行與SIMD應用[A];中國航空學會信號與信息處理專業(yè)全國第八屆學術(shù)會議論文集[C];2004年
5 李彥潔;龐一;孫立峰;;多視點視頻編碼中的SIMD優(yōu)化研究[A];第四屆和諧人機環(huán)境聯(lián)合學術(shù)會議論文集[C];2008年
6 Liangchun Xu;Hongping Zhang;Wenfei Guo;Di Zhang;;A new SIMD correlatoralgorithm for GNSS software receivers toprocess complex IF data[A];第四屆中國衛(wèi)星導航學術(shù)年會論文集-S7 北斗/GNSS用戶終端技術(shù)[C];2013年
7 吳鐵彬;劉衡竹;楊惠;張劍鋒;侯申;;一種快速SIMD浮點乘加器的設計與實現(xiàn)[A];第十五屆計算機工程與工藝年會暨第一屆微處理器技術(shù)論壇論文集(B輯)[C];2011年
中國博士學位論文全文數(shù)據(jù)庫 前8條
1 楊惠;面向性能的SIMD DSP指令流調(diào)度技術(shù)研究[D];國防科學技術(shù)大學;2014年
2 侯永生;多重循環(huán)SIMD向量化方法及性能優(yōu)化技術(shù)研究[D];解放軍信息工程大學;2014年
3 張為華;共享主存多SIMD結(jié)構(gòu)編譯優(yōu)化及結(jié)構(gòu)研究[D];復旦大學;2006年
4 李玉祥;面向非多媒體程序的SIMD向量化方法及優(yōu)化技術(shù)研究[D];中國科學技術(shù)大學;2008年
5 張凱;向量SIMD DSP上高效矩陣運算技術(shù)研究[D];國防科學技術(shù)大學;2013年
6 朱嘉華;SIMD編譯優(yōu)化方法研究[D];復旦大學;2005年
7 姜偉華;針對實際多媒體程序和多媒體擴展指令集的SIMD編譯優(yōu)化[D];復旦大學;2005年
8 魏帥;面向SIMD的向量化算法及重組技術(shù)研究[D];解放軍信息工程大學;2012年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 沈陽;基于SIMD指令的多核軟件渲染器的設計與實現(xiàn)[D];浙江大學;2015年
2 王力;SIMD指令在生物序列串匹配里的應用[D];北京理工大學;2015年
3 黃娟娟;多線程多SIMD自動向量化技術(shù)研究[D];國防科學技術(shù)大學;2013年
4 趙芮;一款高性能64位DSP中SIMD結(jié)構(gòu)FMAC的設計與驗證[D];國防科學技術(shù)大學;2014年
5 林宗華;X-DSP定點乘累加的設計優(yōu)化與驗證[D];國防科學技術(shù)大學;2014年
6 宋貴環(huán);YHFT-Matrix2編譯器SIMD優(yōu)化技術(shù)研究與實現(xiàn)[D];國防科學技術(shù)大學;2014年
7 黃勝兵;面向BWDSP的SIMD編譯優(yōu)化技術(shù)研究與實現(xiàn)[D];中國科學技術(shù)大學;2016年
8 胡辰;基于異構(gòu)SIMD并行的高分辨率星載SAR原始數(shù)據(jù)快速模擬研究[D];北京化工大學;2016年
9 李國君;基于異構(gòu)SIMD并行的高分辨率星載SAR快速成像研究[D];北京化工大學;2016年
10 徐沛文;32位高性能DSP SIMD向量存儲器的設計和驗證[D];國防科學技術(shù)大學;2015年
,本文編號:1008285
本文鏈接:http://www.sikaile.net/kejilunwen/jisuanjikexuelunwen/1008285.html