一種面向SIMD擴展部件的向量化統(tǒng)一架構
【圖文】:
t類型歸約加3convolution二維卷積運算4MMM_f32float類型矩陣乘5MMM_f64double類型矩陣乘5.2實驗結果與分析實驗面向申威1600、華為某DSP和Alpha3種平臺的SIMD部件進行測試,,主要測試3種平臺的向量化加速比,驗證向量化工具的有效性,并對比SIMD部件的加速效果。實現(xiàn)架構為源源變換,對向量化后的代碼膨脹率進行測試,分析不同的指令集特征對代碼膨脹率的影響。各平臺SIMD部件加速比和膨脹率分別如圖4和圖5所示。圖4各平臺SIMD部件向量化加速比(下轉第44頁)·31·
【作者單位】: 信息工程大學;數(shù)學工程與先進計算國家重點實驗室;
【基金】:核高基國家科技重大專項(2009ZX01036)資助
【分類號】:TP332
【相似文獻】
相關期刊論文 前10條
1 季振洲,史捷,方濱興,胡銘曾,曲云波;一種陣列計算機輸入輸出系統(tǒng)的設計[J];哈爾濱工業(yè)大學學報;2000年01期
2 何冬明,楊新志,薛忠杰;基于算法的DSP硬件結構分析[J];電子與封裝;2004年01期
3 吳松,章勇,姚慶棟;嵌入式SIMD控制核的設計研究[J];浙江大學學報(工學版);2001年02期
4 杜慧敏,張智泉,沈緒榜;一種適用于數(shù)字圖像處理的DSP片上系統(tǒng)[J];微電子學與計算機;2004年01期
5 季振洲,周勇林,方濱興,胡銘曾;基于FPGA的ABC95陣列機PE芯片的設計[J];高技術通訊;2000年06期
6 江志紅,康立功;新一代數(shù)字信號處理器ADSP21161[J];信息技術;2003年07期
7 曾國蓀,陸鑫達,周定康;自動提取程序異構性的框架[J];計算機與現(xiàn)代化;1999年04期
8 馬蘭,沈笑云,侯春萍;高速三維實時圖象幀緩存設計[J];中國圖象圖形學報;2000年08期
9 林智華;對陣列處理機和多處理機的深入比較[J];福建金融管理干部學院學報;2004年01期
10 錢藝;李占才;李昂;王沁;;一種神經(jīng)網(wǎng)絡并行處理器的體系結構[J];小型微型計算機系統(tǒng);2007年10期
相關會議論文 前6條
1 梅家祥;王永文;邢座程;;SIMD模式下訪存單元的驗證[A];第十五屆計算機工程與工藝年會暨第一屆微處理器技術論壇論文集(A輯)[C];2011年
2 吳鐵彬;劉衡竹;楊惠;張劍鋒;侯申;;一種快速SIMD浮點乘加器的設計與實現(xiàn)[A];第十五屆計算機工程與工藝年會暨第一屆微處理器技術論壇論文集(B輯)[C];2011年
3 莊巍;劉衡竹;楊惠;;基數(shù)分離的快速定點SIMD除法器[A];第十五屆計算機工程與工藝年會暨第一屆微處理器技術論壇論文集(A輯)[C];2011年
4 周鋒;彭元喜;楊惠;;面向X處理器的SIMD移位器[A];第十五屆計算機工程與工藝年會暨第一屆微處理器技術論壇論文集(A輯)[C];2011年
5 張科勛;李勇;郭海勇;;一種半定制與全定制相結合的SIMD乘法器設計[A];第十五屆計算機工程與工藝年會暨第一屆微處理器技術論壇論文集(A輯)[C];2011年
6 辛乃軍;陳旭燦;孫海燕;陽柳;羅杰;淡孝強;王霽;;基于GCC的高性能DSP Matrix向量指令集擴展[A];第十五屆計算機工程與工藝年會暨第一屆微處理器技術論壇論文集(B輯)[C];2011年
相關重要報紙文章 前5條
1 秋葉;“架構”的戰(zhàn)爭[N];電腦報;2010年
2 土勻;了解“愛妻”[N];電腦報;2008年
3 秋葉;CUDA普及之路[N];電腦報;2010年
4 ;AMD新武器到來[N];電腦報;2010年
5 大老客;DX11時代誰能奪標[N];電腦報;2010年
相關博士學位論文 前7條
1 劉勝;超寬SIMD DSP片上并行數(shù)據(jù)訪存關鍵技術研究[D];國防科學技術大學;2012年
2 黃立波;片上集群體系結構關鍵技術研究[D];國防科學技術大學;2010年
3 何義;流體系結構指令管理及系統(tǒng)虛擬化仿真技術研究[D];國防科學技術大學;2010年
4 葛海通;32位高性能嵌入式CPU及平臺研發(fā)[D];浙江大學;2009年
5 王淼;面向多核處理器的并行編譯及優(yōu)化關鍵技術研究[D];國防科學技術大學;2010年
6 張波濤;片上高性能嵌入式計算—面向軟基帶的應用并行處理模型及體系結構[D];國防科學技術大學;2011年
7 吳丹;高效能計算型存儲器體系結構關鍵技術研究與實現(xiàn)[D];華中科技大學;2012年
相關碩士學位論文 前10條
1 陳向;SIMD數(shù)據(jù)置換指令的自動生成與優(yōu)化[D];國防科學技術大學;2010年
2 楊明;基于存儲訪問的SIMD優(yōu)化技術研究[D];解放軍信息工程大學;2011年
3 李國強;SIMD DSP中的高性能定點算術運算部件的設計與實現(xiàn)[D];國防科學技術大學;2012年
4 黃遠廣;多寬度SIMD結構DSP向量存儲器的設計與實現(xiàn)[D];國防科學技術大學;2012年
5 張慶丹;基于GPU的串匹配算法的實現(xiàn)[D];中國科學院研究生院(計算技術研究所);2006年
6 盧捚;基于Cell多核處理器的MPEG-2視頻解碼技術的研究[D];浙江大學;2008年
7 楊強;DSP高性能乘法部件的設計與實現(xiàn)[D];國防科學技術大學;2008年
8 周海亮;基于X流處理器的循環(huán)實現(xiàn)及優(yōu)化[D];國防科學技術大學;2006年
9 黃敬磊;GPU通用計算中的數(shù)據(jù)結構組織與應用研究[D];解放軍信息工程大學;2007年
10 羅飛;“銀河飛騰”DSP乘法部件及算術邏輯運算部件的設計[D];國防科學技術大學;2006年
本文編號:2533178
本文鏈接:http://www.sikaile.net/kejilunwen/jisuanjikexuelunwen/2533178.html