天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 計算機論文 >

一種面向SIMD擴展部件的向量化統(tǒng)一架構

發(fā)布時間:2019-09-07 18:15
【摘要】:隨著多媒體應用的普及和高性能計算的需求,越來越多的處理器集成了SIMD擴展。為了針對不同SIMD擴展部件自動生成高效的向量化代碼,設計了一套虛擬向量指令集,在此基礎上構建了一種面向SIMD擴展部件的向量化統(tǒng)一架構。將輸入程序通過向量識別等階段轉變?yōu)樘摂M向量指令的中間表示,而后通過向量長度解虛擬化和指令集解虛擬化,將其轉變?yōu)樘囟⊿IMD部件的向量指令集。在申威1600、DSP和Alpha上的實驗結果表明:統(tǒng)一架構能夠針對3種平臺自動變換出高效的向量化代碼,在DSP上的加速比要明顯優(yōu)于其它兩種平臺。
【圖文】:

向量化,加速比,部件,平臺


t類型歸約加3convolution二維卷積運算4MMM_f32float類型矩陣乘5MMM_f64double類型矩陣乘5.2實驗結果與分析實驗面向申威1600、華為某DSP和Alpha3種平臺的SIMD部件進行測試,,主要測試3種平臺的向量化加速比,驗證向量化工具的有效性,并對比SIMD部件的加速效果。實現(xiàn)架構為源源變換,對向量化后的代碼膨脹率進行測試,分析不同的指令集特征對代碼膨脹率的影響。各平臺SIMD部件加速比和膨脹率分別如圖4和圖5所示。圖4各平臺SIMD部件向量化加速比(下轉第44頁)·31·
【作者單位】: 信息工程大學;數(shù)學工程與先進計算國家重點實驗室;
【基金】:核高基國家科技重大專項(2009ZX01036)資助
【分類號】:TP332

【相似文獻】

相關期刊論文 前10條

1 季振洲,史捷,方濱興,胡銘曾,曲云波;一種陣列計算機輸入輸出系統(tǒng)的設計[J];哈爾濱工業(yè)大學學報;2000年01期

2 何冬明,楊新志,薛忠杰;基于算法的DSP硬件結構分析[J];電子與封裝;2004年01期

3 吳松,章勇,姚慶棟;嵌入式SIMD控制核的設計研究[J];浙江大學學報(工學版);2001年02期

4 杜慧敏,張智泉,沈緒榜;一種適用于數(shù)字圖像處理的DSP片上系統(tǒng)[J];微電子學與計算機;2004年01期

5 季振洲,周勇林,方濱興,胡銘曾;基于FPGA的ABC95陣列機PE芯片的設計[J];高技術通訊;2000年06期

6 江志紅,康立功;新一代數(shù)字信號處理器ADSP21161[J];信息技術;2003年07期

7 曾國蓀,陸鑫達,周定康;自動提取程序異構性的框架[J];計算機與現(xiàn)代化;1999年04期

8 馬蘭,沈笑云,侯春萍;高速三維實時圖象幀緩存設計[J];中國圖象圖形學報;2000年08期

9 林智華;對陣列處理機和多處理機的深入比較[J];福建金融管理干部學院學報;2004年01期

10 錢藝;李占才;李昂;王沁;;一種神經(jīng)網(wǎng)絡并行處理器的體系結構[J];小型微型計算機系統(tǒng);2007年10期

相關會議論文 前6條

1 梅家祥;王永文;邢座程;;SIMD模式下訪存單元的驗證[A];第十五屆計算機工程與工藝年會暨第一屆微處理器技術論壇論文集(A輯)[C];2011年

2 吳鐵彬;劉衡竹;楊惠;張劍鋒;侯申;;一種快速SIMD浮點乘加器的設計與實現(xiàn)[A];第十五屆計算機工程與工藝年會暨第一屆微處理器技術論壇論文集(B輯)[C];2011年

3 莊巍;劉衡竹;楊惠;;基數(shù)分離的快速定點SIMD除法器[A];第十五屆計算機工程與工藝年會暨第一屆微處理器技術論壇論文集(A輯)[C];2011年

4 周鋒;彭元喜;楊惠;;面向X處理器的SIMD移位器[A];第十五屆計算機工程與工藝年會暨第一屆微處理器技術論壇論文集(A輯)[C];2011年

5 張科勛;李勇;郭海勇;;一種半定制與全定制相結合的SIMD乘法器設計[A];第十五屆計算機工程與工藝年會暨第一屆微處理器技術論壇論文集(A輯)[C];2011年

6 辛乃軍;陳旭燦;孫海燕;陽柳;羅杰;淡孝強;王霽;;基于GCC的高性能DSP Matrix向量指令集擴展[A];第十五屆計算機工程與工藝年會暨第一屆微處理器技術論壇論文集(B輯)[C];2011年

相關重要報紙文章 前5條

1 秋葉;“架構”的戰(zhàn)爭[N];電腦報;2010年

2 土勻;了解“愛妻”[N];電腦報;2008年

3 秋葉;CUDA普及之路[N];電腦報;2010年

4 ;AMD新武器到來[N];電腦報;2010年

5 大老客;DX11時代誰能奪標[N];電腦報;2010年

相關博士學位論文 前7條

1 劉勝;超寬SIMD DSP片上并行數(shù)據(jù)訪存關鍵技術研究[D];國防科學技術大學;2012年

2 黃立波;片上集群體系結構關鍵技術研究[D];國防科學技術大學;2010年

3 何義;流體系結構指令管理及系統(tǒng)虛擬化仿真技術研究[D];國防科學技術大學;2010年

4 葛海通;32位高性能嵌入式CPU及平臺研發(fā)[D];浙江大學;2009年

5 王淼;面向多核處理器的并行編譯及優(yōu)化關鍵技術研究[D];國防科學技術大學;2010年

6 張波濤;片上高性能嵌入式計算—面向軟基帶的應用并行處理模型及體系結構[D];國防科學技術大學;2011年

7 吳丹;高效能計算型存儲器體系結構關鍵技術研究與實現(xiàn)[D];華中科技大學;2012年

相關碩士學位論文 前10條

1 陳向;SIMD數(shù)據(jù)置換指令的自動生成與優(yōu)化[D];國防科學技術大學;2010年

2 楊明;基于存儲訪問的SIMD優(yōu)化技術研究[D];解放軍信息工程大學;2011年

3 李國強;SIMD DSP中的高性能定點算術運算部件的設計與實現(xiàn)[D];國防科學技術大學;2012年

4 黃遠廣;多寬度SIMD結構DSP向量存儲器的設計與實現(xiàn)[D];國防科學技術大學;2012年

5 張慶丹;基于GPU的串匹配算法的實現(xiàn)[D];中國科學院研究生院(計算技術研究所);2006年

6 盧捚;基于Cell多核處理器的MPEG-2視頻解碼技術的研究[D];浙江大學;2008年

7 楊強;DSP高性能乘法部件的設計與實現(xiàn)[D];國防科學技術大學;2008年

8 周海亮;基于X流處理器的循環(huán)實現(xiàn)及優(yōu)化[D];國防科學技術大學;2006年

9 黃敬磊;GPU通用計算中的數(shù)據(jù)結構組織與應用研究[D];解放軍信息工程大學;2007年

10 羅飛;“銀河飛騰”DSP乘法部件及算術邏輯運算部件的設計[D];國防科學技術大學;2006年



本文編號:2533178

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/jisuanjikexuelunwen/2533178.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶948a4***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com