天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 計算機論文 >

分簇VLIW DSP上支持單雙字模式選擇的SIMD編譯優(yōu)化

發(fā)布時間:2019-01-12 12:52
【摘要】:BWDSP100是一款采用超長指令字(VLIW)和單指令多數據流(SIMD)架構的針對高性能計算領域而設計的32位靜態(tài)標量數字信號處理器,其指令級并行(ILP)主要是通過其特殊的分簇體系結構和SIMD指令來實現,然而現有的編譯框架無法對這些特殊的SIMD指令提供支持。由于BWDSP100擁有豐富的SIMD向量化資源,且其所運用的雷達數字信號處理領域對程序的性能要求極高,因此針對BWDSP100結構的特點,在傳統(tǒng)Open64編譯器中SIMD編譯優(yōu)化框架的基礎上提出并實現了一種支持單雙字模式選擇的SIMD編譯優(yōu)化算法,通過該算法可以顯著提高一些在DSP上有著廣泛運用計算密集型程序的性能。實驗結果表明,與優(yōu)化前相比,該算法方案在BWDSP編譯器上的實現能夠平均取得5.66的加速比。
[Abstract]:BWDSP100 is a 32-bit static scalar digital signal processor designed for high performance computing field based on super-long instruction word (VLIW) and single-instruction multi-stream (SIMD) architecture. The instruction level parallel (ILP) is mainly implemented through its special cluster architecture and SIMD instructions. However, the existing compilation frameworks can not support these special SIMD instructions. Because BWDSP100 has abundant SIMD vectorization resources, and the radar digital signal processing field used by BWDSP100 requires very high performance of the program, it aims at the characteristics of BWDSP100 structure. Based on the framework of SIMD compiler optimization in traditional Open64 compiler, a SIMD compiler optimization algorithm is proposed and implemented. This algorithm can significantly improve the performance of some computationally intensive programs on DSP. Experimental results show that the algorithm can achieve an average speedup of 5.66 on BWDSP compiler.
【作者單位】: 中國科學技術大學計算機科學與技術學院;安徽省高性能計算重點實驗室(中國科學技術大學);
【基金】:國家“核高基”重大專項(2012ZX01034-001-001)
【分類號】:TP332;TP314

【參考文獻】

相關期刊論文 前2條

1 姜軍;王超;尉紅梅;;一種局部寄存器分配的優(yōu)化策略[J];計算機應用與軟件;2013年12期

2 王昊;黃光紅;王向前;;基于BWDSP100的傳播分簇算法研究與實現[J];中國集成電路;2014年08期

【共引文獻】

相關期刊論文 前10條

1 吳丹;王志英;王紹剛;王淼;;一種確定多媒體應用程序內層循環(huán)的子字并行編譯方法[J];電子學報;2006年S1期

2 王昊;王向前;;BWDSP SIMD編譯的寄存器分配優(yōu)化技術研究[J];單片機與嵌入式系統(tǒng)應用;2015年04期

3 唐文勝;吳丹;;一種改進數據流圖的子字并行程序表示方法[J];計算機工程與應用;2006年29期

4 唐文勝;匡旺秋;;基于子字并行的串行圖像處理算法表示方法[J];計算機工程與應用;2007年35期

5 姜偉華,梅超,郭一,朱嘉華,臧斌宇,朱傳琪;一種針對多媒體擴展指令集和實際多媒體程序的自動向量化方法[J];計算機學報;2005年08期

6 張為華;朱嘉華;張宏江;臧斌宇;;基于位寬控制提高SIMD架構并行度的優(yōu)化算法[J];計算機學報;2009年11期

7 索維毅;趙榮彩;姚遠;張小妹;;基于跨基本塊變換和循環(huán)分布的SLP優(yōu)化技術[J];計算機科學;2013年10期

8 趙博;趙榮彩;李雁冰;高偉;;類型轉換語句的SLP發(fā)掘方法[J];計算機科學;2014年11期

9 劉鵬;趙榮彩;李朋遠;;一種面向向量化的動態(tài)指針別名分析框架[J];計算機科學;2015年03期

10 李朋遠;趙榮彩;高偉;張慶花;;一種支持跨幅訪存的向量化代碼生成方法[J];計算機科學;2015年05期

相關博士學位論文 前6條

1 黃立波;片上集群體系結構關鍵技術研究[D];國防科學技術大學;2010年

2 姜偉華;針對實際多媒體程序和多媒體擴展指令集的SIMD編譯優(yōu)化[D];復旦大學;2005年

3 朱嘉華;SIMD編譯優(yōu)化方法研究[D];復旦大學;2005年

4 李玉祥;面向非多媒體程序的SIMD向量化方法及優(yōu)化技術研究[D];中國科學技術大學;2008年

5 王淼;面向多核處理器的并行編譯及優(yōu)化關鍵技術研究[D];國防科學技術大學;2010年

6 姚遠;SIMD自動向量識別及代碼調優(yōu)技術研究[D];解放軍信息工程大學;2012年

相關碩士學位論文 前6條

1 陳向;SIMD數據置換指令的自動生成與優(yōu)化[D];國防科學技術大學;2010年

2 周建鵬;媒體處理器編譯器中SIMD編譯優(yōu)化技術的研究與實踐[D];浙江大學;2007年

3 王迪;SIMD編譯優(yōu)化技術研究[D];浙江大學;2008年

4 匡旺秋;多媒體應用程序子字并行自動識別關鍵技術研究[D];湖南師范大學;2009年

5 淡孝強;YHFT-Matrix編譯器SIMD指令自動向量化技術的研究與實現[D];國防科學技術大學;2012年

6 劉秉峰;YHFT-Matrix編譯器向量化技術的研究與實現[D];國防科學技術大學;2013年

【二級參考文獻】

相關期刊論文 前1條

1 胡定磊;陳書明;劉春林;;分簇結構超長指令字DSP編譯器的設計與實現[J];小型微型計算機系統(tǒng);2006年02期

【相似文獻】

相關期刊論文 前10條

1 侯永生;趙榮彩;高偉;朱嘉楓;;SIMD擴展部件數據依賴關系約束條件研究[J];信息工程大學學報;2014年01期

2 吳松,章勇,姚慶棟;嵌入式SIMD控制核的設計研究[J];浙江大學學報(工學版);2001年02期

3 周西漢,劉勃,周荷琴,袁非牛;一種基于奔騰SIMD指令的快速背景提取方法[J];計算機工程與應用;2004年27期

4 張倩;;二維SIMD結構的低功耗調度[J];計算機工程;2009年10期

5 魏帥;趙榮彩;姚遠;侯永生;;面向SIMD的數組重組和對齊優(yōu)化[J];計算機科學;2012年02期

6 張武健 ,邱曉海 ,周潤德 ,陳弘毅;A New Implementation of the Post-Stage Tasks of Motion Estimation Using SIMD Architecture[J];Tsinghua Science and Technology;2001年04期

7 李俊山,李莉,沈緒榜,焦康;圖象理解SIMD計算機的設計技術[J];小型微型計算機系統(tǒng);2002年09期

8 王馨梅,張發(fā)存,崔杜武;SIMD計算機的面向對象仿真方法[J];計算機工程;2005年17期

9 李初輝;王偉;肖瑋;;一種共享主存二維SIMD結構資源分配算法的改進與實現[J];計算機工程與科學;2008年09期

10 付光遠;;基于SIMD-MPP并行模型的圖像調度與映射方法研究[J];微電子學與計算機;2006年S1期

相關會議論文 前8條

1 梅家祥;王永文;邢座程;;SIMD模式下訪存單元的驗證[A];第十五屆計算機工程與工藝年會暨第一屆微處理器技術論壇論文集(A輯)[C];2011年

2 付光遠;;基于SIMD-MPP并行模型的圖像調度與映射方法研究[A];2006年全國開放式分布與并行計算機學術會議論文集(三)[C];2006年

3 高巍;宋妍;;基于SIMD體系結構的數據相關控制語句轉化方法[A];2009年全國開放式分布與并行計算機學術會議論文集(上冊)[C];2009年

4 朱明慧;;ADI浮點DSP軟件編程中的指令并行與SIMD應用[A];中國航空學會信號與信息處理專業(yè)全國第八屆學術會議論文集[C];2004年

5 李彥潔;龐一;孫立峰;;多視點視頻編碼中的SIMD優(yōu)化研究[A];第四屆和諧人機環(huán)境聯(lián)合學術會議論文集[C];2008年

6 Liangchun Xu;Hongping Zhang;Wenfei Guo;Di Zhang;;A new SIMD correlatoralgorithm for GNSS software receivers toprocess complex IF data[A];第四屆中國衛(wèi)星導航學術年會論文集-S7 北斗/GNSS用戶終端技術[C];2013年

7 吳鐵彬;劉衡竹;楊惠;張劍鋒;侯申;;一種快速SIMD浮點乘加器的設計與實現[A];第十五屆計算機工程與工藝年會暨第一屆微處理器技術論壇論文集(B輯)[C];2011年

8 張科勛;李勇;郭海勇;;一種半定制與全定制相結合的SIMD乘法器設計[A];第十五屆計算機工程與工藝年會暨第一屆微處理器技術論壇論文集(A輯)[C];2011年

相關博士學位論文 前5條

1 張為華;共享主存多SIMD結構編譯優(yōu)化及結構研究[D];復旦大學;2006年

2 李玉祥;面向非多媒體程序的SIMD向量化方法及優(yōu)化技術研究[D];中國科學技術大學;2008年

3 朱嘉華;SIMD編譯優(yōu)化方法研究[D];復旦大學;2005年

4 姜偉華;針對實際多媒體程序和多媒體擴展指令集的SIMD編譯優(yōu)化[D];復旦大學;2005年

5 魏帥;面向SIMD的向量化算法及重組技術研究[D];解放軍信息工程大學;2012年

相關碩士學位論文 前10條

1 張倩;二維SIMD結構的低功耗調度[D];復旦大學;2008年

2 李璋輝;支持浮點融合乘加的SIMD運算部件設計優(yōu)化及實現[D];國防科學技術大學;2013年

3 楊明;基于存儲訪問的SIMD優(yōu)化技術研究[D];解放軍信息工程大學;2011年

4 劉楷;基于SIMD結構的高性能DSP處理器評測程序的優(yōu)化與實現[D];西安電子科技大學;2012年

5 陳向;SIMD數據置換指令的自動生成與優(yōu)化[D];國防科學技術大學;2010年

6 彭永克;基于SIMD架構的二維DCT/IDCT變換電路模塊的設計與實現[D];上海交通大學;2008年

7 肖瑋;二維SIMD結構的編譯優(yōu)化與功耗研究[D];復旦大學;2008年

8 王迪;SIMD編譯優(yōu)化技術研究[D];浙江大學;2008年

9 高偉;面向SIMD的自動向量化優(yōu)化技術研究[D];解放軍信息工程大學;2013年

10 劉洋徐瑞;高性能DSP中SIMD關鍵計算部件的研究[D];國防科學技術大學;2012年



本文編號:2407798

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/jisuanjikexuelunwen/2407798.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶e85b1***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com