天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 計算機論文 >

面向循環(huán)級數(shù)組訪問的數(shù)據(jù)預(yù)取技術(shù)研究

發(fā)布時間:2020-06-23 06:19
【摘要】: 微處理器和DRAM之間日趨增大的性能差距促使人們探索新的技術(shù)以減少或者隱藏訪存延遲。Cache層次存儲結(jié)構(gòu)能夠有效減少大部分運用程序的訪存延遲,但是在科學(xué)計算程序中,訪存延遲在程序執(zhí)行時間中占很大比重,Cache的利用率低。這類程序中存在大量的線性訪問的數(shù)組,數(shù)組規(guī)模越大,強制失效和容量失效的次數(shù)也就越多。數(shù)據(jù)預(yù)取技術(shù)是解決這類訪存失效的有效方法,它預(yù)測可能的失效情況,提前發(fā)出數(shù)據(jù)訪問操作,將訪存與計算重疊起來,有效地隱藏了訪存延遲。 本文對科學(xué)計算程序中循環(huán)級數(shù)組訪問的數(shù)據(jù)預(yù)取技術(shù)進行了深入研究和探討。文章詳細分析了各種預(yù)取方案的優(yōu)劣,討論了研究對象的特點和各種影響因素,提出了一種軟硬件結(jié)合的數(shù)據(jù)預(yù)取方法。以此方法為指導(dǎo),本文首先對預(yù)取調(diào)度問題進行了重點研究,提出了一種新的預(yù)取度算法,改進了預(yù)取距離計算公式,并在Suif2平臺上實現(xiàn)了預(yù)取分析算法。其次,本文還設(shè)計了一個自適應(yīng)型的順序預(yù)取硬件單元,并移植了Simplescalar模擬器,模擬驗證了該硬件單元的功能行為。 實驗評測結(jié)果表明,本文的數(shù)據(jù)預(yù)取方法可以有效地減少循環(huán)級數(shù)組訪問的訪存延遲,降低程序的執(zhí)行時間,提高系統(tǒng)性能。
【學(xué)位授予單位】:國防科學(xué)技術(shù)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2008
【分類號】:TP332
【圖文】:

框圖,預(yù)取,程序片,非理想


lllIII圖2.1程序片段執(zhí)行框圖(a)沒有預(yù)取(b)理想預(yù)取(c)非理想預(yù)取圖2.1(a)和圖2.1(b)的對比,直觀的顯示了預(yù)取可以減少執(zhí)行時間。這里,計算和訪存的并行隱藏了訪存延遲,提高了程序執(zhí)行效率。圖中顯示的是一種理想情況,即預(yù)取的數(shù)據(jù)恰好及時響應(yīng)微處理器的訪問請求。圖2.l(c)顯示的是一種不太樂觀的情景,rl,r2的預(yù)取操作發(fā)出的太晚,以至于不能完全避免處理器的空轉(zhuǎn)。而:3又預(yù)取的過早,雖然隱藏了訪存時延,但在被使用之前,它將保存在Cache中一段時間

柱狀圖,失效率,柱狀圖,預(yù)取


EEEPPPNPB3.2220.2379990.8792220.0148881.0854440.0085550.724666為了便于對比,我們將上面的統(tǒng)計結(jié)果轉(zhuǎn)化成柱狀圖的形式,圖5.7是8個測試程取Pass前后LlCache失效率的對比圖,圖5.8是8個測試程序預(yù)取pass前后IPC的圖。

【共引文獻】

相關(guān)期刊論文 前8條

1 王正華;陸平靜;車永剛;;迭代編譯優(yōu)化技術(shù)綜述[J];計算機工程與應(yīng)用;2008年32期

2 陸平靜;車永剛;束堯;王正華;;多面體表示技術(shù)及在程序性能優(yōu)化中的應(yīng)用[J];計算機工程與科學(xué);2008年09期

3 侯永生;趙榮彩;高偉;高偉;;非正規(guī)化循環(huán)的單指令多數(shù)據(jù)向量化[J];計算機應(yīng)用;2013年11期

4 趙捷;趙榮彩;韓林;李寶亮;;面向MPI代碼生成的Open64編譯器后端[J];計算機學(xué)報;2014年07期

5 劉松;伍衛(wèi)國;趙博;蔣慶;;面向局部性和并行優(yōu)化的循環(huán)分塊技術(shù)[J];計算機研究與發(fā)展;2015年05期

6 趙捷;趙榮彩;丁銳;黃品豐;;基于嵌套循環(huán)分類的并行識別技術(shù)[J];軟件學(xué)報;2012年10期

7 侯永生;趙榮彩;高偉;李璇;;面向多面體模型的非規(guī)則程序SIMD投機優(yōu)化技術(shù)[J];信息工程大學(xué)學(xué)報;2014年03期

8 鄒燕燕;安虹;崔慧敏;周軍蕊;;矩陣形狀無關(guān)的并行編譯優(yōu)化[J];小型微型計算機系統(tǒng);2014年07期

相關(guān)博士學(xué)位論文 前4條

1 嚴明;面向領(lǐng)域應(yīng)用的異構(gòu)多核SoC系統(tǒng)結(jié)構(gòu)設(shè)計與優(yōu)化[D];國防科學(xué)技術(shù)大學(xué);2011年

2 陸平靜;低開銷的迭代編譯優(yōu)化關(guān)鍵技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2010年

3 姚遠;SIMD自動向量識別及代碼調(diào)優(yōu)技術(shù)研究[D];解放軍信息工程大學(xué);2012年

4 王慶;面向嵌入式多核系統(tǒng)的并行程序優(yōu)化技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2013年

相關(guān)碩士學(xué)位論文 前5條

1 張媛媛;自動向量化中的收益評估技術(shù)研究[D];解放軍信息工程大學(xué);2011年

2 趙捷;面向分布存儲的并行編譯優(yōu)化技術(shù)研究[D];解放軍信息工程大學(xué);2012年

3 高偉;面向SIMD的自動向量化優(yōu)化技術(shù)研究[D];解放軍信息工程大學(xué);2013年

4 鄒燕燕;數(shù)據(jù)中心計算環(huán)境下基于語義模式的編譯優(yōu)化[D];中國科學(xué)技術(shù)大學(xué);2014年

5 謝俊;基于TMS320C6678的細胞圖像識別并行系統(tǒng)設(shè)計與實現(xiàn)[D];湘潭大學(xué);2014年



本文編號:2726924

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/jisuanjikexuelunwen/2726924.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶0f187***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com