流體系結(jié)構(gòu)存儲(chǔ)訪問機(jī)制的研究
發(fā)布時(shí)間:2021-09-28 16:19
流體系結(jié)構(gòu)用于媒體應(yīng)用以及科學(xué)計(jì)算,其在新興的高性能計(jì)算機(jī)體系結(jié)構(gòu)中備受關(guān)注。針對(duì)媒體應(yīng)用以及科學(xué)計(jì)算具有計(jì)算密集性、大量并行性與局部性等特征,流體系結(jié)構(gòu)將計(jì)算與訪存解耦合,把計(jì)算分割成一個(gè)個(gè)核心,而連接核心的輸入輸出則是數(shù)據(jù)流——由同構(gòu)記錄按一定順序組成的批量數(shù)據(jù)。計(jì)算與訪存解耦合暴露了程序的各種并行性與局部性,使得流體系結(jié)構(gòu)不但符合媒體應(yīng)用以及科學(xué)計(jì)算的程序特征,也符合當(dāng)今VLSI工藝的發(fā)展趨勢(shì)。斯坦福大學(xué)開發(fā)的Imagine流處理器是流體系結(jié)構(gòu)中的典型代表。Imagine在編程模型、編譯架構(gòu)、硬件結(jié)構(gòu)上采用了“核心級(jí)-流級(jí)”兩級(jí)模型,較徹底地解耦合了計(jì)算與訪存,能廣泛深入挖掘程序的各種并行性與局部性。因此,我們把Imagine作為主要研究對(duì)象來(lái)研究流體系結(jié)構(gòu)的具體運(yùn)行機(jī)制。本文將著重研究流體系結(jié)構(gòu)的存儲(chǔ)訪問機(jī)制。本文明確了流處理的基本概念,并以Imagine為例簡(jiǎn)要介紹流體系結(jié)構(gòu)的軟硬件組成。本文通過與傳統(tǒng)微處理器的比較,從程序設(shè)計(jì)模式、存儲(chǔ)層次、以及編譯優(yōu)化等角度詳細(xì)討論流體系結(jié)構(gòu)存儲(chǔ)訪問機(jī)制的優(yōu)點(diǎn)。本文研究了基于數(shù)據(jù)級(jí)并行的流存儲(chǔ)系統(tǒng)的設(shè)計(jì),并對(duì)其進(jìn)行了改進(jìn),進(jìn)一步提高了實(shí)際...
【文章來(lái)源】:國(guó)防科技大學(xué)湖南省 211工程院校 985工程院校
【文章頁(yè)數(shù)】:69 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
深度萃取的流處理過程
NUCA結(jié)構(gòu)
3.3.2編譯對(duì)SRF的分配使用在流體系結(jié)構(gòu)中,編譯對(duì)片內(nèi)存儲(chǔ)SRF的分配使用(以下稱流調(diào)度算法)按時(shí)間與空間兩個(gè)維度進(jìn)行,如圖3.6所示:橫軸代表S好空間,以S好的塊大小為基本刻度;縱軸以高級(jí)流操作為基本刻度,表示時(shí)間。流調(diào)度11’]的基本思想是首先確定每個(gè)流訪問所需s盯空間的大小;然后,根據(jù)相容性原則對(duì)這些流訪問進(jìn)行分類,從而形成一個(gè)個(gè)具有起止時(shí)間、空間大小雙重屬性的對(duì)空易勸(Buffer),用于捕獲同一流的多次引用;最后,采用各種辦法將這些緩沖盡可能“緊致”地安放在如圖3.6所示的長(zhǎng)方形中(稱為對(duì)空SRF)。作為片內(nèi)存儲(chǔ)的SRF從某種意義上可以認(rèn)為是“流”的Cache。傳統(tǒng)Cache的淘汰策略多為 LRU(LeastRecentUsed),但是LRU策略不能很有效地捕獲編程模型所暴露出的對(duì)同一流的多次引用
本文編號(hào):3412252
【文章來(lái)源】:國(guó)防科技大學(xué)湖南省 211工程院校 985工程院校
【文章頁(yè)數(shù)】:69 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
深度萃取的流處理過程
NUCA結(jié)構(gòu)
3.3.2編譯對(duì)SRF的分配使用在流體系結(jié)構(gòu)中,編譯對(duì)片內(nèi)存儲(chǔ)SRF的分配使用(以下稱流調(diào)度算法)按時(shí)間與空間兩個(gè)維度進(jìn)行,如圖3.6所示:橫軸代表S好空間,以S好的塊大小為基本刻度;縱軸以高級(jí)流操作為基本刻度,表示時(shí)間。流調(diào)度11’]的基本思想是首先確定每個(gè)流訪問所需s盯空間的大小;然后,根據(jù)相容性原則對(duì)這些流訪問進(jìn)行分類,從而形成一個(gè)個(gè)具有起止時(shí)間、空間大小雙重屬性的對(duì)空易勸(Buffer),用于捕獲同一流的多次引用;最后,采用各種辦法將這些緩沖盡可能“緊致”地安放在如圖3.6所示的長(zhǎng)方形中(稱為對(duì)空SRF)。作為片內(nèi)存儲(chǔ)的SRF從某種意義上可以認(rèn)為是“流”的Cache。傳統(tǒng)Cache的淘汰策略多為 LRU(LeastRecentUsed),但是LRU策略不能很有效地捕獲編程模型所暴露出的對(duì)同一流的多次引用
本文編號(hào):3412252
本文鏈接:http://www.sikaile.net/kejilunwen/jisuanjikexuelunwen/3412252.html
最近更新
教材專著