天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 計(jì)算機(jī)論文 >

YHFT-DX片內(nèi)二級Cache控制器的優(yōu)化設(shè)計(jì)

發(fā)布時間:2020-08-15 19:35
【摘要】: 數(shù)字信號處理器(DSP)在近年來得到了快速的發(fā)展和廣泛的應(yīng)用。片內(nèi)存儲系統(tǒng)的優(yōu)劣直接影響DSP的性能。存儲器層次結(jié)構(gòu)有效的降低了CPU訪存開銷,“Cache+RAM”層次結(jié)構(gòu)普遍應(yīng)用在DSP處理器存儲系統(tǒng)中,片內(nèi)二級存儲器(L2)是CPU和外設(shè)交換數(shù)據(jù)的中樞,存儲器訪存時間開銷中L2處理數(shù)據(jù)的時間開銷占有很大比例。L2是提高存儲系統(tǒng)性能的主要突破口,設(shè)計(jì)一個高性能的片內(nèi)二級存儲器具有重要意義。 YHFT-DX是我們自主研發(fā)的一款高頻高性能DSP,采用0.13umCMOS工藝,設(shè)計(jì)主頻600MHz,片上存儲器(L2)容量高達(dá)1MB,采用“Cache+RAM”結(jié)構(gòu),可以靈活配置Cache容量大小,具有可擴(kuò)展性好的特點(diǎn)。該芯片的技術(shù)路線是對已有同樣采用0.13umCMOS工藝、主頻為350MHz的芯片進(jìn)行優(yōu)化設(shè)計(jì)。在深入分析原設(shè)計(jì)的基礎(chǔ)上,本文對二級Cache控制器進(jìn)行了設(shè)計(jì)優(yōu)化,實(shí)現(xiàn)主頻600MHz,并提高處理缺失效率、降低功耗。主要工作和貢獻(xiàn)有: 一、針對二級Cache缺失流水線處理單個缺失請求的不足,設(shè)計(jì)實(shí)現(xiàn)了二級Cache預(yù)取結(jié)構(gòu)——Stream Buffer,命中預(yù)取緩存的缺失請求可以提前2拍得到數(shù)據(jù),在YHFT-DX一級Cache中連續(xù)發(fā)送讀缺失的概率大約為0.14%,同時使得L2原本串行的兩條數(shù)據(jù)通路可以并行執(zhí)行,提高了總線資源的利用率,所以對Cache系統(tǒng)性能有極大的提升,這一改進(jìn)使L2處理L1缺失的效率提高了6%以上。 二、為了把實(shí)現(xiàn)高頻帶來的功耗增大的危害降到最低,在二級Cache控制器中設(shè)計(jì)Tag行預(yù)取結(jié)構(gòu)——Filter,但是Filter緩存行數(shù)較少缺失率較高。為了彌補(bǔ)這一缺點(diǎn)采用了Tag路預(yù)測結(jié)構(gòu)。在體系結(jié)構(gòu)級單條路徑命中Filter或者Tag路預(yù)測準(zhǔn)確時,L2的Tag體就處于休眠狀態(tài),所以L2的功耗要比同時讀取四路Tag降低5%。 三、對原設(shè)計(jì)進(jìn)行關(guān)鍵路徑分析,發(fā)現(xiàn)二級Cache是影響性能的最關(guān)鍵模塊,本文采用優(yōu)化接口協(xié)議、平衡流水棧之間邏輯、關(guān)鍵信號提前處理、合理層次化等方法優(yōu)化邏輯結(jié)構(gòu)。對關(guān)鍵路徑中結(jié)構(gòu)規(guī)整的但延時較大的邏輯采用定制設(shè)計(jì),為9到512位譯碼器建立時序模型。片內(nèi)二級Cache經(jīng)過時序優(yōu)化設(shè)計(jì)后,達(dá)到了600MHz的設(shè)計(jì)目標(biāo)。 四、為了充分的驗(yàn)證二級Cache控制器的功能正確性,在全芯片級驗(yàn)證中使用了大型的測試程序,使用CCS調(diào)試了針對于MP4視屏解碼程序——Xvid,生成激勵作為Benchmark。并且介紹了RTL級邏輯仿真的流程和準(zhǔn)確定位設(shè)計(jì)缺陷的方法。 五、提出了壓縮L2行大小增加相對存儲容量、數(shù)據(jù)體縱向劃分減小功耗優(yōu)化L2數(shù)據(jù)體的先進(jìn)方法,并且評估了其設(shè)計(jì)實(shí)現(xiàn)的可行性。
【學(xué)位授予單位】:國防科學(xué)技術(shù)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2009
【分類號】:TP332
【圖文】:

原理圖,原理圖,主存,程序


構(gòu)內(nèi)只使用 RAM,沒有 Cache 配置,用于存放程序和/O 接口從片外加載,如 ADSP-21161N。的分層結(jié)構(gòu)內(nèi)使用一級 Cache/RAM 結(jié)構(gòu),Cache/RAM 的大小可編以存放所有程序或數(shù)據(jù)時,可以使用 Cache 方式與片外1[11]。結(jié)構(gòu)內(nèi)使用兩級 Cache 結(jié)構(gòu),其二級 Cache 是可部分或全部層次程序的需要,如 TI C6416[12]。內(nèi) Cache 技術(shù)的重要性和發(fā)展趨勢位于 CPU 和主存之間快速且小容量的存儲器,一般由 的提高了 CPU 訪問主存的平均速度,縮小了 CPU 和主問局部性原理為 Cache 技術(shù)提供了理論基礎(chǔ)[13],如圖

結(jié)構(gòu)圖,結(jié)構(gòu)圖


置搬移數(shù)據(jù)的負(fù)擔(dān),而 Cache 有兩個明顯的缺點(diǎn):一是容量小存放的數(shù)據(jù)是有的,如果 Cache 不命中 CPU 從外存中讀取數(shù)據(jù)帶來的延遲很大,而且 Cache 失的時間也是不確定的,所以 Cache 中的數(shù)據(jù)是一種靈活的數(shù)據(jù)形式。二是數(shù)據(jù)致性的維護(hù),Cache 中的數(shù)據(jù)必須和主存的數(shù)據(jù)保持一致,硬件資源限制了 Cache寫的方式,這是一個相當(dāng)復(fù)雜的過程,程序員對程序進(jìn)行干預(yù)的情況會更加多且更加難以把握。顯然對早期的 DSP 芯片來說“CPU 核+片內(nèi) RAM”的平板構(gòu)更加適合,如上述的片內(nèi)存儲器非分層結(jié)構(gòu),片內(nèi)只使用 RAM,用于存放程和數(shù)據(jù)。RAM 中的數(shù)據(jù)通過 I/O 接口和 DMA 從片外加載,如圖 1-2 所示 ADSP21161N[14]。

二級存儲器


圖 1-3 TIC6416 的片內(nèi)二級存儲器結(jié)構(gòu)程序員可以將一些核心代碼和數(shù)據(jù)結(jié)構(gòu)全部放入 RAM 中,需要處理的實(shí)時數(shù)通過 DMA 控制器進(jìn)行搬移,以此來完成 DSP 的“確定性”要求。而對于那些核心的代碼和數(shù)據(jù)結(jié)構(gòu)則放在片外,利用 Cache 而不是 DMA 來進(jìn)行片內(nèi)外數(shù)據(jù)交換,這樣既滿足了 DSP 的“實(shí)時性”要求[17],也減少了程序員的手工干預(yù)。外,Cache 還可以很好地適用于那些“實(shí)時性”要求不太高的程序?膳渲 Cache 容量大小的“Cache+RAM”存儲架構(gòu)是目前高性能 DSP 片內(nèi)存結(jié)構(gòu)的一個發(fā)展方向[18]。DSP 性能越來越高,片內(nèi)存儲器的容量越來越大,對che 性能也隨之增加,針對“減小 Cache 失效頻率”,“降低 Cache 失效的時間,“減小 Cache 命中時間”專家學(xué)者提出了很多的優(yōu)化措施[19]。其中包括增加che 容量,優(yōu)化關(guān)聯(lián)度算法,路預(yù)測和行預(yù)取,利用編譯器優(yōu)化代碼提高 Cache性能等等。而且現(xiàn)今 DSP 的片內(nèi)存儲器有由 SRAM 向 DRAM 轉(zhuǎn)變的趨勢[20]。管是 MIMD 還是多 DSP 核,乃至 DSP-RAM,基本上都是基于“DRAM+Cache”儲架構(gòu)的。值得注意的是,AD 公司的 TigerSHARC 系列 DSP 采用了 IBM 公司[21]

【參考文獻(xiàn)】

相關(guān)期刊論文 前1條

1 陳書明;李振濤;萬江華;胡定磊;郭陽;汪東;扈嘯;孫書為;;“銀河飛騰”高性能數(shù)字信號處理器研究進(jìn)展[J];計(jì)算機(jī)研究與發(fā)展;2006年06期



本文編號:2794551

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/jisuanjikexuelunwen/2794551.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶75b32***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com