天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

微處理器性能分析與優(yōu)化

發(fā)布時(shí)間:2020-05-11 15:14
【摘要】: 面對(duì)日益復(fù)雜的設(shè)計(jì)和有限的設(shè)計(jì)時(shí)間,如何有效地進(jìn)行性能分析和優(yōu)化,是擺在每一個(gè)處理器設(shè)計(jì)者面前的問題。本文緊密結(jié)合一個(gè)高性能微處理器(龍芯2號(hào)[HZL05])的設(shè)計(jì),從性能分析環(huán)境設(shè)計(jì)和性能分析方法著手,系統(tǒng)地研究了微處理器性能分析和優(yōu)化問題,并根據(jù)性能分析結(jié)果提出了若干龍芯2號(hào)結(jié)構(gòu)優(yōu)化方法。 性能分析環(huán)境的核心是目標(biāo)處理器和工作負(fù)載的模型,這些模型的準(zhǔn)確性、速度和靈活性是其關(guān)鍵指標(biāo)。處理器的RTL模型是一種準(zhǔn)確的模型,但是它的速度和靈活性不能滿足性能分析的要求。本文提出了一種使用高級(jí)語(yǔ)言對(duì)硬件建模的方法,并使用它建立了龍芯2號(hào)的信號(hào)級(jí)模擬器ICT-godson。ICT-godson和RTL的邏輯行為相同,但速度可以比RTL仿真高一個(gè)數(shù)量級(jí)以上。 ICT-godson部分解決了運(yùn)行速度的問題,但由于它還是模擬了所有硬件信號(hào)和行為,其速度和靈活性依然受到比較大的限制。為此本文進(jìn)一步建立了一種更高層的模擬器Sim-godson。Sim-godson是一個(gè)用C語(yǔ)言實(shí)現(xiàn)的龍芯2號(hào)處理器性能模型。執(zhí)行驅(qū)動(dòng)的組織方式、高效的數(shù)據(jù)結(jié)構(gòu)和算法以及模塊化實(shí)現(xiàn)保證了Sim-godson的速度和靈活性。Sim-godson每秒能夠模擬約500K個(gè)處理器周期,和目前公開的最快的詳細(xì)模擬器相當(dāng)。Sim-godson支持大程序快速評(píng)估,能夠在一個(gè)小時(shí)內(nèi)準(zhǔn)確地給出SPEC CPU2000程序的性能數(shù)據(jù)。Sim-godson同時(shí)支持用戶級(jí)模擬和全系統(tǒng)模擬,既能滿足不同場(chǎng)合的要求,還能方便地隔離操作系統(tǒng)和I/O對(duì)程序性能的影響。本文還為Sim-godson建立了一個(gè)完整的驗(yàn)證流程,它能夠有效地控制模擬器的誤差。 為了充分滿足不同設(shè)計(jì)階段和設(shè)計(jì)目的的需求,性能分析環(huán)境應(yīng)該由一組工具組成。除了ICT-godson和Sim-godson兩種高級(jí)語(yǔ)言性能模型,本文建立的性能分析環(huán)境還包括RTL和FPGA仿真環(huán)境以及一些輔助的軟件工具。RTL和FPGA主要用于驗(yàn)證高級(jí)語(yǔ)言模型,各種輔助工具可以用于工作負(fù)載的分析和優(yōu)化。 本文為ICT-godson和Sim-godson模擬器實(shí)現(xiàn)了多角度的數(shù)據(jù)收集。這種方法能夠從各個(gè)側(cè)面體現(xiàn)目標(biāo)處理器的行為,幫助設(shè)計(jì)人員發(fā)現(xiàn)性能瓶頸。為了更深入地理解高性能微處理器的行為,本文進(jìn)一步考察了一些瓶頸分析方法。這些方法能夠用來(lái)系統(tǒng)地確定處理器內(nèi)部各類瓶頸因素的重要程度以及它們之間的關(guān)系。 最后,本文詳細(xì)地討論了龍芯2號(hào)性能分析和優(yōu)化工作。我們展示了多角度的數(shù)據(jù)收集方法的實(shí)際應(yīng)用,分析了龍芯2號(hào)的瓶頸,并討論了基于性能分析的一些優(yōu)化,包括Load猜測(cè)優(yōu)化、存儲(chǔ)系統(tǒng)優(yōu)化等。本文還討論了對(duì)SPEC CPU2000工作負(fù)載的分析,以及編譯器和操作系統(tǒng)對(duì)性能的影響。實(shí)踐證明,本文所建立的性能分析環(huán)境和分析方法能很好地滿足實(shí)際高性能微處理器性能分析和優(yōu)化的需求。
【圖文】:

界面圖,界面,檢查點(diǎn),內(nèi)部狀態(tài)


第三章 ICT-godson 模擬器的設(shè)計(jì)與優(yōu)化記錄到文件中。ICT-godson 實(shí)現(xiàn)了檢查點(diǎn)(checkpoint)支持,它能夠把某個(gè)時(shí)刻的處理器內(nèi)部狀態(tài)記錄到文件,利用該文件以后可以迅速恢復(fù)到該時(shí)刻的狀態(tài)。檢查點(diǎn)在定位錯(cuò)誤的過(guò)程中非常有用。例如,如果模擬器運(yùn)行 10 億拍時(shí)發(fā)現(xiàn)錯(cuò)誤,我們可以每個(gè) 1 億拍保存一個(gè)檢查點(diǎn),然后從離錯(cuò)誤現(xiàn)象最近的檢查點(diǎn)開始,尋找錯(cuò)誤的根源。檢查點(diǎn)也能用于節(jié)省性能分析的時(shí)間,例如,我們可以把操作系統(tǒng)完成啟動(dòng)時(shí)的狀態(tài)保存為一個(gè)檢查點(diǎn),并利用這個(gè)檢查點(diǎn)節(jié)省模擬操作系統(tǒng)啟動(dòng)的時(shí)間。3.2.3 可視化我們實(shí)現(xiàn)了一個(gè)基于 TCL/TK 的可視化界面,用于直觀地觀察處理器內(nèi)部狀態(tài)變化,如圖 3.1 所示。這種方式能有助于理解處理器的工作原理,也可以用于分析一些典型代碼段的行為。

設(shè)計(jì)矩陣


圖 6.1 PB 設(shè)計(jì)矩陣(X=8)6.3 交互代價(jià)分析Fields 等人[FBH04]提出使用交互代價(jià)(interaction costs, icost)來(lái)分析微體系結(jié)構(gòu)瓶頸。在這種方法里,一個(gè)性能瓶頸是一個(gè)影響執(zhí)行時(shí)間的事件集合。這里的事件包括前面所說(shuō)的處理器參數(shù),也可以指一些具體事件,例如特定的一個(gè) CACHE 不命中。一個(gè)事件的代價(jià)(cost)定義為將該事件理想化(對(duì)一個(gè) CACHE 不命中來(lái)說(shuō),理想化就是把它換為命中;對(duì)指令窗口大小來(lái)說(shuō),則是把指令窗口設(shè)為無(wú)限大)之后能夠獲得的加速。設(shè) t 為原執(zhí)行時(shí)間,t(e)為將事件 e 理想化之后的執(zhí)行時(shí)間,則Cost(e) = t  t(e).這個(gè)定義可以自然地?cái)U(kuò)展到一個(gè)事件集合的代價(jià)。Cost 是一個(gè)很有用的值,,比如給出一個(gè)特定 load 指令所有動(dòng)態(tài)不命中的代價(jià),可以用來(lái)決定對(duì)它預(yù)取是否值得;對(duì)于處理器設(shè)計(jì)者來(lái)說(shuō),它可以指出優(yōu)化某個(gè)部件有多大的潛力。只了解單個(gè)事件的代價(jià)是不夠的,因?yàn)樗鼪]有體現(xiàn)事件之間的交互影響。正如 6.1
【學(xué)位授予單位】:中國(guó)科學(xué)院研究生院(計(jì)算技術(shù)研究所)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2005
【分類號(hào)】:TP332

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 于永佳;;微處理器I~2C總線系統(tǒng)保護(hù)電路維修技巧(中)[J];家電檢修技術(shù);2011年09期

2 ZW;;技術(shù)控須知 主流雙核智能/平板處理器解析[J];電腦迷;2011年17期

3 田沖;;論ARM嵌入式系統(tǒng)的應(yīng)用特點(diǎn)與發(fā)展[J];科技創(chuàng)新導(dǎo)報(bào);2011年17期

4 ;綜合新聞[J];上海微型計(jì)算機(jī);1998年17期

5 邵祖林;;LG純平MC-991A機(jī)芯保護(hù)電路維修技巧[J];家電檢修技術(shù);2011年16期

6 幸坤濤;;基于TMC246A的步進(jìn)電機(jī)驅(qū)動(dòng)器設(shè)計(jì)[J];電子世界;2010年03期

7 郭宏偉;;微處理器在井下排水系統(tǒng)的應(yīng)用[J];煤;2011年07期

8 王虎升;李金環(huán);袁憲鋒;張勝春;;基于STM32的嵌入式語(yǔ)音播報(bào)系統(tǒng)的設(shè)計(jì)[J];北京聯(lián)合大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年03期

9 李建;夏靜;;清管器中的信號(hào)發(fā)射裝置電路設(shè)計(jì)[J];電子設(shè)計(jì)工程;2011年15期

10 史延?xùn)|;王振華;寧飛;;基于ARM的電暖加熱器的設(shè)計(jì)與實(shí)現(xiàn)[J];機(jī)械與電子;2011年08期

相關(guān)會(huì)議論文 前10條

1 李保社;;人為給CT埋下禍根[A];中華醫(yī)學(xué)會(huì)醫(yī)學(xué)工程學(xué)分會(huì)第一次醫(yī)學(xué)影像設(shè)備應(yīng)用技術(shù)研討會(huì)論文集[C];1999年

2 鞏恩環(huán);趙海發(fā);;傳感器、微處理器、電子技術(shù)應(yīng)用與汽車的升級(jí)換代[A];第三屆河南省汽車工程科技學(xué)術(shù)研討會(huì)暨2006年省汽學(xué)會(huì)理事會(huì)議資料[C];2006年

3 佟國(guó)香;周亦敏;溫田學(xué);吉田修;浦野啟;鈴木英次;;基于μpd78F9222的無(wú)刷電機(jī)控制系統(tǒng)的實(shí)現(xiàn)[A];第七屆青年學(xué)術(shù)會(huì)議論文集[C];2005年

4 田倩;;SPEEDTRONIC~(TM) Mark-Ⅵ燃機(jī)控制系統(tǒng)簡(jiǎn)介[A];第七屆工業(yè)儀表與自動(dòng)化學(xué)術(shù)會(huì)議論文集[C];2006年

5 張開生;郭國(guó)法;;料倉(cāng)物位儀的研制與開發(fā)[A];2008中國(guó)儀器儀表與測(cè)控技術(shù)進(jìn)展大會(huì)論文集(Ⅰ)[C];2008年

6 楊宗正;;簡(jiǎn)易診斷技術(shù)用于設(shè)備中CPU及內(nèi)存儲(chǔ)器等電路的調(diào)試和維修[A];第十屆全國(guó)設(shè)備監(jiān)測(cè)與診斷技術(shù)學(xué)術(shù)會(huì)議論文集[C];2000年

7 凌宏江;魏必明;支合一;薛江;;智能儀器及其在型砂性能檢測(cè)中的應(yīng)用[A];2004中國(guó)鑄造活動(dòng)周論文集[C];2004年

8 吳琦;魏建中;;微處理器(CPU)的穩(wěn)態(tài)電離輻射(總劑量)試驗(yàn)[A];第十一屆全國(guó)可靠性物理學(xué)術(shù)討論會(huì)論文集[C];2005年

9 張琪;李勝勇;管強(qiáng);;基于微處理器件電路板的TPS開發(fā)研究[A];艦船電子裝備維修理論與應(yīng)用——中國(guó)造船工程學(xué)會(huì)電子修理學(xué)組第四屆年會(huì)暨信息裝備保障研討會(huì)論文集[C];2005年

10 馬敬東;;電除塵器頂部電磁振打技術(shù)應(yīng)用實(shí)踐[A];第十屆全國(guó)電除塵、第二屆脫硫?qū)W術(shù)會(huì)議論文集[C];2003年

相關(guān)重要報(bào)紙文章 前10條

1 劉霞;英美聯(lián)合研制出千核微處理器[N];科技日?qǐng)?bào);2010年

2 整理 劉洪宇;386微處理器 勇于挑戰(zhàn)巨人的大衛(wèi)[N];中國(guó)計(jì)算機(jī)報(bào);2010年

3 志強(qiáng);霍夫與微處理器[N];中國(guó)石油報(bào);2003年

4 ;安森美兩相控制器為先進(jìn)微處理器提供動(dòng)力[N];計(jì)算機(jī)世界;2002年

5 徐淼;多核處理器起源:?jiǎn)涡酒嗪诵奶幚砥鱗N];中國(guó)計(jì)算機(jī)報(bào);2007年

6 ;Sun公司再次銷售微處理器[N];計(jì)算機(jī)世界;2007年

7 記者 董映璧;俄首次研制出32位計(jì)算機(jī)微處理器[N];科技日?qǐng)?bào);2003年

8 記者 陳和利;AMD向中國(guó)轉(zhuǎn)讓核心微處理器設(shè)計(jì)技術(shù)[N];科技日?qǐng)?bào);2005年

9 見習(xí)記者 趙洪浪;國(guó)產(chǎn)最快微處理器發(fā)威:3-5年手機(jī)要用“中國(guó)芯”[N];21世紀(jì)經(jīng)濟(jì)報(bào)道;2004年

10 盧慶儒;日新月異的微處理器工藝材料與結(jié)構(gòu)設(shè)計(jì)[N];電子資訊時(shí)報(bào);2007年

相關(guān)博士學(xué)位論文 前10條

1 張福新;微處理器性能分析與優(yōu)化[D];中國(guó)科學(xué)院研究生院(計(jì)算技術(shù)研究所);2005年

2 趙天磊;微處理器Cache訪問行為分析技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2011年

3 孫秀莉;基于動(dòng)作細(xì)化的異步電路自動(dòng)綜合[D];中國(guó)科學(xué)院研究生院(成都計(jì)算機(jī)應(yīng)用研究所);2005年

4 唐遇星;面向動(dòng)態(tài)二進(jìn)制翻譯的動(dòng)態(tài)優(yōu)化和微處理器體系結(jié)構(gòu)支撐技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2005年

5 馬可;微處理器性能分析模型的建立和研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2007年

6 王蕾;異步嵌入式微處理器設(shè)計(jì)與分析關(guān)鍵技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2006年

7 劉穎;核磁共振系統(tǒng)的數(shù)字化研究[D];華東師范大學(xué);2008年

8 陳黎明;嵌入式微處理器中動(dòng)態(tài)可配置Cache結(jié)構(gòu)的研究[D];華中科技大學(xué);2009年

9 郭御風(fēng);面向多核微處理器芯片的高效能I/O體系結(jié)構(gòu)及其實(shí)現(xiàn)技術(shù)[D];國(guó)防科學(xué)技術(shù)大學(xué);2010年

10 張承義;超深亞微米微處理器漏流功耗的體系結(jié)構(gòu)級(jí)優(yōu)化技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2006年

相關(guān)碩士學(xué)位論文 前10條

1 周鵬宇;關(guān)于如何劃分微處理器檔次的研究[D];復(fù)旦大學(xué);2010年

2 沈榮蓉;微處理器芯片平臺(tái)測(cè)試系統(tǒng)的研究及優(yōu)化[D];復(fù)旦大學(xué);2010年

3 梁露瀟;基于蒙特卡羅的微處理器指令測(cè)試平臺(tái)設(shè)計(jì)與實(shí)現(xiàn)[D];北京郵電大學(xué);2011年

4 牛小鵬;DRRAD系統(tǒng)研究與實(shí)現(xiàn)[D];解放軍信息工程大學(xué);2009年

5 李常;嵌入式MIPS微處理器設(shè)計(jì)[D];清華大學(xué);2010年

6 胡婷婷;抗內(nèi)部存儲(chǔ)單元失效的32位微處理器的研究與實(shí)現(xiàn)[D];華中科技大學(xué);2011年

7 蘇博;低功耗數(shù)據(jù)觸發(fā)微處理器功能單元的設(shè)計(jì)與實(shí)現(xiàn)[D];國(guó)防科學(xué)技術(shù)大學(xué);2010年

8 宋政達(dá);雙路音頻信號(hào)系統(tǒng)人機(jī)接口及雙核通信的設(shè)計(jì)及實(shí)現(xiàn)[D];內(nèi)蒙古大學(xué);2011年

9 劉洋;基于LEON3的SoC構(gòu)建及驗(yàn)證[D];西安電子科技大學(xué);2010年

10 付建偉;基于OMAP-L138的數(shù)字示波器微處理器數(shù)字系統(tǒng)硬件設(shè)計(jì)[D];電子科技大學(xué);2011年



本文編號(hào):2658650

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/jisuanjikexuelunwen/2658650.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶9e740***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com