天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 計算機論文 >

EDGE處理器中分布式存儲結構研究

發(fā)布時間:2018-02-28 10:27

  本文關鍵詞: EDGE處理器 分布式 存儲指令隊列 出處:《哈爾濱工業(yè)大學》2013年碩士論文 論文類型:學位論文


【摘要】:廣泛存在的傳統(tǒng)集總式結構已經嚴重限制亂序超標量處理器的性能提升。特別是針對EDGE(Explicit Data Graph Execution)體系結構的微處理器,盡管取指單元、執(zhí)行單元、寄存器單元都采用了分布式結構,但是,存儲指令單元——Load-Store-Queue,仍然是一種集總式的設計結構。這種集總式結構擁有很差的可擴展性特點,限制了相關性檢查的處理效率,阻礙了處理器性能的提高。 本文主要通過運用M5-EDGE模擬器,針對集總式Load-Store-Queue的特征進行實現(xiàn)并加以研究分析,評估集總式Load-Store-Queue所面臨的諸多問題和缺陷。評估得出,集總式Load-Store-Queue處理效率很低,一次檢索項數較多,延時和功耗也相應較高,,并且,可擴展性差,不能一味地與指令窗口數保持對等的項數增加。同時,研究現(xiàn)代應用程序的存儲指令相關性特點,發(fā)現(xiàn)加速相關指令的執(zhí)行效率將大大提高處理器性能。 在M5-EDGE模擬器上設計實現(xiàn)分布式Load-Store-Queue結構。使得每個執(zhí)行單元都包含一個獨立的Load-Store-Queue單元。針對甚塊動態(tài)Deep映射算法,每個甚塊獨立進行甚塊內相關性檢查操作,并在流水線遞交級進行甚塊間的相關性檢查.將遞交延時和相關性檢查延時重疊以減少總延時,并且設計重取指機制以處理甚塊間違例的恢復工作。 進行分布式Load-Store-Queue性能評估。相對于集總式結構設計,分布式結構面積并無明顯增加,同時,增加相關性檢查帶寬和減少檢查延時,平均效率提高64至256倍,而且也相應的降低了相關性檢查的功耗。在綜合評估之后,分布式Load-Store-Queue的優(yōu)勢是顯而易見的,徹底摒棄了集總式Load-Store-Queue結構的缺點。雖然運行測試程序后發(fā)現(xiàn)性能有所降低,這主要是由于重取指的機制帶來的性能損害,可以通過其他機制進行優(yōu)化,而且可優(yōu)化的策略很多,在充分選擇優(yōu)化策略之后,會對EDGE體系結構微處理器性能產生很好的影響。
[Abstract]:The widespread traditional lumped architecture has severely limited the performance improvement of scrambled superscalar processors. The register unit is distributed, but the memory instruction unit, Load-Store-Queue, is still a lumped structure, which has poor extensibility and limits the processing efficiency of correlation checking. It hinders the improvement of processor performance. In this paper, we use M5-edge simulator to realize and analyze the characteristics of lumped Load-Store-Queue, and evaluate the problems and defects faced by lumped Load-Store-Queue. It is concluded that lumped Load-Store-Queue is very inefficient. The number of items in a single retrieval is more, the delay and power consumption are also higher, and the expansibility is poor, so the number of items can not be kept equal to the number of instruction windows blindly. At the same time, the characteristics of memory instruction correlation of modern application programs are studied. It is found that accelerating the execution efficiency of related instructions will greatly improve processor performance. The distributed Load-Store-Queue structure is designed and implemented on the M5-edge simulator, which makes each execution unit contain an independent Load-Store-Queue unit. For the very block dynamic Deep mapping algorithm, each very block independently performs the very block correlation checking operation. In order to reduce the total delay, we also design a refetch mechanism to deal with the recovery work between the very block violations. To evaluate the performance of distributed Load-Store-Queue. Compared with lumped structure design, the area of distributed structure does not increase significantly. At the same time, it increases the bandwidth of correlation check and reduces the check delay, and the average efficiency is increased 64 to 256 times. After comprehensive evaluation, the advantages of distributed Load-Store-Queue are obvious, and the shortcomings of lumped Load-Store-Queue structure are completely abandoned. This is mainly due to the performance damage caused by the mechanism of reindication, which can be optimized by other mechanisms, and there are many strategies that can be optimized. After the optimization strategy is fully selected, it will have a good impact on the performance of the EDGE architecture microprocessor.
【學位授予單位】:哈爾濱工業(yè)大學
【學位級別】:碩士
【學位授予年份】:2013
【分類號】:TP333

【相似文獻】

相關期刊論文 前10條

1 王;PowerEdge2300配置靈活,功能強大[J];中國計算機用戶;1998年19期

2 Jose Fridman,Zoran Zvonar;Blackfin處理器使EDGE設計更具彈性[J];世界電子元器件;2004年11期

3 ;戴爾推出全新四路PowerEdge服務器及管理軟件[J];CAD/CAM與制造業(yè)信息化;2005年05期

4 ;新聞[J];電子設計應用;2005年05期

5 ;TTPCom與英特爾的合作關系進一步擴展至EDGE和3G[J];電子技術應用;2004年04期

6 ;西門子選擇ADI和TTPCom開發(fā)新一代EDGE[J];通信世界;2004年23期

7 付琦;泰克為EDGE提供基站測試功能[J];郵電設計技術;2004年08期

8 葉菊青;上海貝爾阿爾卡特助您輕松晉級EDGE[J];移動通信;2004年09期

9 李志剛;Solid Edge軟件學習之我見[J];CAD/CAM與制造業(yè)信息化;2005年04期

10 ;Dell新服務器PowerEdge 4200[J];中國青年科技;1997年07期

相關會議論文 前10條

1 Michael A.Foley;;Creating Powerful Systematic Methods,Tools and Datasets for Understanding Human Biology and Disease and Applying Them to Leading-Edge Medical Challenges[A];2011年全國藥物化學學術會議——藥物的源頭創(chuàng)新論文摘要集[C];2011年

2 范靈俊;安述倩;李楊;張浩;王達;范東睿;;眾核處理器高效片上訪存機制研究[A];第十五屆計算機工程與工藝年會暨第一屆微處理器技術論壇論文集(A輯)[C];2011年

3 遲瑛;;基于GSM的第三代移動通信過渡技術——EDGE[A];第十八屆中國(天津)’2004IT、網絡、信息技術、電子、儀器儀表創(chuàng)新學術會議論文集[C];2004年

4 萬志濤;;基于多核處理器的面向時延敏感服務的云基礎架構[A];中國通信學會信息通信網絡技術委員會2011年年會論文集(上冊)[C];2011年

5 ;Edge Preserving Smoothing for Oblique Images[A];中國科學院地質與地球物理研究所二○○三學術論文匯編·第三卷(地球環(huán)境·工程地質與災害)[C];2003年

6 萬志濤;;MIPS指令集多核處理器信令處理能力評估[A];中國通信學會信息通信網絡技術委員會2011年年會論文集(上冊)[C];2011年

7 扈小燕;劉培洵;陳順云;劉力強;馬瑾;馬勝利;;多核處理器環(huán)境下遙感數據處理的并行與串行算法的性能比較[A];中國地震學會第14次學術大會專題[C];2012年

8 劉杰;馬彥;葉維;高劍剛;;多核處理器存儲體系分析[A];第十五屆計算機工程與工藝年會暨第一屆微處理器技術論壇論文集(A輯)[C];2011年

9 陳遠知;楊帆;;Tilera多核處理器網絡應用研究[A];全國第五屆信號和智能信息處理與應用學術會議?(第一冊)[C];2011年

10 季q

本文編號:1546912


資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/jisuanjikexuelunwen/1546912.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶64b6a***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com