天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 計(jì)算機(jī)論文 >

高性能低能耗GPGPU計(jì)算技術(shù)研究

發(fā)布時(shí)間:2024-02-18 01:01
  高性能計(jì)算是科學(xué)和工程領(lǐng)域的關(guān)鍵基礎(chǔ)技術(shù),致力于研究和開發(fā)高性能計(jì)算機(jī)相關(guān)的硬件體系結(jié)構(gòu)及軟件技術(shù)。高性能計(jì)算的技術(shù)被廣泛應(yīng)用于各個(gè)領(lǐng)域如云計(jì)算、大數(shù)據(jù)處理及物聯(lián)網(wǎng)等以提高實(shí)驗(yàn)規(guī)模和效率,推動(dòng)各個(gè)領(lǐng)域取得突破性進(jìn)展。世界超級計(jì)算機(jī)五百強(qiáng)等排名是各國高性能計(jì)算研究實(shí)力乃至于綜合國力的體現(xiàn)。高性能計(jì)算機(jī)系統(tǒng)可根據(jù)硬件分為同構(gòu)系統(tǒng)和異構(gòu)系統(tǒng),由CPU和GPU(Graphics Processing Unit)等不同種類處理器構(gòu)成的系統(tǒng)為異構(gòu)系統(tǒng),在性能和能效方面具備優(yōu)勢。基于CPU和GPU異構(gòu)架構(gòu)的高性能計(jì)算技術(shù)稱為GPU高性能計(jì)算,是當(dāng)前的一個(gè)熱門研究領(lǐng)域。本文以提高GPU高性能計(jì)算的能效和性能,拓展其應(yīng)用為目標(biāo),從體系結(jié)構(gòu)研究、系統(tǒng)軟件研究和應(yīng)用研究這三個(gè)層次上提出一些軟硬件新技術(shù)。本文的第一部分工作提出高能效的新GPU處理器架構(gòu)。近年來,GPU以其高并行度、高能效和高訪存帶寬的優(yōu)勢,被廣泛部署在超級計(jì)算機(jī)、數(shù)據(jù)中心及科研平臺上用于加速各種科學(xué)計(jì)算。大型計(jì)算機(jī)系統(tǒng)的高能耗一直是研究者們努力解決的問題。GPU處理器中負(fù)責(zé)處理指令的前端部件是處理器中較為耗能的部件之一。我們提出將GPU內(nèi)的多...

【文章頁數(shù)】:124 頁

【學(xué)位級別】:博士

【文章目錄】:
摘要
ABSTRACT
縮略語
第一章 緒論
    1.1 GPU高性能計(jì)算簡介
        1.1.1 GPU高性能計(jì)算研究分類
    1.2 GPU高性能計(jì)算軟硬件平臺介紹
        1.2.1 GPU硬件體系結(jié)構(gòu)
        1.2.2 GPU編程模型及軟件開發(fā)平臺
    1.3 研究內(nèi)容和創(chuàng)新點(diǎn)
    1.4 國內(nèi)外研究現(xiàn)狀
        1.4.1 高能效GPU新架構(gòu)研究
        1.4.2 GPU上的不規(guī)則應(yīng)用及負(fù)載均衡研究
        1.4.3 GPU上的圖算法及圖處理系統(tǒng)研究
    1.5 論文的組織和結(jié)構(gòu)
第二章 高能效GPU處理器架構(gòu)Buddy SM
    2.1 研究背景及簡介
    2.2 GPU前端介紹
        2.2.1 前端的構(gòu)成
        2.2.2 指令發(fā)射機(jī)制
    2.3 Buddy SM架構(gòu)
        2.3.1 架構(gòu)總覽
        2.3.2 指令發(fā)射
        2.3.3 統(tǒng)一線程塊分配
        2.3.4 建立共享
        2.3.5 解除共享
        2.3.6 重建共享
        2.3.7 共享群的通信
        2.3.8 自適應(yīng)共享群
    2.4 實(shí)驗(yàn)方法
        2.4.1 模擬器配置
        2.4.2 功率和面積的開銷
        2.4.3 測試集
    2.5 實(shí)驗(yàn)結(jié)果和分析
        2.5.1 共享時(shí)間百分比
        2.5.2 重建共享策略的比較
        2.5.3 自適應(yīng)共享群方法的性能評估
        2.5.4 Buddy SM的影響
        2.5.5 性能比較
        2.5.6 前端的節(jié)能
        2.5.7 整個(gè)GPU的節(jié)能
    2.6 本章小結(jié)
第三章 高性能GPU系統(tǒng)軟件CUIRRE
    3.1 研究背景及簡介
    3.2 不規(guī)則循環(huán)和線程級負(fù)載不均衡
        3.2.1 不規(guī)則應(yīng)用的特征化
        3.2.2 GPU資源利用率
    3.3 線程級負(fù)載均衡的任務(wù)池方法
        3.3.1 任務(wù)池方法簡介
        3.3.2 任務(wù)池方法的GPU實(shí)現(xiàn)
        3.3.3 自適應(yīng)負(fù)載因子方法
    3.4 CUIRRE庫
        3.4.1 負(fù)載均衡模塊
        3.4.2 診斷模塊
        3.4.3 特征化模塊
        3.4.4 CUIRRE庫的應(yīng)用
    3.5 應(yīng)用集
        3.5.1 測試應(yīng)用
        3.5.2 真實(shí)應(yīng)用
    3.6 實(shí)驗(yàn)方法
        3.6.1 硬軟件配置
        3.6.2 其它負(fù)載均衡方法
        3.6.3 測試過程
        3.6.4 性能指標(biāo)
        3.6.5 開銷測量
    3.7 實(shí)驗(yàn)結(jié)果及分析
        3.7.1 應(yīng)用的特征化
        3.7.2 負(fù)載均衡方法性能比較
        3.7.3 自適應(yīng)負(fù)載因子方法的性能評估
    3.8 本章小結(jié)
第四章 高性能GPU應(yīng)用GGraph
    4.1 研究背景及簡介
    4.2 CPU和GPU異構(gòu)系統(tǒng)上的圖處理
        4.2.1 圖算法
        4.2.2 圖的表示
        4.2.3 計(jì)算模型
        4.2.4 磁盤的I/O特性
    4.3 GGraph平臺的架構(gòu)
        4.3.1 圖數(shù)據(jù)的存儲
        4.3.2 讀寫模塊
        4.3.3 分圖模塊
        4.3.4 消息管理模塊
        4.3.5 內(nèi)存管理模塊
    4.4 實(shí)驗(yàn)方法
        4.4.1 圖算法
        4.4.2 軟件和實(shí)驗(yàn)配置
        4.4.3 硬件平臺
        4.4.4 測試圖數(shù)據(jù)集
        4.4.5 性能指標(biāo)
    4.5 實(shí)驗(yàn)結(jié)果及分析
        4.5.1 自適應(yīng)負(fù)載均衡方法的評測
        4.5.2 可擴(kuò)展性評測
        4.5.3 所有平臺的性能比較
        4.5.4 運(yùn)行不同算法的性能比較
        4.5.5 所有平臺的能效比較
    4.6 本章小結(jié)
第五章 總結(jié)與展望
    5.1 本文工作總結(jié)
    5.2 后續(xù)研究方向
參考文獻(xiàn)
致謝
攻讀博士期間發(fā)表、錄用和完成的學(xué)術(shù)論文目錄



本文編號:3901621

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/jisuanjikexuelunwen/3901621.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶b1418***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com