一種基于第二代賽道存儲的面向卷積神經網絡的高效內存計算框架
發(fā)布時間:2020-08-10 17:45
【摘要】:內存計算作為一種新興的技術,支持數(shù)據(jù)在存儲單元內就地處理,減少了數(shù)據(jù)的移動并增加了數(shù)據(jù)的并行處理,在一定程度上彌補了馮·諾伊曼架構的缺陷。和傳統(tǒng)易失隨機存儲介質相比,賽道型內存(Racetrack Memory)具有密度大、非易失且靜態(tài)功耗低等特點,支持高效的內存計算。為解決卷積神經網絡運行過程中性能與功耗問題,本文創(chuàng)新性地提出了基于斯格明子(Skyrmion)介質的第二代賽道型內存計算框架。該框架采用斯格明子賽道內存(Skyrmion-based Racetrack Memory)作為存儲單元,采用基于斯格明子邏輯門構成的加法/乘法器組成計算單元,無須大量CMOS電路輔助,設計復雜度大大降低。同時本文通過在器件層優(yōu)化存儲單元讀寫端口數(shù)目與在系統(tǒng)層改進內存地址映射方式等方式,大幅提高了該框架的運行效率。針對卷積神經網絡不同層次功能如何在基于第二代賽道存儲的內存計算框架中實現(xiàn)的問題,本文進一步提出了特定的優(yōu)化實現(xiàn)方法。此方法能夠有效的支持卷積神經網絡在新型內存計算框架下的運行,同時充分利用第二代賽道型存儲介質的性能優(yōu)勢。本文主要貢獻如下:1.第二代賽道型內存計算單元設計與優(yōu)化第二代賽道型存儲介質不僅僅具有存儲功能,還天然地適用于實現(xiàn)計算功能。本文充分利用此特性設計了基于斯格明子介質的內存加法器和乘法器,以便在內存中完成特定的計算操作。此種加法器和乘法器構成的內存計算單元,無需大量CMOS電路輔助,在大大降低了系統(tǒng)實現(xiàn)復雜度的同時也降低了系統(tǒng)功耗。2.第二代賽道型內存存儲單元設計與優(yōu)化第二代賽道型存儲介質,作為一種新型非易失性存儲,與傳統(tǒng)的隨機存取存儲器(Random Access Memory,RAM)從物理結構上來說有著本質區(qū)別:除了傳統(tǒng)的讀和寫的操作外,還有位移的操作,因此無法將其直接替換現(xiàn)有的隨機存取存介質。針對這些問題,本文重新設計優(yōu)化了基于斯格明子賽道型存儲的非易失性存儲單元,同時提出一種專門用于這種新型存儲結構的內存地址映射方式,從而極大地減少了存儲系統(tǒng)讀取數(shù)據(jù)過程中的總移位操作,最終提高了整個內存計算框架的運行效率。3.基于新型內存計算框架的卷積神經網絡本文設計并實現(xiàn)了一種方法,使得通用的卷積神經網絡能夠在第二代賽道型內存計算框架中高效、正確的執(zhí)行。該方法通過將卷積神經網絡按功能分層,并對不同層次的功能分別進行處理。對于大部分較為簡單的運算,如矩陣點乘、求平均值等,分解為加法和乘法直接在內存計算框架的計算單元中執(zhí)行;對于其它的無法分解的復雜運算,如求導等,本文提出兩種實現(xiàn)方式:一種是將數(shù)據(jù)傳輸至通用處理器(CPU)中進行處理,還有一種是使用查找表獲得一個近似值。最終實驗結果表明,對于相同的卷積神經網絡,相比目前最先進的基于磁疇壁的非易失性內存計算框架,本文提出的框架最多可以在運行時間上節(jié)省52.1%,同時在能耗上節(jié)省了40%。
【學位授予單位】:華東師范大學
【學位級別】:碩士
【學位授予年份】:2018
【分類號】:TP333;TP183
本文編號:2788420
【學位授予單位】:華東師范大學
【學位級別】:碩士
【學位授予年份】:2018
【分類號】:TP333;TP183
【參考文獻】
相關期刊論文 前1條
1 沈志榮;薛巍;舒繼武;;新型非易失存儲研究[J];計算機研究與發(fā)展;2014年02期
本文編號:2788420
本文鏈接:http://www.sikaile.net/kejilunwen/jisuanjikexuelunwen/2788420.html
最近更新
教材專著