基于FPGA的卷積神經(jīng)網(wǎng)絡(luò)定點(diǎn)加速
發(fā)布時(shí)間:2023-04-06 18:14
針對(duì)卷積神經(jīng)網(wǎng)絡(luò)(CNN)在資源受限的硬件設(shè)備上運(yùn)行功耗高及運(yùn)行慢的問(wèn)題,提出一種基于現(xiàn)場(chǎng)可編程門陣列(FPGA)的CNN定點(diǎn)計(jì)算加速方法。首先提出一種定點(diǎn)化方法,并且每層卷積設(shè)計(jì)不同的尺度參數(shù),使用相對(duì)散度確定位寬的長(zhǎng)度,以減小CNN參數(shù)的存儲(chǔ)空間,而且研究不同量化區(qū)間對(duì)CNN精度的影響;其次,設(shè)計(jì)參數(shù)復(fù)用方法及流水線計(jì)算方法來(lái)加速卷積計(jì)算。為驗(yàn)證CNN定點(diǎn)化后的加速效果,采用了人臉和船舶兩個(gè)數(shù)據(jù)集進(jìn)行驗(yàn)證。結(jié)果表明,相較于傳統(tǒng)的浮點(diǎn)卷積計(jì)算,所提方法在保證CNN精度損失很小的前提下,當(dāng)權(quán)值參數(shù)和輸入特征圖參數(shù)量化到7-bit時(shí),在人臉識(shí)別CNN模型上的壓縮后的權(quán)重參數(shù)文件大小約為原來(lái)的22%,卷積計(jì)算加速比為18.69,同時(shí)使FPGA中的乘加器的利用率達(dá)94.5%。實(shí)驗(yàn)結(jié)果表明了該方法可以提高卷積計(jì)算速度,并且能夠高效利用FPGA硬件資源。
【文章頁(yè)數(shù)】:6 頁(yè)
【文章目錄】:
0 引言
1 卷積神經(jīng)網(wǎng)絡(luò)模型參數(shù)預(yù)處理
1.1 卷積神經(jīng)網(wǎng)絡(luò)
1.2 權(quán)值參數(shù)預(yù)處理
2 CNN模型參數(shù)定點(diǎn)化優(yōu)化方法
2.1 權(quán)值參數(shù)定點(diǎn)化
2.2 輸入?yún)?shù)定點(diǎn)化
3 基于FPGA的定點(diǎn)化CNN加速設(shè)計(jì)
3.1 參數(shù)量化
3.2 參數(shù)加載
3.3 輸入模塊
3.4 卷積加速
3.5 輸出模塊
4 實(shí)驗(yàn)與結(jié)果分析
4.1 實(shí)驗(yàn)設(shè)計(jì)
4.2 實(shí)驗(yàn)結(jié)果與分析
5 結(jié)語(yǔ)
本文編號(hào):3784166
【文章頁(yè)數(shù)】:6 頁(yè)
【文章目錄】:
0 引言
1 卷積神經(jīng)網(wǎng)絡(luò)模型參數(shù)預(yù)處理
1.1 卷積神經(jīng)網(wǎng)絡(luò)
1.2 權(quán)值參數(shù)預(yù)處理
2 CNN模型參數(shù)定點(diǎn)化優(yōu)化方法
2.1 權(quán)值參數(shù)定點(diǎn)化
2.2 輸入?yún)?shù)定點(diǎn)化
3 基于FPGA的定點(diǎn)化CNN加速設(shè)計(jì)
3.1 參數(shù)量化
3.2 參數(shù)加載
3.3 輸入模塊
3.4 卷積加速
3.5 輸出模塊
4 實(shí)驗(yàn)與結(jié)果分析
4.1 實(shí)驗(yàn)設(shè)計(jì)
4.2 實(shí)驗(yàn)結(jié)果與分析
5 結(jié)語(yǔ)
本文編號(hào):3784166
本文鏈接:http://www.sikaile.net/kejilunwen/dianzigongchenglunwen/3784166.html
最近更新
教材專著