基于CPU-FPGA的容錯(cuò)神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練系統(tǒng)
發(fā)布時(shí)間:2025-06-10 03:19
Google、ARM和NVidia等巨頭相繼推出IoT方面的硬件和框架,深度學(xué)習(xí)加速器與IoT的應(yīng)用結(jié)合將成為世界技術(shù)革新的新助力。然而,物端系統(tǒng)的實(shí)際工作環(huán)境往往極為嚴(yán)苛,與產(chǎn)品設(shè)計(jì)預(yù)期差距巨大,原本訓(xùn)練好的模型在實(shí)際工作環(huán)境中,可能會(huì)產(chǎn)生精度降低甚至失效。因此,我們基于CPU和FPGA的硬件平臺(tái)提出一種神經(jīng)網(wǎng)絡(luò)模型再訓(xùn)練的方法,其中在FPGA上實(shí)現(xiàn)前向傳播算法,在CPU上實(shí)現(xiàn)反向傳播算法,兩者聯(lián)合起來(lái)共同完成CNN的訓(xùn)練。通過(guò)再訓(xùn)練,工作環(huán)境偏差等動(dòng)態(tài)特性能夠被CNN模型學(xué)習(xí),從而提升神經(jīng)網(wǎng)絡(luò)模型在實(shí)際工作環(huán)境中的精度。最后,我們還在近似計(jì)算和軟錯(cuò)誤的場(chǎng)景下應(yīng)用了該方法。實(shí)驗(yàn)表明,相比于離線訓(xùn)練的模型,該方法使神經(jīng)網(wǎng)絡(luò)的top5和top1精度分別平均提高5.7%和8.6%。此外,為了進(jìn)一步提高CNN加速器的性能,我們對(duì)CNN加速器應(yīng)用超頻技術(shù)。然而,超頻狀態(tài)下,CNN加速器的關(guān)鍵路徑會(huì)發(fā)生時(shí)序違規(guī),從而導(dǎo)致預(yù)測(cè)精度降低,甚至造成CNN加速器崩潰。我們通過(guò)插入額外的參考圖片來(lái)確定由于超頻導(dǎo)致的精度損失,然后將其劃分為微小精度損失、中等精度損失、嚴(yán)重精度損失和加速器崩潰四個(gè)狀態(tài)。微小的精...
【文章頁(yè)數(shù)】:63 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
本文編號(hào):4050233
【文章頁(yè)數(shù)】:63 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2.2一個(gè)典型的CNNFig2.2AtypicalCNN
11圖2.2一個(gè)典型的CNNFig2.2AtypicalCNN
本文編號(hào):4050233
本文鏈接:http://www.sikaile.net/kejilunwen/jisuanjikexuelunwen/4050233.html
上一篇:基于納米顆粒與蛋白酶的邏輯系統(tǒng)研究
下一篇:沒有了
下一篇:沒有了
最近更新
教材專著