基于異構(gòu)計(jì)算平臺(tái)的并行神經(jīng)網(wǎng)絡(luò)訓(xùn)練算法設(shè)計(jì)
【圖文】:
圖 2-1 通用可編程 GPU 架構(gòu)簡(jiǎn)圖GPU 與 CPU 的區(qū)別在通用計(jì)算領(lǐng)域,CPU 作為最傳統(tǒng)的計(jì)算設(shè)備,其性能提升主要依賴于理器主頻,而主頻的提升主要依賴于制作工藝的改進(jìn)。然而,制作工藝是有限的,晶體管尺寸的降低逐漸趨緩,電路集成度的增長(zhǎng)也逐漸趨于過提高處理器主頻來提升 CPU 性能遇到了前所未有的困境。因此,一 供應(yīng)商嘗試改變 CPU 架構(gòu)來獲得性能的提升,在單塊芯片內(nèi)集成更多器核心,使 CPU 朝多核的方向發(fā)展成為了主要趨勢(shì)。自 2005 年第一款PU 的問世,時(shí)至今日,增加 CPU 核心數(shù)依然是提升 CPU 性能的主題。況下,單核 CPU 只能同時(shí)處理一個(gè)線程,而增加 CPU 的核心數(shù)可以使多個(gè)線程,因此,現(xiàn)在的 CPU 同樣可以做并行計(jì)算。雖然 CPU 架構(gòu)的優(yōu)化使其可以支持多線程并行處理,但它與 GPU 在并
13圖 2-2 OpenCL 內(nèi)存模型示意圖2.5.3 OpenCL 編程過程為了將上述框架有效整合在一起以實(shí)現(xiàn)我們想要的功能,需要一系列繁雜的操作,這個(gè)過程稱為 OpenCL 的編程過程。使用 OpenCL 編程過程如下:(1) 發(fā)現(xiàn)并初始化平臺(tái);(2) 發(fā)現(xiàn)并初始化計(jì)算設(shè)備;(3) 創(chuàng)建上下文;(4) 創(chuàng)建命令隊(duì)列;(5) 創(chuàng)建內(nèi)存對(duì)象;(6) 將數(shù)據(jù)由主機(jī)端傳入設(shè)備端;(7) 創(chuàng)建并編譯程序?qū)ο螅?
【學(xué)位授予單位】:天津大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2018
【分類號(hào)】:TP183
【參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 陳貴云;張江;;基于擬牛頓算法神經(jīng)網(wǎng)絡(luò)的入侵檢測(cè)系統(tǒng)的研究[J];計(jì)算機(jī)安全;2014年01期
2 劉道華;張禮濤;曾召霞;孫文蕭;;基于正交最小二乘法的徑向基神經(jīng)網(wǎng)絡(luò)模型[J];信陽(yáng)師范學(xué)院學(xué)報(bào)(自然科學(xué)版);2013年03期
3 王海峰;陳慶奎;;圖形處理器通用計(jì)算關(guān)鍵技術(shù)研究綜述[J];計(jì)算機(jī)學(xué)報(bào);2013年04期
4 魏明生;童敏明;訾斌;唐守鋒;;基于粒子群-擬牛頓混合算法的管道機(jī)器人定位[J];儀器儀表學(xué)報(bào);2012年11期
5 林琳;黃南天;高興泉;;基于DFP校正擬牛頓法的傅里葉神經(jīng)網(wǎng)絡(luò)[J];計(jì)算機(jī)工程;2012年10期
6 陳瑩瑩;;Quasi-Newton Method相關(guān)綜述[J];黑龍江科技信息;2012年10期
7 李熙銘;歐陽(yáng)丹彤;白洪濤;;基于GPU的混合精度平方根共軛梯度算法[J];儀器儀表學(xué)報(bào);2012年01期
8 耿紅梅;;BFGS算法綜述[J];大眾科技;2011年11期
9 盧風(fēng)順;宋君強(qiáng);銀福康;張理論;;CPU/GPU協(xié)同并行計(jì)算研究綜述[J];計(jì)算機(jī)科學(xué);2011年03期
10 夏俊峰;楊帆;李靜;鄭秀玉;;基于GPU的電力系統(tǒng)并行潮流計(jì)算的實(shí)現(xiàn)[J];電力系統(tǒng)保護(hù)與控制;2010年18期
,本文編號(hào):2591287
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/2591287.html