基于GPU的受限玻爾茲曼機(jī)并行加速
本文關(guān)鍵詞:基于GPU的受限玻爾茲曼機(jī)并行加速
更多相關(guān)文章: 受限玻爾茲曼機(jī) GPU CUDA 加速比 并行加速
【摘要】:為針對(duì)受限玻爾茲曼機(jī)處理大數(shù)據(jù)時(shí)存在的訓(xùn)練緩慢、難以得到模型最優(yōu)的問題,提出了基于GPU的RBM模型訓(xùn)練并行加速方法。首先重新規(guī)劃了對(duì)比散度算法在GPU的實(shí)現(xiàn)步驟;其次結(jié)合以往GPU并行方案,提出采用CUBLAS執(zhí)行訓(xùn)練的矩陣乘加運(yùn)算,設(shè)計(jì)周期更長(zhǎng)、代碼更為簡(jiǎn)潔的Tausworthe113和CLCG4的組合隨機(jī)數(shù)生成器,利用CUDA拾取紋理內(nèi)存的讀取模式實(shí)現(xiàn)了Sigmoid函數(shù)值計(jì)算;最后對(duì)訓(xùn)練時(shí)間和效果進(jìn)行檢驗(yàn)。通過MNIST手寫數(shù)字識(shí)別集實(shí)驗(yàn)證明,相較于以往RBM并行代碼,新設(shè)計(jì)的GPU并行方案在處理大規(guī)模數(shù)據(jù)集訓(xùn)練上優(yōu)勢(shì)較為明顯,加速比達(dá)到25以上。
【作者單位】: 海軍航空工程學(xué)院;第二炮兵工程大學(xué)士官職業(yè)技術(shù)教育學(xué)院;
【關(guān)鍵詞】: 受限玻爾茲曼機(jī) GPU CUDA 加速比 并行加速
【基金】:國(guó)家自然科學(xué)基金(61032001)
【分類號(hào)】:TP338.6
【正文快照】: 基于能量模型的受限玻爾茲曼機(jī)(Restricted BoltzmannMachine,RBM)[1]以其簡(jiǎn)單的人工神經(jīng)網(wǎng)絡(luò)形式和快速的學(xué)習(xí)算法,越來越受到機(jī)器學(xué)習(xí)的關(guān)注,目前已經(jīng)廣泛應(yīng)用于數(shù)據(jù)降維、語音識(shí)別、3D物體識(shí)別、圖像轉(zhuǎn)換以及高維時(shí)間序列建模等機(jī)器學(xué)習(xí)問題,進(jìn)而催生出機(jī)器學(xué)習(xí)一個(gè)新的領(lǐng)
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前3條
1 劉來福,唐志宇,匡錦瑜;向量玻爾茲曼機(jī)[J];北京師范大學(xué)學(xué)報(bào)(自然科學(xué)版);1996年04期
2 秦勝君;盧志平;;基于限制玻爾茲曼機(jī)的無極性標(biāo)注情感分類研究[J];科學(xué)技術(shù)與工程;2013年35期
3 ;[J];;年期
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前6條
1 王海麟;通過信息幾何方法挖掘玻爾茲曼機(jī)的不變性[D];天津大學(xué);2014年
2 李娟;基于RBM的小分子活性及選擇性研究[D];蘭州大學(xué);2015年
3 仝少敏;基于受限玻爾茲曼機(jī)的面部運(yùn)動(dòng)識(shí)別方法研究[D];哈爾濱工業(yè)大學(xué);2014年
4 葉睿;基于深度學(xué)習(xí)的人臉檢測(cè)方法研究[D];哈爾濱工業(yè)大學(xué);2015年
5 李平;監(jiān)督概率主題模型研究[D];安徽工業(yè)大學(xué);2014年
6 王雅思;深度學(xué)習(xí)中的自編碼器的表達(dá)能力研究[D];哈爾濱工業(yè)大學(xué);2014年
,本文編號(hào):800176
本文鏈接:http://www.sikaile.net/kejilunwen/jisuanjikexuelunwen/800176.html