基于GPU的受限玻爾茲曼機并行加速
發(fā)布時間:2017-09-05 21:24
本文關(guān)鍵詞:基于GPU的受限玻爾茲曼機并行加速
更多相關(guān)文章: 受限玻爾茲曼機 GPU CUDA 加速比 并行加速
【摘要】:為針對受限玻爾茲曼機處理大數(shù)據(jù)時存在的訓(xùn)練緩慢、難以得到模型最優(yōu)的問題,提出了基于GPU的RBM模型訓(xùn)練并行加速方法。首先重新規(guī)劃了對比散度算法在GPU的實現(xiàn)步驟;其次結(jié)合以往GPU并行方案,提出采用CUBLAS執(zhí)行訓(xùn)練的矩陣乘加運算,設(shè)計周期更長、代碼更為簡潔的Tausworthe113和CLCG4的組合隨機數(shù)生成器,利用CUDA拾取紋理內(nèi)存的讀取模式實現(xiàn)了Sigmoid函數(shù)值計算;最后對訓(xùn)練時間和效果進行檢驗。通過MNIST手寫數(shù)字識別集實驗證明,相較于以往RBM并行代碼,新設(shè)計的GPU并行方案在處理大規(guī)模數(shù)據(jù)集訓(xùn)練上優(yōu)勢較為明顯,加速比達到25以上。
【作者單位】: 海軍航空工程學(xué)院;第二炮兵工程大學(xué)士官職業(yè)技術(shù)教育學(xué)院;
【關(guān)鍵詞】: 受限玻爾茲曼機 GPU CUDA 加速比 并行加速
【基金】:國家自然科學(xué)基金(61032001)
【分類號】:TP338.6
【正文快照】: 基于能量模型的受限玻爾茲曼機(Restricted BoltzmannMachine,RBM)[1]以其簡單的人工神經(jīng)網(wǎng)絡(luò)形式和快速的學(xué)習(xí)算法,越來越受到機器學(xué)習(xí)的關(guān)注,目前已經(jīng)廣泛應(yīng)用于數(shù)據(jù)降維、語音識別、3D物體識別、圖像轉(zhuǎn)換以及高維時間序列建模等機器學(xué)習(xí)問題,進而催生出機器學(xué)習(xí)一個新的領(lǐng)
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前3條
1 劉來福,唐志宇,匡錦瑜;向量玻爾茲曼機[J];北京師范大學(xué)學(xué)報(自然科學(xué)版);1996年04期
2 秦勝君;盧志平;;基于限制玻爾茲曼機的無極性標(biāo)注情感分類研究[J];科學(xué)技術(shù)與工程;2013年35期
3 ;[J];;年期
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前6條
1 王海麟;通過信息幾何方法挖掘玻爾茲曼機的不變性[D];天津大學(xué);2014年
2 李娟;基于RBM的小分子活性及選擇性研究[D];蘭州大學(xué);2015年
3 仝少敏;基于受限玻爾茲曼機的面部運動識別方法研究[D];哈爾濱工業(yè)大學(xué);2014年
4 葉睿;基于深度學(xué)習(xí)的人臉檢測方法研究[D];哈爾濱工業(yè)大學(xué);2015年
5 李平;監(jiān)督概率主題模型研究[D];安徽工業(yè)大學(xué);2014年
6 王雅思;深度學(xué)習(xí)中的自編碼器的表達能力研究[D];哈爾濱工業(yè)大學(xué);2014年
,本文編號:800176
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/800176.html
最近更新
教材專著