基于GPU加速的仿生智能計(jì)算方法研究
發(fā)布時(shí)間:2020-12-09 14:26
人們?cè)谌粘Ia(chǎn)生活中會(huì)遇到大量的復(fù)雜優(yōu)化問(wèn)題。這些復(fù)雜優(yōu)化問(wèn)題很難在合理的時(shí)間范圍內(nèi)采用常規(guī)方法解決。自然界中的生物行為往往趨向于對(duì)自我或種群有利的方向繁衍和進(jìn)化。隨著對(duì)仿生智能計(jì)算方法研究的不斷深入,群體智能算法作為一種重要的計(jì)算方法在最優(yōu)化領(lǐng)域得到了廣泛的應(yīng)用。由于應(yīng)用場(chǎng)景的擴(kuò)大和問(wèn)題復(fù)雜度的提高,如果群體智能算法采用大規(guī)模種群進(jìn)行尋優(yōu),將存在尋優(yōu)效率低和耗時(shí)較長(zhǎng)的問(wèn)題。近年來(lái),隨著計(jì)算機(jī)圖形硬件的快速發(fā)展,由于其高速的數(shù)據(jù)處理能力和逐漸成熟的軟件編程體系,其逐漸在通用計(jì)算領(lǐng)域得到了越來(lái)越多的應(yīng)用。針對(duì)上述問(wèn)題,可以基于GPU從異構(gòu)計(jì)算的角度研究仿生優(yōu)化算法的內(nèi)在并行特性,從而對(duì)算法進(jìn)行優(yōu)化和加速。本文通過(guò)分析不同粒度下的群體智能算法的并行設(shè)計(jì)方案,提出了一種并行群體智能優(yōu)化算法設(shè)計(jì)方法,并解決了其中涉及到的關(guān)鍵問(wèn)題。進(jìn)而設(shè)計(jì)實(shí)現(xiàn)了并行粒子群算法、并行人工蜂群算法和并行人工魚(yú)群算法。實(shí)驗(yàn)表明本文設(shè)計(jì)的并行算法能夠有效提高群體智能算法的執(zhí)行效率,證明了所提方法的有效性和高效性。圖像分割是數(shù)字圖像處理和計(jì)算機(jī)視覺(jué)領(lǐng)域的關(guān)鍵技術(shù)之一。閾值法由于其實(shí)現(xiàn)簡(jiǎn)單和性能穩(wěn)定而被廣泛應(yīng)用。多閾值分割...
【文章來(lái)源】:天津大學(xué)天津市 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:72 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
CPU和GPU的適用性對(duì)比
夢(mèng)時(shí)匭臚ü?褂胈_syncthreads()實(shí)現(xiàn)同步。常量?jī)?nèi)存通過(guò)__constant__定義,其最大容量被限制為64KB。紋理內(nèi)存是一種特殊的全局內(nèi)存,是只讀存儲(chǔ)器。全局內(nèi)存是GPU中容量最大、最常使用但卻是訪問(wèn)延遲最高的內(nèi)存空間,為設(shè)備端所有線程共享。CPUSharedMemoryRegistersRegistersLocalMemoryLocalMemoryThread(0,0)Thread(1,0)GlobalMemoryConstantMemoryTextureMemoryGPUGridBlock(0,0)SharedMemoryRegistersRegistersLocalMemoryLocalMemoryThread(0,0)Thread(1,0)Block(1,0)圖2-5CUDA內(nèi)存模型
第2章仿生智能計(jì)算方法與GPU通用計(jì)算192.3.4CUDA軟件體系CUDA軟件體系包括三個(gè)層次,從高到低依次為:CUDA庫(kù)函數(shù)、CUDA運(yùn)行時(shí)API和CUDA驅(qū)動(dòng)API。如圖2-6所示。CPUGPUApplicationsCUDALibrariesCUDARuntimeCUDADriver圖2-6CUDA軟件體系驅(qū)動(dòng)API屬于底層API,能夠提供使用GPU設(shè)備的方法。運(yùn)行時(shí)API基于驅(qū)動(dòng)API,其函數(shù)將會(huì)分解成多個(gè)基本操作由驅(qū)動(dòng)API實(shí)現(xiàn)。從CUDA3.2開(kāi)始,CUDA開(kāi)發(fā)不再局限于一種API的實(shí)現(xiàn)[61]。開(kāi)發(fā)人員可根據(jù)實(shí)際情況自由選擇這三種API。除此之外,CUDA提供了多種輔助軟件開(kāi)發(fā)工具,包括nvcc編譯器、CUDA-gdb調(diào)試器、各種函數(shù)庫(kù)等。這些開(kāi)發(fā)工具大大方便和簡(jiǎn)化了基于GPU的應(yīng)用開(kāi)發(fā)。2.4本章小結(jié)本章主要介紹了仿生智能計(jì)算方法與GPU通用計(jì)算的基本知識(shí)。首先介紹了最優(yōu)化問(wèn)題,這是仿生智能計(jì)算應(yīng)用最廣泛的領(lǐng)域之一。其次介紹了仿生智能計(jì)算方法中重要的群體智能算法,重點(diǎn)介紹了其中的粒子群算法、人工蜂群算法及人工魚(yú)群算法的原理及算法流程。最后介紹了GPU通用計(jì)算的起源及發(fā)展,對(duì)GPU的軟硬件模型及相關(guān)工具進(jìn)行了簡(jiǎn)單介紹。本章內(nèi)容為下面的工作提供了理論和技術(shù)指導(dǎo)。下一章將重點(diǎn)闡述群體智能算法在CUDA平臺(tái)上的并行化研究、設(shè)計(jì)、實(shí)現(xiàn)及驗(yàn)證和測(cè)試。
【參考文獻(xiàn)】:
期刊論文
[1]基于改進(jìn)混合蛙跳算法的圖像閾值分割算法[J]. 劉立群,火久元,王聯(lián)國(guó). 計(jì)算機(jī)應(yīng)用與軟件. 2015(05)
[2]自適應(yīng)視野和步長(zhǎng)的改進(jìn)人工魚(yú)群算法[J]. 劉彥君,江銘炎. 計(jì)算機(jī)工程與應(yīng)用. 2009(25)
[3]基于MPI的并行蟻群算法的研究與實(shí)現(xiàn)[J]. 劉東,常靜,魏文紅,趙潔. 廣東工業(yè)大學(xué)學(xué)報(bào). 2008(01)
[4]一種基于GPU加速的細(xì)粒度并行粒子群算法[J]. 李建明,萬(wàn)單領(lǐng),遲忠先,胡祥培. 哈爾濱工業(yè)大學(xué)學(xué)報(bào). 2006(12)
[5]基于粒子群優(yōu)化算法的多閾值圖像分割[J]. 韋苗苗,江銘炎. 山東大學(xué)學(xué)報(bào)(工學(xué)版). 2005(06)
[6]一種新的求解復(fù)雜函數(shù)優(yōu)化問(wèn)題的并行粒子群算法[J]. 趙勇,岳繼光,李炳宇,張傳升. 計(jì)算機(jī)工程與應(yīng)用. 2005(16)
[7]組合優(yōu)化問(wèn)題的人工魚(yú)群算法應(yīng)用[J]. 李曉磊,路飛,田國(guó)會(huì),錢積新. 山東大學(xué)學(xué)報(bào)(工學(xué)版). 2004(05)
[8]基于人工魚(yú)群算法的參數(shù)估計(jì)方法[J]. 李曉磊,薛云燦,路飛,田國(guó)會(huì). 山東大學(xué)學(xué)報(bào)(工學(xué)版). 2004(03)
[9]一種基于動(dòng)物自治體的尋優(yōu)模式:魚(yú)群算法[J]. 李曉磊,邵之江,錢積新. 系統(tǒng)工程理論與實(shí)踐. 2002(11)
[10]基于自動(dòng)分析直方圖灰度分布的數(shù)字圖像閾值化算法[J]. 高春鳴,蘭秋軍. 計(jì)算機(jī)科學(xué). 2001(04)
博士論文
[1]一種新型的智能優(yōu)化方法-人工魚(yú)群算法[D]. 李曉磊.浙江大學(xué) 2003
碩士論文
[1]多粒子群優(yōu)化算法的串行硬件結(jié)構(gòu)實(shí)現(xiàn)[D]. 王培坤.華南理工大學(xué) 2016
[2]粒子群算法的改進(jìn)及應(yīng)用[D]. 徐玉杰.南京師范大學(xué) 2013
[3]粒子群算法的硬件實(shí)現(xiàn)及性能分析[D]. 蔡瑞.江南大學(xué) 2009
[4]基于FPGA的蟻群算法硬件化技術(shù)研究[D]. 劉沙莉.哈爾濱工程大學(xué) 2009
本文編號(hào):2907013
【文章來(lái)源】:天津大學(xué)天津市 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:72 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
CPU和GPU的適用性對(duì)比
夢(mèng)時(shí)匭臚ü?褂胈_syncthreads()實(shí)現(xiàn)同步。常量?jī)?nèi)存通過(guò)__constant__定義,其最大容量被限制為64KB。紋理內(nèi)存是一種特殊的全局內(nèi)存,是只讀存儲(chǔ)器。全局內(nèi)存是GPU中容量最大、最常使用但卻是訪問(wèn)延遲最高的內(nèi)存空間,為設(shè)備端所有線程共享。CPUSharedMemoryRegistersRegistersLocalMemoryLocalMemoryThread(0,0)Thread(1,0)GlobalMemoryConstantMemoryTextureMemoryGPUGridBlock(0,0)SharedMemoryRegistersRegistersLocalMemoryLocalMemoryThread(0,0)Thread(1,0)Block(1,0)圖2-5CUDA內(nèi)存模型
第2章仿生智能計(jì)算方法與GPU通用計(jì)算192.3.4CUDA軟件體系CUDA軟件體系包括三個(gè)層次,從高到低依次為:CUDA庫(kù)函數(shù)、CUDA運(yùn)行時(shí)API和CUDA驅(qū)動(dòng)API。如圖2-6所示。CPUGPUApplicationsCUDALibrariesCUDARuntimeCUDADriver圖2-6CUDA軟件體系驅(qū)動(dòng)API屬于底層API,能夠提供使用GPU設(shè)備的方法。運(yùn)行時(shí)API基于驅(qū)動(dòng)API,其函數(shù)將會(huì)分解成多個(gè)基本操作由驅(qū)動(dòng)API實(shí)現(xiàn)。從CUDA3.2開(kāi)始,CUDA開(kāi)發(fā)不再局限于一種API的實(shí)現(xiàn)[61]。開(kāi)發(fā)人員可根據(jù)實(shí)際情況自由選擇這三種API。除此之外,CUDA提供了多種輔助軟件開(kāi)發(fā)工具,包括nvcc編譯器、CUDA-gdb調(diào)試器、各種函數(shù)庫(kù)等。這些開(kāi)發(fā)工具大大方便和簡(jiǎn)化了基于GPU的應(yīng)用開(kāi)發(fā)。2.4本章小結(jié)本章主要介紹了仿生智能計(jì)算方法與GPU通用計(jì)算的基本知識(shí)。首先介紹了最優(yōu)化問(wèn)題,這是仿生智能計(jì)算應(yīng)用最廣泛的領(lǐng)域之一。其次介紹了仿生智能計(jì)算方法中重要的群體智能算法,重點(diǎn)介紹了其中的粒子群算法、人工蜂群算法及人工魚(yú)群算法的原理及算法流程。最后介紹了GPU通用計(jì)算的起源及發(fā)展,對(duì)GPU的軟硬件模型及相關(guān)工具進(jìn)行了簡(jiǎn)單介紹。本章內(nèi)容為下面的工作提供了理論和技術(shù)指導(dǎo)。下一章將重點(diǎn)闡述群體智能算法在CUDA平臺(tái)上的并行化研究、設(shè)計(jì)、實(shí)現(xiàn)及驗(yàn)證和測(cè)試。
【參考文獻(xiàn)】:
期刊論文
[1]基于改進(jìn)混合蛙跳算法的圖像閾值分割算法[J]. 劉立群,火久元,王聯(lián)國(guó). 計(jì)算機(jī)應(yīng)用與軟件. 2015(05)
[2]自適應(yīng)視野和步長(zhǎng)的改進(jìn)人工魚(yú)群算法[J]. 劉彥君,江銘炎. 計(jì)算機(jī)工程與應(yīng)用. 2009(25)
[3]基于MPI的并行蟻群算法的研究與實(shí)現(xiàn)[J]. 劉東,常靜,魏文紅,趙潔. 廣東工業(yè)大學(xué)學(xué)報(bào). 2008(01)
[4]一種基于GPU加速的細(xì)粒度并行粒子群算法[J]. 李建明,萬(wàn)單領(lǐng),遲忠先,胡祥培. 哈爾濱工業(yè)大學(xué)學(xué)報(bào). 2006(12)
[5]基于粒子群優(yōu)化算法的多閾值圖像分割[J]. 韋苗苗,江銘炎. 山東大學(xué)學(xué)報(bào)(工學(xué)版). 2005(06)
[6]一種新的求解復(fù)雜函數(shù)優(yōu)化問(wèn)題的并行粒子群算法[J]. 趙勇,岳繼光,李炳宇,張傳升. 計(jì)算機(jī)工程與應(yīng)用. 2005(16)
[7]組合優(yōu)化問(wèn)題的人工魚(yú)群算法應(yīng)用[J]. 李曉磊,路飛,田國(guó)會(huì),錢積新. 山東大學(xué)學(xué)報(bào)(工學(xué)版). 2004(05)
[8]基于人工魚(yú)群算法的參數(shù)估計(jì)方法[J]. 李曉磊,薛云燦,路飛,田國(guó)會(huì). 山東大學(xué)學(xué)報(bào)(工學(xué)版). 2004(03)
[9]一種基于動(dòng)物自治體的尋優(yōu)模式:魚(yú)群算法[J]. 李曉磊,邵之江,錢積新. 系統(tǒng)工程理論與實(shí)踐. 2002(11)
[10]基于自動(dòng)分析直方圖灰度分布的數(shù)字圖像閾值化算法[J]. 高春鳴,蘭秋軍. 計(jì)算機(jī)科學(xué). 2001(04)
博士論文
[1]一種新型的智能優(yōu)化方法-人工魚(yú)群算法[D]. 李曉磊.浙江大學(xué) 2003
碩士論文
[1]多粒子群優(yōu)化算法的串行硬件結(jié)構(gòu)實(shí)現(xiàn)[D]. 王培坤.華南理工大學(xué) 2016
[2]粒子群算法的改進(jìn)及應(yīng)用[D]. 徐玉杰.南京師范大學(xué) 2013
[3]粒子群算法的硬件實(shí)現(xiàn)及性能分析[D]. 蔡瑞.江南大學(xué) 2009
[4]基于FPGA的蟻群算法硬件化技術(shù)研究[D]. 劉沙莉.哈爾濱工程大學(xué) 2009
本文編號(hào):2907013
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2907013.html
最近更新
教材專著