天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 計算機論文 >

多核CPU/眾核GPU加速的并行優(yōu)化算法研究

發(fā)布時間:2022-02-20 22:39
  由于受到半導(dǎo)體工藝、功耗、指令級并行等各種因素的限制,中央處理器體系結(jié)構(gòu)朝著并行方向發(fā)展,比如多核架構(gòu)。與此同時,圖形處理器也從專用的圖像渲染設(shè)備進化成通用并行計算設(shè)備,并被重新定義為眾核架構(gòu)。并行硬件架構(gòu)的高速發(fā)展,使處理器的理論峰值性能極大提升,這為大規(guī)?茖W和工程計算提供了非常好的機遇。然而由于處理器體系結(jié)構(gòu)的多樣性,和并行編程的復(fù)雜性,傳統(tǒng)的算法如何并行化以高效發(fā)揮硬件能力,成為一個嚴峻的挑戰(zhàn)。隨著高級并行編程模型(如OpenCL, CUDA和Direct Compute)的相繼推出,并行程序設(shè)計的難度在一定程度上有所降低,簡單的移植串行算法到并行平臺執(zhí)行已經(jīng)不再是難題。但由于并行處理器結(jié)構(gòu)的不同、算法計算特點和編譯器優(yōu)化差異的影響,如何針對特定并行架構(gòu)設(shè)計優(yōu)化的并行算法仍然是學術(shù)界研究的熱點。為了解決并行算法針對特定并行架構(gòu)優(yōu)化的問題,本文立足于基于多核CPU和眾核GPU體系結(jié)構(gòu),著重針對并行優(yōu)化算法做了深入的研究。本文采用理論與實驗研究相結(jié)合的方法,一方面分析了多核CPU和眾核GPU的不同體系結(jié)構(gòu),探討實現(xiàn)多核CPU和眾核GPU的并行計算方法;另一方面結(jié)合經(jīng)典并行算法,研究... 

【文章來源】:武漢大學湖北省211工程院校985工程院校教育部直屬院校

【文章頁數(shù)】:127 頁

【學位級別】:博士

【文章目錄】:
本文創(chuàng)新點
摘要
ABSTRACT
1 緒論
    1.1 引言
    1.2 研究背景
        1.2.1 CPU/GPU架構(gòu)改進
        1.2.2 應(yīng)用需求
        1.2.3 國內(nèi)外研究現(xiàn)狀
        1.2.4 面臨的挑戰(zhàn)
    1.3 本文的主要研究工作及創(chuàng)新點
    1.4 論文結(jié)構(gòu)
2 并行處理器架構(gòu)及并行優(yōu)化算法
    2.1 引言
    2.2 多核CPU和眾核GPU并行計算
        2.2.1 并行計算
        2.2.2 多核CPU體系結(jié)構(gòu)
        2.2.3 眾核GPU體系架構(gòu)
        2.2.4 OpenCL并行編程模型
        2.2.5 并行算法加速比
    2.3 計算復(fù)雜性理論
        2.3.1 最優(yōu)化問題
        2.3.2 算法復(fù)雜性
        2.3.3 問題復(fù)雜性
    2.4 并行元啟發(fā)式算法
        2.4.1 啟發(fā)式算法
        2.4.2 元啟發(fā)式算法
        2.4.3 元啟發(fā)式算法并行模型
    2.5 本章小結(jié)
3 基于動態(tài)策略的GPU并行蟻群算法
    3.1 引言
    3.2 蟻群算法介紹
    3.3 基于動態(tài)策略的GPU并行蟻群算法
        3.3.1 內(nèi)核控制方法
        3.3.2 并行優(yōu)化策略
        3.3.3 輪盤賭選擇方法優(yōu)化
        3.3.4 路徑創(chuàng)建階段算法
        3.3.5 算法描述
        3.3.6 算法在GPU上的實現(xiàn)
        3.3.7 時間復(fù)雜度分析
    3.4 實驗結(jié)果與分析
        3.4.1 實驗設(shè)置
        3.4.2 優(yōu)化初始工作組配置
        3.4.3 KE-ALL和KE-ONE內(nèi)核性能比較
        3.4.4 動態(tài)工作組內(nèi)核性能評價
        3.4.5 與現(xiàn)有的GPU蟻群算法比較
        3.4.6 解質(zhì)量評價
    3.5 本章小結(jié)
4 基于多核SIMD CPU的蟻群算法
    4.1 引言
    4.2 相關(guān)工作
        4.2.1 多核SIMD CPU
        4.2.2 當前GPU蟻群的不足
    4.3 基于多核SIMD CPU的并行蟻群算法
        4.3.1 現(xiàn)有的并行蟻群模型
        4.3.2 基于多核SIMD CPU的并行蟻群算法
        4.3.3 路徑創(chuàng)建階段
        4.3.4 信息素更新階段
    4.4 性能評價
        4.4.1 基于多核SIMD CPU的路徑創(chuàng)建算法評價
        4.4.2 信息素更新內(nèi)核評價
        4.4.3 計算單元數(shù)量與內(nèi)存帶寬對性能的影響分析
        4.4.4 算法在GPU上執(zhí)行性能對比
        4.4.5 與現(xiàn)有的高性能GPU蟻群算法對比
        4.4.6 解質(zhì)量驗證
    4.5 小結(jié)
5 基于GPU的迭代局部搜索算法并行優(yōu)化
    5.1 引言
    5.2 相關(guān)工作
        5.2.1 Roofline性能模型
        5.2.2 迭代局部搜索算法
        5.2.3 研究的意義
    5.3 基于GPU的并行迭代局部搜索算法
        5.3.1 并行迭代局部搜索算法設(shè)計
        5.3.2 GPU上鄰域結(jié)構(gòu)映射策略
        5.3.3 2-opt算子內(nèi)核的性能分析
        5.3.4 目前的優(yōu)化方法分析
        5.3.5 2-opt內(nèi)核優(yōu)化方法
    5.4 性能評價
        5.4.1 線程配置優(yōu)化
        5.4.2 2-opt內(nèi)核的實際浮點性能分析
        5.4.3 2-opt內(nèi)核加速比對比
        5.4.4 解質(zhì)量分析
        5.4.5 與現(xiàn)有的高性能GPU局部搜索算法比較
    5.5 本章小結(jié)
6 基于CPU-GPU協(xié)同并行圖像卷積算法
    6.1 引言
    6.2 相關(guān)工作
        6.2.1 基于卷積的濾波器
        6.2.2 CPU向量指令
        6.2.3 CPU-GPU異構(gòu)架構(gòu)及其融合
        6.2.4 OpenCL異構(gòu)系統(tǒng)協(xié)同機制
    6.3 CPU-GPU協(xié)同卷積算法
        6.3.1 圖像分塊化處理
        6.3.2 基本CPU-GPU協(xié)同計算卷積方法
        6.3.3 動態(tài)任務(wù)分配
        6.3.4 與現(xiàn)有算法的區(qū)別和優(yōu)勢
    6.4 實驗結(jié)果與分析
        6.4.1 基于STA的算法性能評價
        6.4.2 基于DTA的算法性能評價
        6.4.3 與基于OpenCV的GPU卷積算法比較
    6.5 本章小結(jié)
7 總結(jié)與展望
    7.1 本文工作總結(jié)
    7.2 研究展望
中外文參考文獻
攻博期間發(fā)表的科研成果目錄
致謝


【參考文獻】:
期刊論文
[1]基于CUDA的圖像預(yù)處理并行化研究[J]. 占正鋒,李戈,張學賀,尹旭悅.  機械與電子. 2014(07)
[2]基于GPU的現(xiàn)代并行優(yōu)化算法[J]. 張慶科,楊波,王琳,朱福祥.  計算機科學. 2012(04)
[3]基于OpenCL的圖像模糊化算法優(yōu)化研究[J]. 張櫻,張云泉,龍國平.  計算機科學. 2012(03)
[4]基于OpenMP多核架構(gòu)下并行蟻群算法研究[J]. 趙輝,徐俊剛.  微型機與應(yīng)用. 2011(16)
[5]一種基于GPU加速的細粒度并行蟻群算法[J]. 李建明,胡祥培,龐占龍,錢昆明.  控制與決策. 2009(08)

碩士論文
[1]基于CUDA的圖像濾波技術(shù)研究[D]. 趙馨怡.西北師范大學 2014
[2]基于GPU的并行連續(xù)蟻群算法及其應(yīng)用研究[D]. 王晨.南開大學 2014
[3]表面缺陷檢測GPU并行圖像處理技術(shù)[D]. 王成順.合肥工業(yè)大學 2012



本文編號:3635950

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/3635950.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶4d57e***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
日本 一区二区 在线| 国产传媒欧美日韩成人精品| 久久99夜色精品噜噜亚洲av | 在线视频三区日本精品| 国产午夜在线精品视频| 亚洲中文字幕剧情在线播放| 国产专区亚洲专区久久| 日韩不卡一区二区视频| 五月天丁香婷婷狠狠爱| 五月天婷亚洲天婷综合网| 国产一级二级三级观看| 国产又粗又猛又黄又爽视频免费| 粗暴蹂躏中文一区二区三区| 九九热精品视频免费在线播放| 亚洲国产精品久久琪琪| 亚洲天堂精品在线视频| 大香伊蕉欧美一区二区三区| 日韩精品区欧美在线一区 | 国产免费一区二区不卡| 91亚洲精品综合久久| 男生和女生哪个更好色| 在线亚洲成人中文字幕高清 | 太香蕉久久国产精品视频| 少妇肥臀一区二区三区| 日本二区三区在线播放| 日韩欧美第一页在线观看| 亚洲一区二区三区四区| 五月婷婷亚洲综合一区| 欧美一级不卡视频在线观看| 亚洲国产一级片在线观看| 欧美日韩有码一二三区| 草草草草在线观看视频| 男女午夜福利院在线观看| 精品人妻一区二区三区四在线| 国产成人精品一区二区三区| 久久夜色精品国产高清不卡| 在线播放欧美精品一区| 成人精品网一区二区三区| 日本久久精品在线观看| 国产肥妇一区二区熟女精品| 亚洲国产性生活高潮免费视频 |