天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 計算機(jī)論文 >

異構(gòu)混合并行計算綜述

發(fā)布時間:2021-06-21 19:37
  隨著人工智能和大數(shù)據(jù)等計算機(jī)應(yīng)用對算力需求的迅猛增長以及應(yīng)用場景的多樣化,異構(gòu)混合并行計算成為了研究的重點(diǎn)。文中介紹了當(dāng)前主要的異構(gòu)計算機(jī)體系結(jié)構(gòu),包括CPU/協(xié)處理器、CPU/眾核處理器、CPU/ASCI和CPU/FPGA等;簡述了異構(gòu)混合并行編程模型隨著各類異構(gòu)混合結(jié)構(gòu)的發(fā)展而做出的改變,異構(gòu)混合并行編程模型可以是對現(xiàn)有的一種語言進(jìn)行改造和重新實(shí)現(xiàn),或者是現(xiàn)有異構(gòu)編程語言的擴(kuò)展,或者是使用指導(dǎo)性語句異構(gòu)編程,或者是容器模式協(xié)同編程。分析表明,異構(gòu)混合并行計算架構(gòu)會進(jìn)一步加強(qiáng)對AI的支持,同時也會增強(qiáng)軟件的通用性。文中還回顧了異構(gòu)混合并行計算中的關(guān)鍵技術(shù),包括異構(gòu)處理器之間的并行任務(wù)劃分、任務(wù)映射、數(shù)據(jù)通信、數(shù)據(jù)訪問,以及異構(gòu)協(xié)同的并行同步和異構(gòu)資源的流水線并行等。根據(jù)這些關(guān)鍵技術(shù),文中指出了異構(gòu)混合并行計算面臨的挑戰(zhàn),如編程困難、移植困難、數(shù)據(jù)通信開銷大、數(shù)據(jù)訪問復(fù)雜、并行控制復(fù)雜以及資源負(fù)載不均衡等。最后分析了異構(gòu)混合并行計算面臨的挑戰(zhàn),指出目前關(guān)鍵的核心技術(shù)需要從通用與AI專用異構(gòu)計算的融合、異構(gòu)架構(gòu)的無縫移植、統(tǒng)一編程模型、存算一體化、智能化任務(wù)劃分和分配等方面進(jìn)行突破。 

【文章來源】:計算機(jī)科學(xué). 2020,47(08)北大核心CSCD

【文章頁數(shù)】:13 頁

【部分圖文】:

異構(gòu)混合并行計算綜述


協(xié)處理器架構(gòu)

架構(gòu)圖,處理器,架構(gòu)


ARM微處理器可支持多達(dá)16個協(xié)處理器,這些協(xié)處理器可用于各種協(xié)處理操作,在程序執(zhí)行過程中,每個協(xié)處理器只執(zhí)行針對自身的協(xié)處理指令。ARM的協(xié)處理器指令主要用于ARM處理器初始化、ARM的協(xié)處理器的數(shù)據(jù)處理操作,以及在ARM的處理器的寄存器和ARM協(xié)處理器的寄存器之間傳送數(shù)據(jù),在ARM協(xié)處理器的寄存器和存儲器之間傳送數(shù)據(jù)。ARM的協(xié)處理器架構(gòu)如圖2所示。Hinds等[4]提出了一種用于嵌入式信號處理和圖形應(yīng)用的浮點(diǎn)協(xié)處理器,其可以改善關(guān)鍵部分的信號處理單元上的性能。Sohn等[5]設(shè)計了一個基于ARM-10的定點(diǎn)多媒體協(xié)處理器,其通過采用雙操作的定點(diǎn)協(xié)同處理器結(jié)構(gòu),在單一硬件中實(shí)現(xiàn)了低功耗的先進(jìn)三維圖形算法和各種流媒體的多媒體功能。1.2 CPU+眾核處理器

體系結(jié)構(gòu)圖,體系結(jié)構(gòu),核心,處理器


Intel公司也推出了眾核的處理器MIC芯片,其處理核心數(shù)目為50~64。第二代Intel Xeon Phi多核處理器擁有60多個核,如在Intel Xeon Phi 7250 KNL處理器中已經(jīng)有68個核心[14]。與GPGPU相比,MIC芯片的核心數(shù)目較少,但是單個核心的處理能力較強(qiáng),每個核心能夠獨(dú)立調(diào)度,屬于重核心;而GPGPU的核心往往公用一些指令部件,不能獨(dú)立調(diào)度,屬于輕核心。在Xeon Phi的x86核心設(shè)計中,每個內(nèi)核可以執(zhí)行4個同步線程,但是在理想情況下,每次只能處理其中的2條線程。Xeon Phi屬于順序執(zhí)行處理器,沒有任何亂序執(zhí)行能力。Xeon Phi的x86核心內(nèi)部實(shí)際上是雙發(fā)射設(shè)計,指令經(jīng)過解碼單元解碼后會進(jìn)入0號管線或者1號管線,然后會被送入其所需要的單元進(jìn)行處理。Xeon Phi的VPU中包含的矢量ALU可以高效率地執(zhí)行16 wide×32 bit的數(shù)據(jù)或者8 wide×64 bit的數(shù)據(jù)。除了VPU單元外,Intel還特別加入了x87浮點(diǎn)單元來對一些特殊的浮點(diǎn)數(shù)據(jù)進(jìn)行處理;為每個x86核心配備了32 kB的L1數(shù)據(jù)緩存和32 kB的L1指令緩存,并有一個512 bit矢量單元以及2個超標(biāo)量單元;為了提高Xeon Phi的計算能力,將L2緩存增大到了512 kB[15]。Xeon Phi的體系結(jié)構(gòu)如圖4所示。1.3 CPU+ASIC

【參考文獻(xiàn)】:
期刊論文
[1]C++AMP視角下的計算機(jī)圖像視頻處理研究[J]. 劉小豫,趙薔,聶維.  信息與電腦(理論版). 2018(21)
[2]跨媒體分析與推理:研究進(jìn)展與發(fā)展方向(英文)[J]. Yu-xin PENG,Wen-wu ZHU,Yao ZHAO,Chang-sheng XU,Qing-ming HUANG,Han-qing LU,Qing-hua ZHENG,Tie-jun HUANG,Wen GAO.  Frontiers of Information Technology & Electronic Engineering. 2017(01)
[3]異構(gòu)并行編程模型研究與進(jìn)展[J]. 劉穎,呂方,王蕾,陳莉,崔慧敏,馮曉兵.  軟件學(xué)報. 2014(07)



本文編號:3241283

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/3241283.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶8580d***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
国产91色综合久久高清| 中文字字幕在线中文乱码二区| 亚洲中文字幕在线视频频道| 少妇被粗大进猛进出处故事| 久久国产成人精品国产成人亚洲 | 中文字幕精品人妻一区| 开心激情网 激情五月天| 亚洲中文字幕三区四区| 欧美成人久久久免费播放| 亚洲综合精品天堂夜夜| 国产精品不卡一区二区三区四区 | 亚洲欧美日韩综合在线成成| 精品午夜福利无人区乱码| 国产中文另类天堂二区| 五月婷婷六月丁香狠狠| 亚洲第一香蕉视频在线| 亚洲欧美日本视频一区二区| 中文字幕一区二区三区大片| 久久精品国产亚洲av久按摩| 亚洲一区二区久久观看| 91偷拍裸体一区二区三区| 人妻久久一区二区三区精品99| 一区二区三区国产日韩| 亚洲天堂国产精品久久精品| 91精品蜜臀一区二区三区| 日本精品啪啪一区二区三区| 日韩1区二区三区麻豆| 精品欧美国产一二三区| 亚洲一区二区三区三区| 91久久国产福利自产拍| 粗暴蹂躏中文一区二区三区| 亚洲天堂男人在线观看| 国产精品一区二区视频成人| 欧美乱妇日本乱码特黄大片| 又大又长又粗又黄国产| 欧洲一级片一区二区三区| 国产精品视频一区麻豆专区| 好吊日在线视频免费观看| 国产成人午夜av一区二区| 日韩欧美国产高清在线| 日本东京热视频一区二区三区|