天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 計(jì)算機(jī)論文 >

面向局部性和并行優(yōu)化的循環(huán)分塊技術(shù)

發(fā)布時間:2018-03-13 02:07

  本文選題:循環(huán)分塊 切入點(diǎn):最優(yōu)分塊大小 出處:《計(jì)算機(jī)研究與發(fā)展》2015年05期  論文類型:期刊論文


【摘要】:循環(huán)分塊是一種廣泛用于改善數(shù)據(jù)局部性和開發(fā)并行性的程序變換優(yōu)化技術(shù).主要分為2類:固定分塊技術(shù)和參數(shù)化分塊技術(shù),系統(tǒng)地總結(jié)了這2類技術(shù),并分析了其優(yōu)缺點(diǎn).由于分塊大小的選擇會嚴(yán)重影響分塊代碼的性能,因此介紹分析了選擇最優(yōu)分塊大小的各種方法.此外,總結(jié)了循環(huán)分塊在多級分塊、并行性開發(fā)和不完美嵌套循環(huán)等方面應(yīng)用的各項(xiàng)技術(shù).通過對循環(huán)分塊技術(shù)當(dāng)前研究現(xiàn)狀的分析,得出如下結(jié)論:1)循環(huán)分塊技術(shù)中的計(jì)算復(fù)雜度和生成代碼效率問題還未得到完全解決,如何利用循環(huán)邊界有效地約束迭代空間并提高數(shù)據(jù)局部性還需要更深入的研究;2)最優(yōu)分塊大小的選擇依然是一個開放式難題,研究清楚分級存儲架構(gòu)中每級分塊對性能的影響具有重要的意義;3)從循環(huán)分塊的應(yīng)用角度,如何有效地構(gòu)建面向任意嵌套循環(huán)集的自動分塊代碼生成系統(tǒng),同時充分利用深度共享存儲資源和多核架構(gòu)實(shí)現(xiàn)分塊代碼的高并行度,也是一個需要深入研究的問題.
[Abstract]:Cyclic partitioning is a program transformation optimization technique widely used to improve data locality and develop parallelism. It is divided into two categories: fixed block technique and parameterized partitioning technique, and these two kinds of techniques are summarized systematically. The advantages and disadvantages of block size are also analyzed. Because the choice of block size will seriously affect the performance of block code, various methods of selecting optimal block size are introduced. Parallel development and imperfect nested loops, etc. Through the analysis of the current research status of circular block technology, The conclusion is as follows: 1) the computational complexity and code generation efficiency of the cyclic block technique have not been completely solved. How to use the cyclic boundary to effectively constrain the iterative space and improve the data locality still needs more in-depth research on the selection of the optimal block size, which is still an open problem. It is of great significance to study the effect of each level block on performance in hierarchical storage architecture. (3) from the perspective of the application of cyclic block, how to effectively construct an automatic block code generation system for arbitrary nested loop sets is proposed. At the same time making full use of deep shared storage resources and multi-core architecture to achieve high degree of parallelism of block code is also a problem that needs further study.
【作者單位】: 西安交通大學(xué)電子與信息工程學(xué)院;
【基金】:國家自然科學(xué)基金項(xiàng)目(91330117) 國家”八六三”高技術(shù)研究發(fā)展計(jì)劃基金項(xiàng)目(2012AA01A306,2012AA010901)
【分類號】:TP332;TP311.1

【參考文獻(xiàn)】

相關(guān)期刊論文 前1條

1 賈耀倉;武成崗;張兆慶;;指導(dǎo)cache靜態(tài)劃分的程序性能profiling優(yōu)化技術(shù)[J];計(jì)算機(jī)研究與發(fā)展;2012年01期

【共引文獻(xiàn)】

相關(guān)期刊論文 前10條

1 劉宏義;楊明;肖瑜;;基于可編程圖形硬件的音頻信號處理技術(shù)[J];電子科技;2013年10期

2 何明華;;計(jì)算機(jī)技術(shù)在圖形圖像處理中的應(yīng)用研究[J];計(jì)算機(jī)光盤軟件與應(yīng)用;2014年09期

3 李璋;杜慧敏;王涌鋼;;字符串匹配算法的實(shí)現(xiàn):CPU vs.GPU vs.FPGA[J];電子科技;2014年12期

4 吳粉俠;李紅;;基于邊緣強(qiáng)度匹配的圖像融合并行算法的研究[J];電子設(shè)計(jì)工程;2014年23期

5 巨濤;朱正東;董小社;;異構(gòu)眾核系統(tǒng)及其編程模型與性能優(yōu)化技術(shù)研究綜述[J];電子學(xué)報(bào);2015年01期

6 劉仲;田希;陳磊;;支持原位計(jì)算的高效三角矩陣乘法向量化方法[J];國防科技大學(xué)學(xué)報(bào);2014年06期

7 由志杰;謝傳節(jié);馬益杭;龍舟;;一種異構(gòu)多核架構(gòu)快速查詢多邊形圖層間空間關(guān)系的方法[J];地球信息科學(xué)學(xué)報(bào);2015年05期

8 龔若皓;楊斌;;基于移動多核GPU的并行二維DCT變換實(shí)現(xiàn)方法[J];成都信息工程學(xué)院學(xué)報(bào);2015年01期

9 王正華;陸平靜;車永剛;;迭代編譯優(yōu)化技術(shù)綜述[J];計(jì)算機(jī)工程與應(yīng)用;2008年32期

10 陸平靜;車永剛;束堯;王正華;;多面體表示技術(shù)及在程序性能優(yōu)化中的應(yīng)用[J];計(jì)算機(jī)工程與科學(xué);2008年09期

相關(guān)博士學(xué)位論文 前10條

1 嚴(yán)明;面向領(lǐng)域應(yīng)用的異構(gòu)多核SoC系統(tǒng)結(jié)構(gòu)設(shè)計(jì)與優(yōu)化[D];國防科學(xué)技術(shù)大學(xué);2011年

2 車永剛;科學(xué)計(jì)算程序性能分析與優(yōu)化關(guān)鍵技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2004年

3 陳莉;SMP機(jī)群上的并行代碼優(yōu)化技術(shù)[D];中國科學(xué)院研究生院(計(jì)算技術(shù)研究所);2002年

4 杜靜;流體系結(jié)構(gòu)的編譯技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2008年

5 陸平靜;低開銷的迭代編譯優(yōu)化關(guān)鍵技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2010年

6 姚遠(yuǎn);SIMD自動向量識別及代碼調(diào)優(yōu)技術(shù)研究[D];解放軍信息工程大學(xué);2012年

7 王慶;面向嵌入式多核系統(tǒng)的并行程序優(yōu)化技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2013年

8 張志敏;化學(xué)計(jì)量學(xué)算法實(shí)現(xiàn)的軟件開發(fā)基礎(chǔ)研究[D];中南大學(xué);2012年

9 甘新標(biāo);面向眾核GPU的編程模型及編譯優(yōu)化關(guān)鍵技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2012年

10 劉勇;基于GPU的內(nèi)存數(shù)據(jù)庫索引技術(shù)研究[D];華南理工大學(xué);2013年

相關(guān)碩士學(xué)位論文 前10條

1 余小喜;面向嵌入式系統(tǒng)的迭代式循環(huán)展開優(yōu)化[D];國防科學(xué)技術(shù)大學(xué);2011年

2 張媛媛;自動向量化中的收益評估技術(shù)研究[D];解放軍信息工程大學(xué);2011年

3 單瑩;科學(xué)計(jì)算程序的綜合優(yōu)化技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2005年

4 陸平靜;結(jié)合經(jīng)驗(yàn)搜索和分析模型的代碼優(yōu)化方法研究[D];國防科學(xué)技術(shù)大學(xué);2006年

5 馮權(quán)友;面向循環(huán)級數(shù)組訪問的數(shù)據(jù)預(yù)取技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2008年

6 趙捷;面向分布存儲的并行編譯優(yōu)化技術(shù)研究[D];解放軍信息工程大學(xué);2012年

7 劉荷葦;基于CUDA編程的神經(jīng)網(wǎng)絡(luò)手寫數(shù)字識別[D];西南交通大學(xué);2013年

8 凡保磊;卷積神經(jīng)網(wǎng)絡(luò)的并行化研究[D];鄭州大學(xué);2013年

9 李安平;基于CUDA的并行圖像處理問題研究[D];西安電子科技大學(xué);2013年

10 高偉;面向SIMD的自動向量化優(yōu)化技術(shù)研究[D];解放軍信息工程大學(xué);2013年

【二級參考文獻(xiàn)】

相關(guān)期刊論文 前1條

1 隋秀峰;吳俊敏;陳國良;;ARP:同時多線程處理器中共享Cache自適應(yīng)運(yùn)行時劃分機(jī)制[J];計(jì)算機(jī)研究與發(fā)展;2008年07期

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 劉曉嫻;趙榮彩;丁銳;李雁冰;;基于循環(huán)分塊的流水粒度優(yōu)化算法[J];計(jì)算機(jī)應(yīng)用;2013年08期

2 秦永勝,徐用懋,方崇智,唐杰;改進(jìn)的多元精餾塔動態(tài)分塊模型[J];化工自動化及儀表;1996年04期

3 徐冬冬;陳秀宏;;分塊二維保局投影方法及其在人臉識別中的應(yīng)用[J];計(jì)算機(jī)應(yīng)用;2009年08期

4 徐德智;賴雅;王潤梅;;大規(guī)模本體分塊與映射研究[J];小型微型計(jì)算機(jī)系統(tǒng);2012年03期

5 蔡德鈞 ,王宏遠(yuǎn);一種自適應(yīng)分塊截?cái)嗑幋a[J];華中工學(xué)院學(xué)報(bào);1985年04期

6 林向東;故障模擬中的診斷度和動態(tài)分塊[J];計(jì)算機(jī)學(xué)報(bào);1986年02期

7 李慧馳;;改進(jìn)的隨機(jī)分塊模型[J];科技致富向?qū)?2013年32期

8 宋江洪,趙忠明;圖像分塊分層結(jié)構(gòu)在海量數(shù)據(jù)處理中的應(yīng)用[J];計(jì)算機(jī)工程與應(yīng)用;2004年33期

9 李慧;沈潔;張舒;顧天竺;吳顏;陳曉紅;;基于頁面分塊與信息熵的評論發(fā)現(xiàn)及抽取[J];計(jì)算機(jī)應(yīng)用研究;2007年02期

10 陳乾;徐德智;陳建二;;基于覆蓋聚類的大本體分塊映射研究[J];計(jì)算機(jī)工程與應(yīng)用;2009年10期

相關(guān)會議論文 前10條

1 任安祿;鄧見;;分塊法求解圓球強(qiáng)迫對流場[A];第十一屆全國水動力學(xué)學(xué)術(shù)會議暨第二十四屆全國水動力學(xué)研討會并周培源誕辰110周年紀(jì)念大會文集(上冊)[C];2012年

2 陳宜穩(wěn);王威;王潤生;;分塊建模和點(diǎn)建模聯(lián)合的背景重建方法[A];計(jì)算機(jī)技術(shù)與應(yīng)用進(jìn)展·2007——全國第18屆計(jì)算機(jī)技術(shù)與應(yīng)用(CACIS)學(xué)術(shù)會議論文集[C];2007年

3 伍中平;;雙向不等高正交鋼管桁架分塊整體提升施工技術(shù)[A];大型復(fù)雜鋼結(jié)構(gòu)建筑工程施工新技術(shù)與應(yīng)用論文集[C];2012年

4 鄒李;杜小勇;何軍;;B3:圖間節(jié)點(diǎn)相似度分塊計(jì)算方法[A];NDBC2010第27屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集A輯二[C];2010年

5 竇朝暉;;影響分塊算法性能的主要因素[A];面向21世紀(jì)的科技進(jìn)步與社會經(jīng)濟(jì)發(fā)展(上冊)[C];1999年

6 肖永浩;黃清南;;基于分塊數(shù)據(jù)結(jié)構(gòu)的沖擊問題并行計(jì)算[A];中國計(jì)算力學(xué)大會'2010(CCCM2010)暨第八屆南方計(jì)算力學(xué)學(xué)術(shù)會議(SCCM8)論文集[C];2010年

7 戴妍峰;劉藻珍;;空間望遠(yuǎn)鏡分塊式主鏡面形控制系統(tǒng)建模[A];中國系統(tǒng)仿真學(xué)會第五次全國會員代表大會暨2006年全國學(xué)術(shù)年會論文集[C];2006年

8 李嘉偉;孫明;;基于分塊LAB特征的粒子濾波目標(biāo)跟蹤算法[A];中國農(nóng)業(yè)工程學(xué)會2011年學(xué)術(shù)年會論文集[C];2011年

9 ;大會主題報(bào)告[A];2009年全國微波毫米波會議論文集(下冊)[C];2009年

10 許曉陽;趙曉飛;;新型城軌車輛限界分塊輪廓板快速設(shè)計(jì)方法[A];第八屆中國智能交通年會論文集[C];2013年

相關(guān)重要報(bào)紙文章 前6條

1 雷明;企業(yè)扭虧分塊搞活應(yīng)處理好的幾個關(guān)系[N];中國企業(yè)報(bào);2000年

2 雷明;分塊搞活應(yīng)處理好幾個關(guān)系[N];中國航空報(bào);2001年

3 覃匡龍 周鴻廣 侯俊富;“分塊管理”破解警力難題[N];檢察日報(bào);2003年

4 王書明;新華中學(xué)形成安全管理網(wǎng)絡(luò)[N];商洛日報(bào);2007年

5 記者 郭鳳美;“分塊搞活”救了太原制藥[N];山西經(jīng)濟(jì)日報(bào);2004年

6 段燕婷;大理市文明工程分塊落地[N];云南經(jīng)濟(jì)日報(bào);2013年

相關(guān)博士學(xué)位論文 前2條

1 鄒健;分塊稀疏表示的理論及算法研究[D];華南理工大學(xué);2012年

2 何邊;復(fù)雜網(wǎng)絡(luò)上的分塊問題[D];上海交通大學(xué);2012年

相關(guān)碩士學(xué)位論文 前10條

1 閔慧;面向語義服務(wù)的大規(guī)模本體分塊映射研究[D];中南大學(xué);2013年

2 王潤梅;基于Laplace矩陣的大規(guī)模本體分塊映射的研究[D];中南大學(xué);2011年

3 齊朗曄;基于分塊核函數(shù)特征的交通標(biāo)識識別[D];南京理工大學(xué);2013年

4 蘇撔撔;基于分塊模型和在線學(xué)習(xí)的目標(biāo)跟蹤[D];上海交通大學(xué);2014年

5 楊冠軍;基于混合聚類的大本體分塊映射及評價方法研究[D];中南大學(xué);2009年

6 孫維鵬;結(jié)構(gòu)振動主動控制的分塊方法[D];吉林大學(xué);2004年

7 郭維;基于二部圖模型的大本體分塊與映射研究[D];中南大學(xué);2012年

8 黃曉威;分塊人臉奇偶對稱性在人臉識別中的應(yīng)用[D];廣東工業(yè)大學(xué);2013年

9 孫麗卿;基于分塊壓縮傳感的圖像重建算法研究[D];天津理工大學(xué);2012年

10 黃敏;大數(shù)據(jù)下基于塊依賴的實(shí)體解析方法[D];北京交通大學(xué);2015年

,

本文編號:1604318

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/1604318.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶bda28***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com