面向通訊同步的多處理器陣列重構(gòu)
本文選題:VLSI陣列 + 拓?fù)渲貥?gòu); 參考:《計算機科學(xué)》2017年07期
【摘要】:從多處理器陣列中獲取所需大小并且同步通訊性能優(yōu)良的子陣列,是高性能拓?fù)渲貥?gòu)的核心問題之一。基于不同的邏輯列剔除策略提出了3種面向通訊同步的拓?fù)渲貥?gòu)算法:基于分治思想剔除邏輯列的重構(gòu)算法(SCA_01),該算法能夠使被優(yōu)化的邏輯列相對均勻地分布在物理陣列中;優(yōu)先剔除長邏輯列的貪心重構(gòu)算法(SCA_02),該算法能夠使被優(yōu)化的邏輯列的長鏈接總數(shù)最少;基于分治與長鏈接數(shù)的混成重構(gòu)算法(SCA_03),該算法將某一區(qū)域內(nèi)的最長邏輯列剔除,且盡可能將剩余邏輯列均勻分布在物理陣列中。同時,對邏輯陣列的最大通訊延時給出了下界的求解算法。實驗結(jié)果表明,3種算法在故障率小于1%、邏輯列的剔除率超過20%時,算法重構(gòu)出的邏輯陣列的通訊延時特別接近計算出的性能下界。在多數(shù)情況下SCA_01優(yōu)于SCA_02和SCA_03,而后兩者的性能相近。在小陣列上且故障率與剔除率較小時,SCA_02具有性能優(yōu)勢,但在大陣列上SCA_03具有優(yōu)勢。在32×32的陣列上,SCA_01構(gòu)造的陣列產(chǎn)生的通訊延時較SCA_02和SCA_03產(chǎn)生的延時平均減少25%,并且運行速度也提升了19.4%。
[Abstract]:It is one of the core problems of high performance topology reconstruction to obtain the required size from the multiprocessor array and to synchronize the sub-arrays with good communication performance. Three topology reconstruction algorithms oriented to communication synchronization are proposed based on different logic column elimination strategies: the algorithm of reconstructing logic columns based on partition and conquer is called SCAstack 01, which can make the optimized logic columns distribute in the physical array relatively evenly; The greedy reconstruction algorithm (SCA02C), which gives priority to the elimination of long logical columns, can minimize the total number of long links in the optimized logical columns, and the hybrid reconstruction algorithm based on partition, conquer and long link number (SCA03), which removes the longest logical columns in a certain region, As far as possible, the remaining logical columns are uniformly distributed in the physical array. At the same time, the lower bound algorithm is given for the maximum communication delay of logic array. The experimental results show that when the failure rate is less than 1 and the elimination rate of logic sequence is more than 20, the communication delay of the reconstructed logic array is especially close to the calculated lower bound of performance. In most cases, SCA_01 is superior to SCA_02 and SCA03, and the performance of the latter two is similar. On the small array, the failure rate and elimination rate are smaller than that on the small array, but the SCA_03 has the advantage on the large array. The communication delay generated by the array constructed by SCA01 on the 32 脳 32 array is 25% less than that produced by SCA_02 and SCA_03 on average, and the running speed is also increased by 19.4%.
【作者單位】: 廣東工業(yè)大學(xué)計算機學(xué)院;
【基金】:國家自然科學(xué)基金項目(61572144) 廣東省科技計劃應(yīng)用專項基金(2015B010129014) 廣東省自然科學(xué)基金項目(2016A030313703)資助
【分類號】:TP332
【參考文獻】
相關(guān)期刊論文 前2條
1 張元瑞;武繼剛;段新明;;可重構(gòu)陣列的同步性能優(yōu)化算法[J];計算機科學(xué);2012年03期
2 徐雄;沈宇澤;孫學(xué)梅;武繼剛;;可重構(gòu)處理器陣列的容錯上界[J];武漢大學(xué)學(xué)報(理學(xué)版);2011年06期
【相似文獻】
相關(guān)期刊論文 前10條
1 ;多處理器成為主流技術(shù)[J];今日電子;1995年03期
2 柴振榮;群集正在得到公認(rèn),多處理器走向成熟[J];管理科學(xué)文摘;1999年05期
3 CONI;;多處理器性能分析[J];電腦自做;2003年10期
4 安德思 ,李晶皎;軟件交響曲——在多處理器中實時性與高實用性的融合[J];電子產(chǎn)品世界;2005年03期
5 郭松柳;汪東升;姚文斌;;片上多處理器的層次化高速測試和驗證技術(shù)[J];哈爾濱工程大學(xué)學(xué)報;2007年05期
6 金海;;《多處理器編程的藝術(shù)》[J];計算機教育;2008年19期
7 邵森;;嵌入式測控系統(tǒng)中的多處理器架構(gòu)設(shè)計[J];今日科苑;2009年04期
8 夏磊;岳焱;;基于多處理器虛擬化的云計算應(yīng)用的安全研究[J];中國新通信;2013年11期
9 黃光奇,凌云翔,周興銘;單芯片多處理器[J];電子計算機與外部設(shè)備;1998年06期
10 ;奔騰Ⅱ至強處理器與高能奔騰處理器比較[J];中國計算機用戶;1998年28期
相關(guān)會議論文 前4條
1 劉磊;;基于便簽式存儲器的SoC多處理器訪存結(jié)構(gòu)設(shè)計與實現(xiàn)[A];2008通信理論與技術(shù)新進展——第十三屆全國青年通信學(xué)術(shù)會議論文集(上)[C];2008年
2 李永進;周宏偉;鄧讓鈺;張英;潘國騰;曾坤;;片上多處理器中目錄控制器的死鎖避免設(shè)計[A];第十六屆計算機工程與工藝年會暨第二屆微處理器技術(shù)論壇論文集[C];2012年
3 黃紅;;幾種建立計算機系統(tǒng)方案的比較[A];OA’97全國辦公自動化學(xué)術(shù)與經(jīng)驗交流會論文集[C];1997年
4 李曉軍;鄧旭亮;;VXI總線頻譜分析儀模塊中的多處理器通信接口設(shè)計[A];2008中國儀器儀表與測控技術(shù)進展大會論文集(Ⅲ)[C];2008年
相關(guān)重要報紙文章 前10條
1 姜波;Dell終于靠近AMD[N];網(wǎng)絡(luò)世界;2006年
2 范榮;AMD推出適用于服務(wù)器的多處理器平臺[N];通信產(chǎn)業(yè)報;2001年
3 ;多處理器服務(wù)器[N];網(wǎng)絡(luò)世界;2001年
4 本報記者 謝文硯;中端計算 小型機面臨x86挑戰(zhàn)[N];網(wǎng)絡(luò)世界;2005年
5 本報記者 武漢;AMD2007年 推出四核心皓龍[N];網(wǎng)絡(luò)世界;2005年
6 ;SCO公布Linux許可條款[N];計算機世界;2003年
7 汪東升;集多處理器于一身的CMP[N];金融時報;2006年
8 呂森林;采用SMP物有所值嗎[N];中國電腦教育報;2002年
9 ;超級計算機超越了什么?[N];網(wǎng)絡(luò)世界;2005年
10 本報記者 趙霞;XteamServer 5.0更重應(yīng)用支持[N];計算機世界;2004年
相關(guān)博士學(xué)位論文 前3條
1 顧雄禮;片上多處理器關(guān)鍵技術(shù)研究[D];浙江大學(xué);2011年
2 李頎;基于FPGA的片上多處理器建模方法[D];中國科學(xué)技術(shù)大學(xué);2012年
3 魯建壯;單芯片多處理器關(guān)鍵技術(shù)的研究與實現(xiàn)[D];國防科學(xué)技術(shù)大學(xué);2005年
相關(guān)碩士學(xué)位論文 前10條
1 閆建明;異構(gòu)多處理器中溫度感知實時任務(wù)調(diào)度機制研究與算法設(shè)計[D];華東師范大學(xué);2015年
2 于金銘;多核平臺上混合關(guān)鍵性任務(wù)實時調(diào)度算法研究[D];東北大學(xué);2013年
3 宋偉;面向?qū)崟r的星載多處理器操作系統(tǒng)的研究與實現(xiàn)[D];國防科學(xué)技術(shù)大學(xué);2006年
4 尹偉;多處理器單調(diào)速率任務(wù)調(diào)度算法研究[D];東華大學(xué);2012年
5 牛英香;嵌入式開源操作系統(tǒng)的多處理器功能擴展及應(yīng)用[D];北京郵電大學(xué);2013年
6 朱俊超;基于多處理器的雙優(yōu)化級調(diào)度算法改進與實現(xiàn)[D];大連理工大學(xué);2010年
7 宋彭濤;系統(tǒng)級模擬器中多處理器間通信模擬技術(shù)研究[D];解放軍信息工程大學(xué);2010年
8 李松濤;并行多處理器系統(tǒng)容錯的研究與實現(xiàn)[D];電子科技大學(xué);2006年
9 由四海;多處理器的時鐘同步技術(shù)的研究與實現(xiàn)[D];西安工業(yè)大學(xué);2010年
10 王魯光;多處理器片上系統(tǒng)中溫度感知的任務(wù)調(diào)度算法研究[D];山東大學(xué);2012年
,本文編號:1805735
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/1805735.html