基于FT-C6XX多核DSP的MPI移植實(shí)現(xiàn)與優(yōu)化
本文關(guān)鍵詞:基于FT-C6XX多核DSP的MPI移植實(shí)現(xiàn)與優(yōu)化,由筆耕文化傳播整理發(fā)布。
【摘要】:FT-C6XX多核DSP(Digital Signal Processor)是由國防科學(xué)技術(shù)大學(xué)計(jì)算機(jī)學(xué)院微電子所自主研發(fā)的一款高性能多核數(shù)字信號處理器,該芯片主要應(yīng)用于高新能計(jì)算領(lǐng)域。為FT-C6XX多核DSP開發(fā)多核并行編程環(huán)境對該芯片的應(yīng)用推廣有很大益處,是該項(xiàng)目目前較為重要的工作之一。本文結(jié)合FT-C6XX多核DSP的體系結(jié)構(gòu)特征,將MPI(Message Passing Interface)并行編程環(huán)境移植到FT-C6XX多核DSP平臺上,并對多核間通信方式進(jìn)行了優(yōu)化,測試結(jié)果表明了本文移植工作的正確性與優(yōu)化工作的有效性。本文主要的研究內(nèi)容及貢獻(xiàn)包括以下四個方面:(1)總結(jié)了基于MPI并行編程環(huán)境開發(fā)FT-C6XX多核應(yīng)用程序的方法:主要是將一個串行程序MPI并行化,具體步驟為:分解任務(wù),分配任務(wù),協(xié)調(diào)進(jìn)程,進(jìn)程映射到處理器這幾步。(2)基于FT-C6XX體系結(jié)構(gòu)移植實(shí)現(xiàn)了MPI并行編程環(huán)境:首先移植編譯相關(guān)工具鏈:二進(jìn)制工具集binutils、GCC編譯器、u Clibc庫生成FT-C6XX多核DSP的交叉編譯環(huán)境;然后從通信模塊、同步模塊兩個方面將MPI并行編程環(huán)境移植到FT-C6XX多核DSP平臺上;最后編譯生成FT-C6XX多核DSP平臺支持的MPI可執(zhí)行代碼。(3)對FT-C6XX的MPI通信性能進(jìn)行了優(yōu)化:主要是針對共享內(nèi)存消息傳遞方法管理以及長消息傳遞兩個問題,采用消息隊(duì)列和單拷貝的DMA技術(shù)分別對其進(jìn)行優(yōu)化。(4)對FT-C6XX的MPI并行編程環(huán)境進(jìn)行測試:通過三個測試用例,π值計(jì)算cpi.c、矩陣乘法matrix.c、快速傅里葉變換fft.c驗(yàn)證了移植工作的正確性;通過測試快速傅里葉變換fft.c在優(yōu)化前后的程序性能,表明優(yōu)化后程序性能得了10%左右的提升。
【關(guān)鍵詞】:多核DSP MPI移植 通信優(yōu)化
【學(xué)位授予單位】:國防科學(xué)技術(shù)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TP332
【目錄】:
- 摘要10-11
- ABSTRACT11-12
- 第一章 緒論12-20
- 1.1 研究背景與意義12-15
- 1.1.1 多核技術(shù)的發(fā)展及挑戰(zhàn)12-13
- 1.1.2 課題來源13-15
- 1.2 國內(nèi)外相關(guān)研究15-18
- 1.2.1 共享變量模型15
- 1.2.2 數(shù)據(jù)并行模型15-16
- 1.2.3 消息傳遞模型16-18
- 1.2.3.1 MPI現(xiàn)有的實(shí)現(xiàn)16-17
- 1.2.3.2 MPI研究熱點(diǎn)17-18
- 1.3 論文主要工作18-19
- 1.4 論文組織結(jié)構(gòu)19-20
- 第二章 MPI程序設(shè)計(jì)與性能評估20-29
- 2.1 MPI并行程序設(shè)計(jì)方法20-25
- 2.1.1 MPI并行程序設(shè)計(jì)步驟20-21
- 2.1.2 矩陣乘法MPI設(shè)計(jì)實(shí)例21-25
- 2.2 MPI并行程序性能分析25-27
- 2.2.1 執(zhí)行時間25-26
- 2.2.2 加速比與效率26-27
- 2.3 MPI并行程序開銷分析27-28
- 2.4 本章小結(jié)28-29
- 第三章 基于FT-C6XX多核DSP的MPI移植實(shí)現(xiàn)29-58
- 3.1 實(shí)驗(yàn)平臺、開發(fā)調(diào)試環(huán)境介紹以及調(diào)試步驟分析29-31
- 3.1.1 實(shí)驗(yàn)平臺、開發(fā)調(diào)試環(huán)境介紹29-30
- 3.1.2 在FT-C6XX多核DSP上調(diào)試MPI程序步驟分析30-31
- 3.2 MPICH總體結(jié)構(gòu)31-33
- 3.2.1 MPI接口實(shí)現(xiàn)層31-32
- 3.2.2 MPI抽象設(shè)備層32-33
- 3.2.3 MPI通道接口層33
- 3.3 移植過程分析及移植難點(diǎn)33-36
- 3.3.1 移植實(shí)現(xiàn)過程分析33-35
- 3.3.2 MPI移植難點(diǎn)分析35-36
- 3.4 binutils二進(jìn)制工具集移植36-38
- 3.4.1 BFD庫的移植36-37
- 3.4.2 匯編器GNU AS移植37-38
- 3.4.3 鏈接器GNU LD移植38
- 3.5 GCC編譯器移植38-41
- 3.5.1 ftc6xx.h文件39
- 3.5.2 ftc6xx.c文件39-40
- 3.5.3 ftc6xx.md文件40-41
- 3.6 uclibc庫的移植41-42
- 3.7 MPI的通信模塊移植實(shí)現(xiàn)42-50
- 3.7.1 基于FT-C6XX多核DSP的MPI核間共享內(nèi)存實(shí)現(xiàn)42-46
- 3.7.1.1 共享內(nèi)存初始化43-45
- 3.7.1.2 共享內(nèi)存動態(tài)申請45
- 3.7.1.3 共享內(nèi)存動態(tài)釋放45-46
- 3.7.2 基于FT-C6XX多核DSP的MPI消息隊(duì)列實(shí)現(xiàn)46-48
- 3.7.2.1 消息隊(duì)列創(chuàng)建與釋放46-47
- 3.7.2.2 消息隊(duì)列的初始化47
- 3.7.2.3 消息隊(duì)列管理47-48
- 3.7.3 基于共享內(nèi)存SM的消息傳遞方法48-50
- 3.8 多核通信同步方式的移植實(shí)現(xiàn)50-56
- 3.8.1 基于核間中斷管理的同步方式50-52
- 3.8.2 基于核間共享信號量的同步方式52-54
- 3.8.2.1 信號量管理的工作原理52-53
- 3.8.2.2 創(chuàng)建/刪除一個信號量53-54
- 3.8.3 基于柵欄的核間任務(wù)同步方式54-56
- 3.8.3.1 在FT-C6XX多核DSP上設(shè)計(jì)柵欄54-55
- 3.8.3.2 柵欄的初始化55-56
- 3.9 MPI的配置及編譯56-57
- 3.10 本章小結(jié)57-58
- 第四章 FT-C6XX的MPI進(jìn)程間通信性能優(yōu)化58-68
- 4.1 基于共享內(nèi)存的消息隊(duì)列的消息傳遞方法及其優(yōu)化方法58-62
- 4.1.1 基于共享內(nèi)存的消息隊(duì)列的消息傳遞方法58-59
- 4.1.2 使用lock_free_queue對消息傳遞方法進(jìn)行優(yōu)化59-60
- 4.1.3 Fastbox的旁路隊(duì)列機(jī)制60-61
- 4.1.4“影子指針”的使用61-62
- 4.2 單拷貝技術(shù)的應(yīng)用62-65
- 4.3 FT-C6XX多核DSP上基于MPI的DMA消息傳遞方法65-67
- 4.3.1 直接使用DMA搬移方式的消息傳遞方法65-66
- 4.3.2 基于nemesis通道的LMT接口的DMA消息傳遞方法66-67
- 4.4 本章小結(jié)67-68
- 第五章 基于FT-C6XX多核DSP的MPI程序性能測試68-83
- 5.1 用數(shù)值積分法計(jì)算圓周率π68-72
- 5.1.1 計(jì)算圓周率π的MPI并行算法68-70
- 5.1.2 π值計(jì)算MPI并行程序測試結(jié)果及分析70-72
- 5.2 矩陣運(yùn)算并行計(jì)算72-77
- 5.2.1 矩陣乘法算法分析72-73
- 5.2.2 矩陣乘法MPI并行程序測試及分析73-77
- 5.3 fft快速傅里葉變換算法77-82
- 5.3.1 對MPI進(jìn)程間通信性能優(yōu)化前fft.c程序測試及分析77-79
- 5.3.2 對MPI進(jìn)程間通信性能優(yōu)化后fft.c程序測試及分析79-82
- 5.4 本章小結(jié)82-83
- 第六章 總結(jié)與展望83-85
- 6.1 全文總結(jié)83-84
- 6.2 展望84-85
- 致謝85-86
- 參考文獻(xiàn)86-89
- 作者在學(xué)期間取得的學(xué)術(shù)成果89
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 逄煥眾;用于進(jìn)程間通信的消息隊(duì)列探討[J];中國金融電腦;1998年08期
2 周世杰;劉錦德;秦志光;;消息隊(duì)列技術(shù)研究:綜述與一個實(shí)例[J];計(jì)算機(jī)科學(xué);2002年02期
3 孟昭勇;對“消息”的初步認(rèn)識[J];現(xiàn)代制造工程;2003年S1期
4 鄧波;防止消息隊(duì)列阻塞的辦法[J];華南金融電腦;2003年06期
5 杜毅,楊金生,吳震華;Linux消息隊(duì)列分析及應(yīng)用[J];計(jì)算機(jī)工程;2004年S1期
6 王強(qiáng);在數(shù)據(jù)庫開發(fā)中巧用消息隊(duì)列[J];計(jì)算機(jī)與現(xiàn)代化;2005年11期
7 曹婧華;冉彥中;許志軍;;分布式消息隊(duì)列的設(shè)計(jì)與實(shí)現(xiàn)[J];河南科技大學(xué)學(xué)報(bào)(自然科學(xué)版);2010年04期
8 穆榮均;;消息隊(duì)列漫談[J];程序員;2010年11期
9 JEFF PROSISE ,楊慧中;第二消息循環(huán)[J];個人電腦;1995年07期
10 沈華峰;;如何實(shí)現(xiàn)進(jìn)程通信的程序設(shè)計(jì)——消息隊(duì)列方法[J];上海微型計(jì)算機(jī);1998年16期
中國重要會議論文全文數(shù)據(jù)庫 前2條
1 張磊;陳犖;吳秋云;李軍;;基于消息隊(duì)列的分布式信息查詢技術(shù)的研究與實(shí)現(xiàn)[A];第二十屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報(bào)告篇)[C];2003年
2 郭杰;;基于NoSQL的持久化消息隊(duì)列設(shè)計(jì)實(shí)現(xiàn)[A];全國冶金自動化信息網(wǎng)2014年會論文集[C];2014年
中國重要報(bào)紙全文數(shù)據(jù)庫 前7條
1 楊海平 姚洪利;多線程數(shù)據(jù)共享與線程同步[N];中國計(jì)算機(jī)報(bào);2001年
2 劉錟;實(shí)現(xiàn)嵌入式系統(tǒng)并發(fā)任務(wù)間的通信[N];計(jì)算機(jī)世界;2005年
3 諶力;Sun謹(jǐn)慎開源Java核心[N];網(wǎng)絡(luò)世界;2006年
4 ;詳解.NET的RAD功能[N];中國計(jì)算機(jī)報(bào);2001年
5 中石油昆侖天然氣利用有限公司 謝梟;定位系統(tǒng) 守護(hù)危險(xiǎn)化學(xué)品運(yùn)輸[N];計(jì)算機(jī)世界;2011年
6 于翔;微軟公開M語言加快開放步伐[N];網(wǎng)絡(luò)世界;2008年
7 《網(wǎng)絡(luò)世界》記者 于翔;Oracle Tuxedo將針對Exalogic展開持續(xù)優(yōu)化[N];網(wǎng)絡(luò)世界;2012年
中國博士學(xué)位論文全文數(shù)據(jù)庫 前2條
1 盧本捷;分布式消息隊(duì)列的理論、實(shí)現(xiàn)與應(yīng)用[D];華中科技大學(xué);2004年
2 苑洪亮;基于內(nèi)容的“發(fā)布/訂閱”若干關(guān)鍵技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2006年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 袁浩東;基于LabVLEW的通用數(shù)據(jù)采集系統(tǒng)的設(shè)計(jì)[D];西南交通大學(xué);2015年
2 史須勇;ICT通信服務(wù)器體系結(jié)構(gòu)的設(shè)計(jì)與實(shí)現(xiàn)[D];中國科學(xué)院研究生院(沈陽計(jì)算技術(shù)研究所);2015年
3 黃寶鋮;游戲精準(zhǔn)營銷中轉(zhuǎn)服務(wù)器的設(shè)計(jì)與實(shí)現(xiàn)[D];哈爾濱工業(yè)大學(xué);2015年
4 陳瑤;基于Node.js高并發(fā)web系統(tǒng)的研究與應(yīng)用[D];電子科技大學(xué);2014年
5 鄧文;川慶公司云模式網(wǎng)絡(luò)預(yù)警系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2014年
6 宋強(qiáng);基于windows平臺的分布式控制系統(tǒng)設(shè)計(jì)[D];西安電子科技大學(xué);2014年
7 張晶;智慧交通OD分析系統(tǒng)的設(shè)計(jì)和構(gòu)建[D];南京郵電大學(xué);2015年
8 李澤平;嵌入式微系統(tǒng)msOS的設(shè)計(jì)與應(yīng)用[D];江西科技師范大學(xué);2015年
9 劉海濤;武警部隊(duì)(支隊(duì)級)勤務(wù)管理系統(tǒng)設(shè)計(jì)與開發(fā)[D];西安工程大學(xué);2015年
10 廖坤;基于FT-C6XX多核DSP的MPI移植實(shí)現(xiàn)與優(yōu)化[D];國防科學(xué)技術(shù)大學(xué);2015年
本文關(guān)鍵詞:基于FT-C6XX多核DSP的MPI移植實(shí)現(xiàn)與優(yōu)化,由筆耕文化傳播整理發(fā)布。
,本文編號:272352
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/272352.html