天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 計(jì)算機(jī)論文 >

基于FT-C6XX多核DSP的MPI移植實(shí)現(xiàn)與優(yōu)化

發(fā)布時間:2017-03-28 13:17

  本文關(guān)鍵詞:基于FT-C6XX多核DSP的MPI移植實(shí)現(xiàn)與優(yōu)化,由筆耕文化傳播整理發(fā)布。


【摘要】:FT-C6XX多核DSP(Digital Signal Processor)是由國防科學(xué)技術(shù)大學(xué)計(jì)算機(jī)學(xué)院微電子所自主研發(fā)的一款高性能多核數(shù)字信號處理器,該芯片主要應(yīng)用于高新能計(jì)算領(lǐng)域。為FT-C6XX多核DSP開發(fā)多核并行編程環(huán)境對該芯片的應(yīng)用推廣有很大益處,是該項(xiàng)目目前較為重要的工作之一。本文結(jié)合FT-C6XX多核DSP的體系結(jié)構(gòu)特征,將MPI(Message Passing Interface)并行編程環(huán)境移植到FT-C6XX多核DSP平臺上,并對多核間通信方式進(jìn)行了優(yōu)化,測試結(jié)果表明了本文移植工作的正確性與優(yōu)化工作的有效性。本文主要的研究內(nèi)容及貢獻(xiàn)包括以下四個方面:(1)總結(jié)了基于MPI并行編程環(huán)境開發(fā)FT-C6XX多核應(yīng)用程序的方法:主要是將一個串行程序MPI并行化,具體步驟為:分解任務(wù),分配任務(wù),協(xié)調(diào)進(jìn)程,進(jìn)程映射到處理器這幾步。(2)基于FT-C6XX體系結(jié)構(gòu)移植實(shí)現(xiàn)了MPI并行編程環(huán)境:首先移植編譯相關(guān)工具鏈:二進(jìn)制工具集binutils、GCC編譯器、u Clibc庫生成FT-C6XX多核DSP的交叉編譯環(huán)境;然后從通信模塊、同步模塊兩個方面將MPI并行編程環(huán)境移植到FT-C6XX多核DSP平臺上;最后編譯生成FT-C6XX多核DSP平臺支持的MPI可執(zhí)行代碼。(3)對FT-C6XX的MPI通信性能進(jìn)行了優(yōu)化:主要是針對共享內(nèi)存消息傳遞方法管理以及長消息傳遞兩個問題,采用消息隊(duì)列和單拷貝的DMA技術(shù)分別對其進(jìn)行優(yōu)化。(4)對FT-C6XX的MPI并行編程環(huán)境進(jìn)行測試:通過三個測試用例,π值計(jì)算cpi.c、矩陣乘法matrix.c、快速傅里葉變換fft.c驗(yàn)證了移植工作的正確性;通過測試快速傅里葉變換fft.c在優(yōu)化前后的程序性能,表明優(yōu)化后程序性能得了10%左右的提升。
【關(guān)鍵詞】:多核DSP MPI移植 通信優(yōu)化
【學(xué)位授予單位】:國防科學(xué)技術(shù)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TP332
【目錄】:
  • 摘要10-11
  • ABSTRACT11-12
  • 第一章 緒論12-20
  • 1.1 研究背景與意義12-15
  • 1.1.1 多核技術(shù)的發(fā)展及挑戰(zhàn)12-13
  • 1.1.2 課題來源13-15
  • 1.2 國內(nèi)外相關(guān)研究15-18
  • 1.2.1 共享變量模型15
  • 1.2.2 數(shù)據(jù)并行模型15-16
  • 1.2.3 消息傳遞模型16-18
  • 1.2.3.1 MPI現(xiàn)有的實(shí)現(xiàn)16-17
  • 1.2.3.2 MPI研究熱點(diǎn)17-18
  • 1.3 論文主要工作18-19
  • 1.4 論文組織結(jié)構(gòu)19-20
  • 第二章 MPI程序設(shè)計(jì)與性能評估20-29
  • 2.1 MPI并行程序設(shè)計(jì)方法20-25
  • 2.1.1 MPI并行程序設(shè)計(jì)步驟20-21
  • 2.1.2 矩陣乘法MPI設(shè)計(jì)實(shí)例21-25
  • 2.2 MPI并行程序性能分析25-27
  • 2.2.1 執(zhí)行時間25-26
  • 2.2.2 加速比與效率26-27
  • 2.3 MPI并行程序開銷分析27-28
  • 2.4 本章小結(jié)28-29
  • 第三章 基于FT-C6XX多核DSP的MPI移植實(shí)現(xiàn)29-58
  • 3.1 實(shí)驗(yàn)平臺、開發(fā)調(diào)試環(huán)境介紹以及調(diào)試步驟分析29-31
  • 3.1.1 實(shí)驗(yàn)平臺、開發(fā)調(diào)試環(huán)境介紹29-30
  • 3.1.2 在FT-C6XX多核DSP上調(diào)試MPI程序步驟分析30-31
  • 3.2 MPICH總體結(jié)構(gòu)31-33
  • 3.2.1 MPI接口實(shí)現(xiàn)層31-32
  • 3.2.2 MPI抽象設(shè)備層32-33
  • 3.2.3 MPI通道接口層33
  • 3.3 移植過程分析及移植難點(diǎn)33-36
  • 3.3.1 移植實(shí)現(xiàn)過程分析33-35
  • 3.3.2 MPI移植難點(diǎn)分析35-36
  • 3.4 binutils二進(jìn)制工具集移植36-38
  • 3.4.1 BFD庫的移植36-37
  • 3.4.2 匯編器GNU AS移植37-38
  • 3.4.3 鏈接器GNU LD移植38
  • 3.5 GCC編譯器移植38-41
  • 3.5.1 ftc6xx.h文件39
  • 3.5.2 ftc6xx.c文件39-40
  • 3.5.3 ftc6xx.md文件40-41
  • 3.6 uclibc庫的移植41-42
  • 3.7 MPI的通信模塊移植實(shí)現(xiàn)42-50
  • 3.7.1 基于FT-C6XX多核DSP的MPI核間共享內(nèi)存實(shí)現(xiàn)42-46
  • 3.7.1.1 共享內(nèi)存初始化43-45
  • 3.7.1.2 共享內(nèi)存動態(tài)申請45
  • 3.7.1.3 共享內(nèi)存動態(tài)釋放45-46
  • 3.7.2 基于FT-C6XX多核DSP的MPI消息隊(duì)列實(shí)現(xiàn)46-48
  • 3.7.2.1 消息隊(duì)列創(chuàng)建與釋放46-47
  • 3.7.2.2 消息隊(duì)列的初始化47
  • 3.7.2.3 消息隊(duì)列管理47-48
  • 3.7.3 基于共享內(nèi)存SM的消息傳遞方法48-50
  • 3.8 多核通信同步方式的移植實(shí)現(xiàn)50-56
  • 3.8.1 基于核間中斷管理的同步方式50-52
  • 3.8.2 基于核間共享信號量的同步方式52-54
  • 3.8.2.1 信號量管理的工作原理52-53
  • 3.8.2.2 創(chuàng)建/刪除一個信號量53-54
  • 3.8.3 基于柵欄的核間任務(wù)同步方式54-56
  • 3.8.3.1 在FT-C6XX多核DSP上設(shè)計(jì)柵欄54-55
  • 3.8.3.2 柵欄的初始化55-56
  • 3.9 MPI的配置及編譯56-57
  • 3.10 本章小結(jié)57-58
  • 第四章 FT-C6XX的MPI進(jìn)程間通信性能優(yōu)化58-68
  • 4.1 基于共享內(nèi)存的消息隊(duì)列的消息傳遞方法及其優(yōu)化方法58-62
  • 4.1.1 基于共享內(nèi)存的消息隊(duì)列的消息傳遞方法58-59
  • 4.1.2 使用lock_free_queue對消息傳遞方法進(jìn)行優(yōu)化59-60
  • 4.1.3 Fastbox的旁路隊(duì)列機(jī)制60-61
  • 4.1.4“影子指針”的使用61-62
  • 4.2 單拷貝技術(shù)的應(yīng)用62-65
  • 4.3 FT-C6XX多核DSP上基于MPI的DMA消息傳遞方法65-67
  • 4.3.1 直接使用DMA搬移方式的消息傳遞方法65-66
  • 4.3.2 基于nemesis通道的LMT接口的DMA消息傳遞方法66-67
  • 4.4 本章小結(jié)67-68
  • 第五章 基于FT-C6XX多核DSP的MPI程序性能測試68-83
  • 5.1 用數(shù)值積分法計(jì)算圓周率π68-72
  • 5.1.1 計(jì)算圓周率π的MPI并行算法68-70
  • 5.1.2 π值計(jì)算MPI并行程序測試結(jié)果及分析70-72
  • 5.2 矩陣運(yùn)算并行計(jì)算72-77
  • 5.2.1 矩陣乘法算法分析72-73
  • 5.2.2 矩陣乘法MPI并行程序測試及分析73-77
  • 5.3 fft快速傅里葉變換算法77-82
  • 5.3.1 對MPI進(jìn)程間通信性能優(yōu)化前fft.c程序測試及分析77-79
  • 5.3.2 對MPI進(jìn)程間通信性能優(yōu)化后fft.c程序測試及分析79-82
  • 5.4 本章小結(jié)82-83
  • 第六章 總結(jié)與展望83-85
  • 6.1 全文總結(jié)83-84
  • 6.2 展望84-85
  • 致謝85-86
  • 參考文獻(xiàn)86-89
  • 作者在學(xué)期間取得的學(xué)術(shù)成果89

【相似文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前10條

1 逄煥眾;用于進(jìn)程間通信的消息隊(duì)列探討[J];中國金融電腦;1998年08期

2 周世杰;劉錦德;秦志光;;消息隊(duì)列技術(shù)研究:綜述與一個實(shí)例[J];計(jì)算機(jī)科學(xué);2002年02期

3 孟昭勇;對“消息”的初步認(rèn)識[J];現(xiàn)代制造工程;2003年S1期

4 鄧波;防止消息隊(duì)列阻塞的辦法[J];華南金融電腦;2003年06期

5 杜毅,楊金生,吳震華;Linux消息隊(duì)列分析及應(yīng)用[J];計(jì)算機(jī)工程;2004年S1期

6 王強(qiáng);在數(shù)據(jù)庫開發(fā)中巧用消息隊(duì)列[J];計(jì)算機(jī)與現(xiàn)代化;2005年11期

7 曹婧華;冉彥中;許志軍;;分布式消息隊(duì)列的設(shè)計(jì)與實(shí)現(xiàn)[J];河南科技大學(xué)學(xué)報(bào)(自然科學(xué)版);2010年04期

8 穆榮均;;消息隊(duì)列漫談[J];程序員;2010年11期

9 JEFF PROSISE ,楊慧中;第二消息循環(huán)[J];個人電腦;1995年07期

10 沈華峰;;如何實(shí)現(xiàn)進(jìn)程通信的程序設(shè)計(jì)——消息隊(duì)列方法[J];上海微型計(jì)算機(jī);1998年16期

中國重要會議論文全文數(shù)據(jù)庫 前2條

1 張磊;陳犖;吳秋云;李軍;;基于消息隊(duì)列的分布式信息查詢技術(shù)的研究與實(shí)現(xiàn)[A];第二十屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報(bào)告篇)[C];2003年

2 郭杰;;基于NoSQL的持久化消息隊(duì)列設(shè)計(jì)實(shí)現(xiàn)[A];全國冶金自動化信息網(wǎng)2014年會論文集[C];2014年

中國重要報(bào)紙全文數(shù)據(jù)庫 前7條

1 楊海平 姚洪利;多線程數(shù)據(jù)共享與線程同步[N];中國計(jì)算機(jī)報(bào);2001年

2 劉錟;實(shí)現(xiàn)嵌入式系統(tǒng)并發(fā)任務(wù)間的通信[N];計(jì)算機(jī)世界;2005年

3 諶力;Sun謹(jǐn)慎開源Java核心[N];網(wǎng)絡(luò)世界;2006年

4 ;詳解.NET的RAD功能[N];中國計(jì)算機(jī)報(bào);2001年

5 中石油昆侖天然氣利用有限公司 謝梟;定位系統(tǒng) 守護(hù)危險(xiǎn)化學(xué)品運(yùn)輸[N];計(jì)算機(jī)世界;2011年

6 于翔;微軟公開M語言加快開放步伐[N];網(wǎng)絡(luò)世界;2008年

7 《網(wǎng)絡(luò)世界》記者 于翔;Oracle Tuxedo將針對Exalogic展開持續(xù)優(yōu)化[N];網(wǎng)絡(luò)世界;2012年

中國博士學(xué)位論文全文數(shù)據(jù)庫 前2條

1 盧本捷;分布式消息隊(duì)列的理論、實(shí)現(xiàn)與應(yīng)用[D];華中科技大學(xué);2004年

2 苑洪亮;基于內(nèi)容的“發(fā)布/訂閱”若干關(guān)鍵技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2006年

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 袁浩東;基于LabVLEW的通用數(shù)據(jù)采集系統(tǒng)的設(shè)計(jì)[D];西南交通大學(xué);2015年

2 史須勇;ICT通信服務(wù)器體系結(jié)構(gòu)的設(shè)計(jì)與實(shí)現(xiàn)[D];中國科學(xué)院研究生院(沈陽計(jì)算技術(shù)研究所);2015年

3 黃寶鋮;游戲精準(zhǔn)營銷中轉(zhuǎn)服務(wù)器的設(shè)計(jì)與實(shí)現(xiàn)[D];哈爾濱工業(yè)大學(xué);2015年

4 陳瑤;基于Node.js高并發(fā)web系統(tǒng)的研究與應(yīng)用[D];電子科技大學(xué);2014年

5 鄧文;川慶公司云模式網(wǎng)絡(luò)預(yù)警系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2014年

6 宋強(qiáng);基于windows平臺的分布式控制系統(tǒng)設(shè)計(jì)[D];西安電子科技大學(xué);2014年

7 張晶;智慧交通OD分析系統(tǒng)的設(shè)計(jì)和構(gòu)建[D];南京郵電大學(xué);2015年

8 李澤平;嵌入式微系統(tǒng)msOS的設(shè)計(jì)與應(yīng)用[D];江西科技師范大學(xué);2015年

9 劉海濤;武警部隊(duì)(支隊(duì)級)勤務(wù)管理系統(tǒng)設(shè)計(jì)與開發(fā)[D];西安工程大學(xué);2015年

10 廖坤;基于FT-C6XX多核DSP的MPI移植實(shí)現(xiàn)與優(yōu)化[D];國防科學(xué)技術(shù)大學(xué);2015年


  本文關(guān)鍵詞:基于FT-C6XX多核DSP的MPI移植實(shí)現(xiàn)與優(yōu)化,由筆耕文化傳播整理發(fā)布。

,

本文編號:272352

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/272352.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶3edc9***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
av中文字幕一区二区三区在线| 欧美日韩校园春色激情偷拍| 区一区二区三中文字幕| 一区二区在线激情视频| 日韩人妻有码一区二区| 麻豆一区二区三区精品视频| 青青操视频在线播放免费| 国产一二三区不卡视频| 日韩国产亚洲一区二区三区| 亚洲国产香蕉视频在线观看| 午夜小视频成人免费看| 黄片在线观看一区二区三区| 又黄又色又爽又免费的视频| 国产精品99一区二区三区| 国产又粗又硬又大又爽的视频| 国产一区二区三区草莓av| 中文字幕一二区在线观看| 男女午夜福利院在线观看| 91人妻人澡人人爽人人精品 | 久久黄片免费播放大全| 日本加勒比在线观看一区| 老司机精品在线你懂的| 亚洲一区二区三区熟女少妇| 欧美一区二区三区性视频| 欧美一区日韩二区亚洲三区| 亚洲午夜福利不卡片在线| 亚洲最大的中文字幕在线视频| 国产日产欧美精品视频| 国产精品十八禁亚洲黄污免费观看| 中文字幕不卡欧美在线| 欧洲亚洲精品自拍偷拍| 亚洲天堂一区在线播放| 欧美日韩国产精品第五页| 在线观看中文字幕91| 东京热电东京热一区二区三区 | 日本不卡在线视频你懂的| 日韩人妻有码一区二区| 精品国产亚洲免费91| 国产一区二区三区草莓av| 极品少妇一区二区三区精品视频 | 不卡一区二区高清视频|