基于OpenMP的多核DSP并行優(yōu)化方法的研究及應(yīng)用
本文關(guān)鍵詞:基于OpenMP的多核DSP并行優(yōu)化方法的研究及應(yīng)用
更多相關(guān)文章: Open MP 并行優(yōu)化 多核DSP H.264
【摘要】:近年來,隨著多核處理器逐漸成為市場(chǎng)主流,多核編程標(biāo)準(zhǔn)也愈加受到關(guān)注。目前主流的多核編程標(biāo)準(zhǔn)主要有兩個(gè):Open MP和MPI。相比于面向消息傳遞系統(tǒng)結(jié)構(gòu)的多核編程標(biāo)準(zhǔn)MPI,Open MP的使用更加簡(jiǎn)單與方便,因此以O(shè)pen MP為代表的面向共享存儲(chǔ)系統(tǒng)結(jié)構(gòu)的編程標(biāo)準(zhǔn)隨著多核技術(shù)的普及與進(jìn)步而迅速發(fā)展。如何能夠有效利用Open MP特性,從而最大程度地挖掘程序中潛在的并行性,以及如何探索一系列針對(duì)Open MP程序的優(yōu)化方法,對(duì)于未來的多核技術(shù)的發(fā)展具有十分重要的實(shí)踐意義與價(jià)值。本文的研究工作主要包括以下兩個(gè)方面:(1)本文以飛騰多核DSP為課題研究背景,從并行計(jì)算理論出發(fā),研究了Open MP編程模型及其相關(guān)特性,針對(duì)Open MP程序的開發(fā)流程提出了基于Open MP的并行優(yōu)化流程,總結(jié)了Open MP程序開發(fā)過程中的優(yōu)化方法與策略,并在飛騰多核DSP平臺(tái)上結(jié)合基準(zhǔn)測(cè)試程序UTDSP對(duì)性能優(yōu)化方法進(jìn)行了測(cè)試,驗(yàn)證了優(yōu)化方法的有效性。(2)針對(duì)開源解碼程序FFmpeg的H.264解碼部分進(jìn)行了移植,在飛騰多核DSP平臺(tái)上利用相關(guān)分析工具統(tǒng)計(jì)出程序中的熱點(diǎn)區(qū)域和模塊,結(jié)合Open MP特性對(duì)熱點(diǎn)區(qū)域和模塊進(jìn)行了優(yōu)化分析,進(jìn)而設(shè)計(jì)并實(shí)現(xiàn)了基于Open MP的優(yōu)化方案,并最終在飛騰多核DSP平臺(tái)上完成了測(cè)試,從而快速而有效地提升了H.264解碼程序的性能,使得程序性能獲得了近20%的提升,同時(shí)也驗(yàn)證了Open MP并行優(yōu)化所具有高效便捷的優(yōu)點(diǎn)。
【關(guān)鍵詞】:Open MP 并行優(yōu)化 多核DSP H.264
【學(xué)位授予單位】:國防科學(xué)技術(shù)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2014
【分類號(hào)】:TP332
【目錄】:
- 摘要9-10
- ABSTRACT10-11
- 第一章 引言11-15
- 1.1 課題研究背景11-13
- 1.2 課題研究意義13
- 1.3 主要研究工作13-14
- 1.4 論文組織結(jié)構(gòu)14-15
- 第二章 并行計(jì)算與 Open MP 并行優(yōu)化15-37
- 2.1 并行計(jì)算平臺(tái)15-17
- 2.1.1 共享地址空間平臺(tái)15-16
- 2.1.2 消息傳遞平臺(tái)16
- 2.1.3 嵌入式多核DSP平臺(tái)16-17
- 2.2 并行算法17-21
- 2.2.1 并行算法分解技術(shù)17-18
- 2.2.2 并行算法性能評(píng)價(jià)18-19
- 2.2.3 并行算法開銷分析19-21
- 2.3 Open MP編程模型21-28
- 2.3.1 Open MP簡(jiǎn)介21-22
- 2.3.2 Open MP編程要素22-25
- 2.3.3 Open MP并行程序開發(fā)形式25-26
- 2.3.4 Open MP編程模型中影響性能的因素26-28
- 2.4 基于Open MP的并行優(yōu)化流程28-32
- 2.4.1 串行程序熱點(diǎn)分析29
- 2.4.2 建立并行算法模型29-30
- 2.4.3 測(cè)試評(píng)價(jià)30-32
- 2.4.4 性能優(yōu)化32
- 2.5 Open MP并行優(yōu)化方法與策略32-36
- 2.5.1 調(diào)整算法結(jié)構(gòu)32
- 2.5.2 優(yōu)化調(diào)度策略32-33
- 2.5.3 重構(gòu)并行域33-34
- 2.5.4 嵌套循環(huán)優(yōu)化34
- 2.5.5 Cache命中率優(yōu)化34-36
- 2.6 本章小結(jié)36-37
- 第三章 基于Open MP的UTDSP的測(cè)試與并行優(yōu)化37-50
- 3.1 UTDSP簡(jiǎn)介37
- 3.2 實(shí)驗(yàn)平臺(tái)37-38
- 3.3 UTDSP的測(cè)試38-48
- 3.3.1 矩陣乘法38-40
- 3.3.2 快速傅立葉變換40-42
- 3.3.3 DCT壓縮42-44
- 3.3.4 圖像邊緣檢測(cè)44-46
- 3.3.5 直方圖均衡46-48
- 3.4 結(jié)果分析48-49
- 3.5 本章小結(jié)49-50
- 第四章 基于Open MP的H.264 解碼程序的并行優(yōu)化50-66
- 4.1 H.264 標(biāo)準(zhǔn)概述50
- 4.2 H.264 解碼器的選擇50
- 4.3 FFmpeg的剪裁與移植50-52
- 4.4 解碼程序分析52-53
- 4.4.1 程序結(jié)構(gòu)分析52-53
- 4.4.2 程序熱點(diǎn)分析53
- 4.5 并行優(yōu)化方法53-64
- 4.5.1 Open MP并行化方法53-55
- 4.5.2 熵解碼優(yōu)化55-56
- 4.5.3 運(yùn)動(dòng)預(yù)測(cè)及補(bǔ)償優(yōu)化56-59
- 4.5.4 環(huán)路濾波優(yōu)化59-64
- 4.6 試驗(yàn)結(jié)果64-65
- 4.7 本章小結(jié)65-66
- 第五章 結(jié)束語66-68
- 5.1 總結(jié)66-67
- 5.2 下一步工作67-68
- 致謝68-69
- 參考文獻(xiàn)69-72
- 作者在學(xué)期間取得的學(xué)術(shù)成果72
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前9條
1 徐勝利;;利用OpenMP技術(shù)實(shí)現(xiàn)線性方程組并行求解[J];信息網(wǎng)絡(luò)安全;2013年05期
2 陳瑋;郎濤;;H.264視頻解碼的OpenMP并行優(yōu)化[J];計(jì)算機(jī)系統(tǒng)應(yīng)用;2011年03期
3 張燕燕;洪龍;;Windows環(huán)境下FFT多核并行算法的設(shè)計(jì)實(shí)現(xiàn)[J];計(jì)算機(jī)技術(shù)與發(fā)展;2010年09期
4 黃國睿;張平;魏廣博;;多核處理器的關(guān)鍵技術(shù)及其發(fā)展趨勢(shì)[J];計(jì)算機(jī)工程與設(shè)計(jì);2009年10期
5 任小西;唐玲;張杰;;基于OpenMP多線程動(dòng)態(tài)負(fù)載均衡技術(shù)研究[J];世界科技研究與發(fā)展;2008年03期
6 鄭鋒;李名世;蔡佳佳;;基于OpenMP的并行遺傳算法探討[J];心智與計(jì)算;2007年04期
7 賴建新;胡長(zhǎng)軍;趙宇迪;王生原;張素琴;;OpenMP任務(wù)調(diào)度開銷及負(fù)載均衡分析[J];計(jì)算機(jī)工程;2006年18期
8 李建江,舒繼武,陳永健,王鼎興,鄭緯民;Analysis of Factors Affecting Execution Performance of OpenMP Programs[J];Tsinghua Science and Technology;2005年03期
9 李建江,舒繼武,陳永健,王鼎興;OpenMP源程序級(jí)同步段負(fù)載監(jiān)測(cè)方法與均衡策略[J];電子學(xué)報(bào);2005年05期
,本文編號(hào):711782
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/711782.html