基于GPU的通信基帶信號處理并行算法設計
本文關鍵詞:基于GPU的通信基帶信號處理并行算法設計
更多相關文章: GPU 并行 MIMO MMSE檢測算法 Turbo碼
【摘要】:SDR平臺在對通信基帶信號處理算法進行研究和實現(xiàn)時是不可或缺的。傳統(tǒng)的SDR平臺使用DSP和FPGA的混合架構(gòu),無法在達到高的系統(tǒng)吞吐率的同時進行快速開發(fā)。由于GPU提供了強大的并行計算能力和簡單易用的編程平臺,所以本文主要探索在SDR平臺上使用GPU進行通信基帶信號處理算法的設計和實現(xiàn)方法。首先,本文介紹了GPU的硬件結(jié)構(gòu)和針對GPU進行編程的CUDA平臺。通過對GPU的硬件結(jié)構(gòu)和GPU的各級存儲器的訪問延時進行研究,得到了在GPU上運行算法的最優(yōu)策略。其次,本文在GPU中實現(xiàn)了MIMO系統(tǒng)中的MMSE檢測算法。討論了在GPU中實現(xiàn)基本矩陣運算的方法。根據(jù)GPU的硬件結(jié)構(gòu),在GPU中使用三個級聯(lián)的kernel實現(xiàn)了聯(lián)合優(yōu)化的MMSE檢測算法。在MMSE檢測算法中,矩陣求逆是最復雜的。本文通過對GPU共享內(nèi)存的使用進行優(yōu)化,高效地實現(xiàn)了基于Gauss Jordan算法的矩陣求逆運算。在GPU中仿真了16QAM調(diào)制的4?4 MIMO系統(tǒng)和4?8MIMO系統(tǒng)。最后,本文在GPU上實現(xiàn)了三種滿足3GPP LTE標準的Turbo譯碼器,分別為傳統(tǒng)Turbo譯碼器、分段并行Turbo譯碼器和全并行Turbo譯碼器。在傳統(tǒng)Turbo譯碼器中,實現(xiàn)了多碼字并行和8狀態(tài)并行。在前向迭代和后向迭代中,通過使用共享內(nèi)存和寄存器保證了對全局內(nèi)存只進行一次訪問。在外信息的計算中,通過使用共享內(nèi)存,讓8個線程交替對8個狀態(tài)和8個時刻進行并行,充分利用了計算資源。在分段并行Turbo譯碼器中,進一步實現(xiàn)了單個碼字的多子碼并行,同時使用PIVI補償算法保證了誤碼性能。在全并行Turbo譯碼器中,使用了CPU外層迭代配合GPU內(nèi)層迭代的算法。在內(nèi)層迭代中使用了兩組共享內(nèi)存對?,?進行乒乓更新,為了保證誤碼性能,對?的初始值和?的結(jié)束值使用非同步的方式進行更新。在GPU中實現(xiàn)了基于FULL-LOG-MAP和MAX-LOG-MAP算法的上述三種Turbo譯碼器。仿真結(jié)果顯示,在GPU中實現(xiàn)的MMSE檢測算法可以達到84Mbps的吞吐率,Turbo譯碼器算法能達到28Mbps的吞吐率。因此,GPU可以作為SDR平臺中DSP和FPGA的替代方案。
【關鍵詞】:GPU 并行 MIMO MMSE檢測算法 Turbo碼
【學位授予單位】:電子科技大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TN911.7
【目錄】:
- 摘要5-6
- abstract6-13
- 第一章 緒論13-17
- 1.1 研究背景和現(xiàn)狀13-15
- 1.1.1 GPU在SDR平臺上的應用13-14
- 1.1.2 MIMO中MMSE檢測算法概述14
- 1.1.3 Turbo編譯碼器概述14-15
- 1.2 本文的組織結(jié)構(gòu)15-17
- 第二章 GPGPU及CUDA平臺介紹17-26
- 2.1 GPU硬件結(jié)構(gòu)17-20
- 2.2 CUDA計算平臺20-24
- 2.2.1 計算模型20-21
- 2.2.2 線程分配21-23
- 2.2.3 線程調(diào)度23-24
- 2.3 本章小結(jié)24-26
- 第三章 基于GPU的MMSE檢測算法實現(xiàn)26-40
- 3.1 矩陣運算的GPU并行實現(xiàn)26-29
- 3.1.1 矩陣共軛轉(zhuǎn)置GPU并行實現(xiàn)26
- 3.1.2 矩陣乘法GPU并行實現(xiàn)26-27
- 3.1.3 矩陣加法GPU并行實現(xiàn)27
- 3.1.4 矩陣求逆GPU并行實現(xiàn)27-29
- 3.2 MIMO中的MMSE檢測算法29-30
- 3.3 MMSE檢測算法GPU實現(xiàn)30-39
- 3.3.1 MMSE檢測算法GPU優(yōu)化實現(xiàn)30-32
- 3.3.2 GPU實現(xiàn)細節(jié)32-36
- 3.3.3 仿真結(jié)果分析36-39
- 3.4 本章小結(jié)39-40
- 第四章 基于GPU的Turbo譯碼器實現(xiàn)40-71
- 4.1 Turbo編譯碼器原理40-46
- 4.1.1 3GPP LTE Turbo編碼器40-42
- 4.1.2 Turbo譯碼算法42-46
- 4.2 傳統(tǒng)Turbo譯碼器GPU實現(xiàn)46-54
- 4.2.1 GPU實現(xiàn)細節(jié)47-53
- 4.2.2 仿真結(jié)果分析53-54
- 4.3 分段Turbo譯碼器GPU實現(xiàn)54-62
- 4.3.1 GPU實現(xiàn)細節(jié)56-60
- 4.3.2 仿真結(jié)果分析60-62
- 4.4 全并行Turbo譯碼器實現(xiàn)62-69
- 4.4.1 GPU實現(xiàn)細節(jié)64-67
- 4.4.2 仿真結(jié)果分析67-69
- 4.5 本章小結(jié)69-71
- 第五章 總結(jié)與展望71-73
- 5.1 本文工作總結(jié)71
- 5.2 未來工作展望71-73
- 致謝73-74
- 參考文獻74-77
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 伍新民;老調(diào)重彈內(nèi)存條[J];微電腦世界;1997年09期
2 井明倫;優(yōu)化微機內(nèi)存配置 開發(fā)利用內(nèi)存資源[J];實驗室研究與探索;1999年04期
3 吳言;內(nèi)存[J];電腦;1997年08期
4 ;榨干本本內(nèi)存最后一滴油[J];電腦愛好者;2008年19期
5 沈展;許勇;劉項陽;;一種基于減少內(nèi)存訪問的Pruning Fast DCT算法改進[J];科技信息;2011年13期
6 Jennie Grosslight;;查找間歇性內(nèi)存故障原因 顯著提高調(diào)試高速內(nèi)存效率[J];電子測試;2005年01期
7 Tim Melchior,雷天石;緩解內(nèi)存訪問的瓶頸[J];今日電子;2000年12期
8 文富榮,胡多勛;基于Windows的DLL編程技術(shù)及應用[J];湖北師范學院學報(自然科學版);2001年03期
9 梁岸兵,羅琨,劉浩;一種利用擴展內(nèi)存的編程方法[J];安徽大學學報(自然科學版);1998年02期
10 劉曉芳;;內(nèi)存條的技術(shù)與服務[J];世界計算機周刊;1998年04期
中國重要會議論文全文數(shù)據(jù)庫 前2條
1 陳愷;馮登國;曲海鵬;張穎君;;高速以太網(wǎng)即時監(jiān)控可定制內(nèi)存訪問模型[A];全國網(wǎng)絡與信息安全技術(shù)研討會論文集(下冊)[C];2007年
2 劉金廣;陳繼承;葉豐華;李仁剛;李鵬,
本文編號:662046
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/662046.html