基于GPU的通信基帶信號處理并行算法設計

發(fā)布時間：2017-08-12 14:23

本文關鍵詞：基于GPU的通信基帶信號處理并行算法設計

更多相關文章： GPU 并行 MIMO MMSE檢測算法 Turbo碼

【摘要】：SDR平臺在對通信基帶信號處理算法進行研究和實現(xiàn)時是不可或缺的。傳統(tǒng)的SDR平臺使用DSP和FPGA的混合架構(gòu),無法在達到高的系統(tǒng)吞吐率的同時進行快速開發(fā)。由于GPU提供了強大的并行計算能力和簡單易用的編程平臺,所以本文主要探索在SDR平臺上使用GPU進行通信基帶信號處理算法的設計和實現(xiàn)方法。首先,本文介紹了GPU的硬件結(jié)構(gòu)和針對GPU進行編程的CUDA平臺。通過對GPU的硬件結(jié)構(gòu)和GPU的各級存儲器的訪問延時進行研究,得到了在GPU上運行算法的最優(yōu)策略。其次,本文在GPU中實現(xiàn)了MIMO系統(tǒng)中的MMSE檢測算法。討論了在GPU中實現(xiàn)基本矩陣運算的方法。根據(jù)GPU的硬件結(jié)構(gòu),在GPU中使用三個級聯(lián)的kernel實現(xiàn)了聯(lián)合優(yōu)化的MMSE檢測算法。在MMSE檢測算法中,矩陣求逆是最復雜的。本文通過對GPU共享內(nèi)存的使用進行優(yōu)化,高效地實現(xiàn)了基于Gauss Jordan算法的矩陣求逆運算。在GPU中仿真了16QAM調(diào)制的4?4 MIMO系統(tǒng)和4?8MIMO系統(tǒng)。最后,本文在GPU上實現(xiàn)了三種滿足3GPP LTE標準的Turbo譯碼器,分別為傳統(tǒng)Turbo譯碼器、分段并行Turbo譯碼器和全并行Turbo譯碼器。在傳統(tǒng)Turbo譯碼器中,實現(xiàn)了多碼字并行和8狀態(tài)并行。在前向迭代和后向迭代中,通過使用共享內(nèi)存和寄存器保證了對全局內(nèi)存只進行一次訪問。在外信息的計算中,通過使用共享內(nèi)存,讓8個線程交替對8個狀態(tài)和8個時刻進行并行,充分利用了計算資源。在分段并行Turbo譯碼器中,進一步實現(xiàn)了單個碼字的多子碼并行,同時使用PIVI補償算法保證了誤碼性能。在全并行Turbo譯碼器中,使用了CPU外層迭代配合GPU內(nèi)層迭代的算法。在內(nèi)層迭代中使用了兩組共享內(nèi)存對?,?進行乒乓更新,為了保證誤碼性能,對?的初始值和?的結(jié)束值使用非同步的方式進行更新。在GPU中實現(xiàn)了基于FULL-LOG-MAP和MAX-LOG-MAP算法的上述三種Turbo譯碼器。仿真結(jié)果顯示,在GPU中實現(xiàn)的MMSE檢測算法可以達到84Mbps的吞吐率,Turbo譯碼器算法能達到28Mbps的吞吐率。因此,GPU可以作為SDR平臺中DSP和FPGA的替代方案。
【關鍵詞】：GPU 并行 MIMO MMSE檢測算法 Turbo碼
【學位授予單位】：電子科技大學
【學位級別】：碩士
【學位授予年份】：2016
【分類號】：TN911.7
【目錄】：

摘要5-6
abstract6-13
第一章緒論13-17
1.1 研究背景和現(xiàn)狀13-15
1.1.1 GPU在SDR平臺上的應用13-14
1.1.2 MIMO中MMSE檢測算法概述14
1.1.3 Turbo編譯碼器概述14-15
1.2 本文的組織結(jié)構(gòu)15-17
第二章 GPGPU及CUDA平臺介紹17-26
2.1 GPU硬件結(jié)構(gòu)17-20
2.2 CUDA計算平臺20-24
2.2.1 計算模型20-21
2.2.2 線程分配21-23
2.2.3 線程調(diào)度23-24
2.3 本章小結(jié)24-26
第三章基于GPU的MMSE檢測算法實現(xiàn)26-40
3.1 矩陣運算的GPU并行實現(xiàn)26-29
3.1.1 矩陣共軛轉(zhuǎn)置GPU并行實現(xiàn)26
3.1.2 矩陣乘法GPU并行實現(xiàn)26-27
3.1.3 矩陣加法GPU并行實現(xiàn)27
3.1.4 矩陣求逆GPU并行實現(xiàn)27-29
3.2 MIMO中的MMSE檢測算法29-30
3.3 MMSE檢測算法GPU實現(xiàn)30-39
3.3.1 MMSE檢測算法GPU優(yōu)化實現(xiàn)30-32
3.3.2 GPU實現(xiàn)細節(jié)32-36
3.3.3 仿真結(jié)果分析36-39
3.4 本章小結(jié)39-40
第四章基于GPU的Turbo譯碼器實現(xiàn)40-71
4.1 Turbo編譯碼器原理40-46
4.1.1 3GPP LTE Turbo編碼器40-42
4.1.2 Turbo譯碼算法42-46
4.2 傳統(tǒng)Turbo譯碼器GPU實現(xiàn)46-54
4.2.1 GPU實現(xiàn)細節(jié)47-53
4.2.2 仿真結(jié)果分析53-54
4.3 分段Turbo譯碼器GPU實現(xiàn)54-62
4.3.1 GPU實現(xiàn)細節(jié)56-60
4.3.2 仿真結(jié)果分析60-62
4.4 全并行Turbo譯碼器實現(xiàn)62-69
4.4.1 GPU實現(xiàn)細節(jié)64-67
4.4.2 仿真結(jié)果分析67-69
4.5 本章小結(jié)69-71
第五章總結(jié)與展望71-73
5.1 本文工作總結(jié)71
5.2 未來工作展望71-73
致謝73-74
參考文獻74-77

【相似文獻】

中國期刊全文數(shù)據(jù)庫前10條

1 伍新民;老調(diào)重彈內(nèi)存條[J];微電腦世界;1997年09期

2 井明倫;優(yōu)化微機內(nèi)存配置開發(fā)利用內(nèi)存資源[J];實驗室研究與探索;1999年04期

3 吳言;內(nèi)存[J];電腦;1997年08期

4 ;榨干本本內(nèi)存最后一滴油[J];電腦愛好者;2008年19期

5 沈展;許勇;劉項陽;;一種基于減少內(nèi)存訪問的Pruning Fast DCT算法改進[J];科技信息;2011年13期

6 Jennie Grosslight;;查找間歇性內(nèi)存故障原因顯著提高調(diào)試高速內(nèi)存效率[J];電子測試;2005年01期

7 Tim Melchior,雷天石;緩解內(nèi)存訪問的瓶頸[J];今日電子;2000年12期

8 文富榮,胡多勛;基于Windows的DLL編程技術(shù)及應用[J];湖北師范學院學報(自然科學版);2001年03期

9 梁岸兵,羅琨,劉浩;一種利用擴展內(nèi)存的編程方法[J];安徽大學學報(自然科學版);1998年02期

10 劉曉芳;;內(nèi)存條的技術(shù)與服務[J];世界計算機周刊;1998年04期

中國重要會議論文全文數(shù)據(jù)庫前2條

1 陳愷;馮登國;曲海鵬;張穎君;;高速以太網(wǎng)即時監(jiān)控可定制內(nèi)存訪問模型[A];全國網(wǎng)絡與信息安全技術(shù)研討會論文集（下冊）[C];2007年

2 劉金廣;陳繼承;葉豐華;李仁剛;李鵬，

本文編號：662046

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/xinxigongchenglunwen/662046.html

上一篇：物聯(lián)網(wǎng)體系結(jié)構(gòu)與實現(xiàn)方法的研究
下一篇：一種單片集成的光接收電路的設計

論文發(fā)表

·知網(wǎng)|萬方|維普|龍源|省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于GPU的通信基帶信號處理并行算法設計