球諧函數展開快速算法及其并行算法研究
發(fā)布時間:2021-05-06 17:54
計算機技術的迅速發(fā)展促進了數值天氣預報模式的不斷推進,并使偏微分方程離散化相關的數值方法變得更加完善和精確,從而減小了求偏微分方程數值解的誤差。譜變換方法采用球諧函數的有限截斷展開來逼近球面某垂直層上的狀態(tài)變量,充分利用變量在物理空間和譜空間之間的適當變換,有效降低偏微分方程中以非線性項為主的計算量,進而獲得高精度的計算解。其中物理空間由狀態(tài)變量在經緯度格點的直積組成,譜空間由狀態(tài)變量對應的截斷球諧函數展開系數組成。譜模式具有精度高、穩(wěn)定性好等優(yōu)點,但其運算量和存儲量較大。球諧函數展開作為一種數學方法,被廣泛應用于數值天氣預報模式、地球物理、化學物理、偏微分方程數值解等眾多領域。球諧函數是球面緯向微分算子以及球面Laplace算子的特征函數;谇蛑C函數的譜變換,是譜模式計算中的核心問題,涉及Fourier變換和Legendre變換,其中Fourier變換應用于經度方向,Legendre變換應用于緯度方向。本文基于Rokhlin-Tygert球諧函數展開快速算法,深入研究了算法的并行化問題,主要內容包括:(1)分析數值天氣預報譜模式以及球諧函數的特點,研究了并行計算理論和技術,包括MP...
【文章來源】:國防科技大學湖南省 211工程院校 985工程院校
【文章頁數】:84 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 引言
1.1 數值天氣預報與譜模式
1.1.1 譜模式的發(fā)展與現狀
1.1.2 球諧函數與SⅠlberman 方法
1.1.3 變換法
1.1.4 譜模式的優(yōu)缺點
1.2 球諧函數
1.2.1 球諧函數的推導
1.2.2 截斷問題
1.2.3 球諧函數展開算法的發(fā)展
1.3 GPU 通用計算與數值天氣預報
1.4 本文研究內容
1.5 論文結構
第二章 CPU/GPU 異構集群研究
2.1 GPU 發(fā)展的歷史與現狀
2.2 CPU/GPU 異構集群
2.2.1 CPU 與GPU 的性能對比
2.2.2 典型CPU/GPU 異構集群
2.3 并行編程環(huán)境
2.3.1 MPⅠ 并行程序設計原理
2.3.2 CUDA 架構與編程模型
2.3.3 MPⅠ+CUDA 混合編程模型研究
第三章 球諧函數展開快速算法研究
3.1 球諧函數展開簡介
3.2 RokhlⅠn-Tygert 球諧函數展開快速算法
3.2.1 SerSTEP1:函數分解
3.2.2 SerSTEP2:快速FourⅠer 變換
3.2.2.1 余弦變換
3.2.2.2 正弦變換
3.2.3 SerSTEP3:低階連帶Legendre 多項式展開系數
3.2.4 SerSTEP4:任意階連帶Legendre 多項式展開系數
3.3 0 階Legendre 多項式展開系數的計算
3.3.1 直接法
3.3.2 變換法
3.3.3 兩種方法比較
3.4 標準特征向量矩陣的計算
3.5 RT 算法串行程序實現
第四章 RT 算法的MPⅠ 并行程序設計
4.1 RT 算法的并行策略
4.2 RT 并行算法描述
4.3 RT 并行算法的MPⅠ 實現
4.3.1 程序結構
4.3.2 通信機制
4.3.3 同步策略
4.4 RT 算法的MPⅠ 并行程序實驗及分析
4.4.1 實驗方案Ⅰ
4.4.2 實驗方案Ⅱ
4.4.3 實驗方案Ⅲ
第五章 RT 算法的MPⅠ+CUDA 并行程序設計
5.1 GPU 在RT 算法中的加速策略
5.1.1 GPU 在RT 串行算法中的加速策略
5.1.2 GPU 在RT 并行算法中的加速策略
5.2 庫函數
5.2.1 CuFFT
5.2.2 LAPACK
5.2.3 CULA
5.2.4 CulaBLAS
5.3 RT 算法的異構混合并行實現
5.3.1 RT 算法串行程序的CUDA 加速
5.3.2 RT 算法MPⅠ+CUDA 異構并行實現
5.4 RT 算法的異構并行程序實驗
5.4.1 實驗方案Ⅰ
5.4.2 實驗方案Ⅱ
5.4.3 實驗方案Ⅲ
5.4.4 實驗方案ⅠV
5.4.5 實驗方案V
第六章 結論與展望
致謝
參考文獻
作者在學期間取得的學術成果
附錄A 公式推導
【參考文獻】:
期刊論文
[1]The TianHe-1A Supercomputer: Its Hardware and Software[J]. 楊學軍,廖湘科,盧凱,胡慶豐,宋君強,蘇金樹. Journal of Computer Science & Technology. 2011(03)
[2]CPU/GPU協同并行計算研究綜述[J]. 盧風順,宋君強,銀?,張理論. 計算機科學. 2011(03)
[3]基于SMP集群的MPI+CUDA模型的研究與實現[J]. 許彥芹,陳慶奎. 計算機工程與設計. 2010(15)
[4]CUDA并行計算的應用研究[J]. 董犖,葛萬成,陳康力. 信息技術. 2010(04)
[5]CUDA高性能計算并行編程[J]. 李波,趙華成,張敏芳. 微型電腦應用. 2009(09)
[6]GPU與CPU的比較分析[J]. 鐘聯波. 技術與市場. 2009(09)
[7]使用GPU加速通用科學計算-CUDA技術解析[J]. 劉勇. 科技信息(科學教研). 2008(24)
[8]譜方法數值計算研究進展[J]. 張理論,李曉梅,宋君強. 指揮技術學院學報. 2001(06)
[9]一個基于大氣自憶原理的譜模式[J]. 谷湘潛. 科學通報. 1998(09)
[10]大氣譜模式中質量守恒格式的研究[J]. 陳嘉濱,舒靜君. 大氣科學. 1996(02)
博士論文
[1]GRAPES高分辨率氣象數值預報模式并行計算關鍵技術研究[D]. 伍湘君.國防科學技術大學 2011
碩士論文
[1]GPS掩星資料處理的GPU并行算法研究[D]. 銀?.國防科學技術大學 2010
本文編號:3172368
【文章來源】:國防科技大學湖南省 211工程院校 985工程院校
【文章頁數】:84 頁
【學位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 引言
1.1 數值天氣預報與譜模式
1.1.1 譜模式的發(fā)展與現狀
1.1.2 球諧函數與SⅠlberman 方法
1.1.3 變換法
1.1.4 譜模式的優(yōu)缺點
1.2 球諧函數
1.2.1 球諧函數的推導
1.2.2 截斷問題
1.2.3 球諧函數展開算法的發(fā)展
1.3 GPU 通用計算與數值天氣預報
1.4 本文研究內容
1.5 論文結構
第二章 CPU/GPU 異構集群研究
2.1 GPU 發(fā)展的歷史與現狀
2.2 CPU/GPU 異構集群
2.2.1 CPU 與GPU 的性能對比
2.2.2 典型CPU/GPU 異構集群
2.3 并行編程環(huán)境
2.3.1 MPⅠ 并行程序設計原理
2.3.2 CUDA 架構與編程模型
2.3.3 MPⅠ+CUDA 混合編程模型研究
第三章 球諧函數展開快速算法研究
3.1 球諧函數展開簡介
3.2 RokhlⅠn-Tygert 球諧函數展開快速算法
3.2.1 SerSTEP1:函數分解
3.2.2 SerSTEP2:快速FourⅠer 變換
3.2.2.1 余弦變換
3.2.2.2 正弦變換
3.2.3 SerSTEP3:低階連帶Legendre 多項式展開系數
3.2.4 SerSTEP4:任意階連帶Legendre 多項式展開系數
3.3 0 階Legendre 多項式展開系數的計算
3.3.1 直接法
3.3.2 變換法
3.3.3 兩種方法比較
3.4 標準特征向量矩陣的計算
3.5 RT 算法串行程序實現
第四章 RT 算法的MPⅠ 并行程序設計
4.1 RT 算法的并行策略
4.2 RT 并行算法描述
4.3 RT 并行算法的MPⅠ 實現
4.3.1 程序結構
4.3.2 通信機制
4.3.3 同步策略
4.4 RT 算法的MPⅠ 并行程序實驗及分析
4.4.1 實驗方案Ⅰ
4.4.2 實驗方案Ⅱ
4.4.3 實驗方案Ⅲ
第五章 RT 算法的MPⅠ+CUDA 并行程序設計
5.1 GPU 在RT 算法中的加速策略
5.1.1 GPU 在RT 串行算法中的加速策略
5.1.2 GPU 在RT 并行算法中的加速策略
5.2 庫函數
5.2.1 CuFFT
5.2.2 LAPACK
5.2.3 CULA
5.2.4 CulaBLAS
5.3 RT 算法的異構混合并行實現
5.3.1 RT 算法串行程序的CUDA 加速
5.3.2 RT 算法MPⅠ+CUDA 異構并行實現
5.4 RT 算法的異構并行程序實驗
5.4.1 實驗方案Ⅰ
5.4.2 實驗方案Ⅱ
5.4.3 實驗方案Ⅲ
5.4.4 實驗方案ⅠV
5.4.5 實驗方案V
第六章 結論與展望
致謝
參考文獻
作者在學期間取得的學術成果
附錄A 公式推導
【參考文獻】:
期刊論文
[1]The TianHe-1A Supercomputer: Its Hardware and Software[J]. 楊學軍,廖湘科,盧凱,胡慶豐,宋君強,蘇金樹. Journal of Computer Science & Technology. 2011(03)
[2]CPU/GPU協同并行計算研究綜述[J]. 盧風順,宋君強,銀?,張理論. 計算機科學. 2011(03)
[3]基于SMP集群的MPI+CUDA模型的研究與實現[J]. 許彥芹,陳慶奎. 計算機工程與設計. 2010(15)
[4]CUDA并行計算的應用研究[J]. 董犖,葛萬成,陳康力. 信息技術. 2010(04)
[5]CUDA高性能計算并行編程[J]. 李波,趙華成,張敏芳. 微型電腦應用. 2009(09)
[6]GPU與CPU的比較分析[J]. 鐘聯波. 技術與市場. 2009(09)
[7]使用GPU加速通用科學計算-CUDA技術解析[J]. 劉勇. 科技信息(科學教研). 2008(24)
[8]譜方法數值計算研究進展[J]. 張理論,李曉梅,宋君強. 指揮技術學院學報. 2001(06)
[9]一個基于大氣自憶原理的譜模式[J]. 谷湘潛. 科學通報. 1998(09)
[10]大氣譜模式中質量守恒格式的研究[J]. 陳嘉濱,舒靜君. 大氣科學. 1996(02)
博士論文
[1]GRAPES高分辨率氣象數值預報模式并行計算關鍵技術研究[D]. 伍湘君.國防科學技術大學 2011
碩士論文
[1]GPS掩星資料處理的GPU并行算法研究[D]. 銀?.國防科學技術大學 2010
本文編號:3172368
本文鏈接:http://sikaile.net/kejilunwen/jisuanjikexuelunwen/3172368.html