基于廣義極值分布的氣象數(shù)據(jù)分類與聚類算法研究
發(fā)布時間:2023-01-28 10:52
極值理論在機器學(xué)習(xí)中的應(yīng)用日益廣泛,常用于預(yù)測稀有事件的發(fā)生、刻畫不對稱的決策邊界以及估計某些距離極值的分布等.本文借助極值理論,提出了兩類改進的機器學(xué)習(xí)算法,并應(yīng)用于氣象領(lǐng)域的實際問題中.首先,對于監(jiān)督學(xué)習(xí),我們將廣義極值分布與boosting算法相結(jié)合,提出了用于不平衡樣本的二分類算法.在干旱、半干旱地區(qū)短臨降水發(fā)生概率的估計問題中,該算法在一系列評價指標上表現(xiàn)突出,且擬合的模型具備良好的可解釋性.其次,對于非監(jiān)督學(xué)習(xí),我們關(guān)注K-means聚類算法的改進.特別地,我們設(shè)計了基于極值分布的假設(shè)檢驗過程,用于識別數(shù)據(jù)中的離群點,并輔助判別聚類邊界附近樣本的歸屬.模擬實驗表明,該檢驗步驟能有效地校正K-means模型中的誤判點,從而提升模型表現(xiàn).同時,在氣象站點的聚類問題中,該算法給出了合理的聚類結(jié)果,且與常見的氣候類型劃分區(qū)域接近,為氣象研究提供了有價值的參考.
【文章頁數(shù)】:48 頁
【學(xué)位級別】:碩士
【文章目錄】:
中文摘要
Abstract
第一章 緒論
1.1 研究背景與意義
1.2 文獻綜述
1.2.1 干旱、半干旱地區(qū)的短臨降雨預(yù)報
1.2.2 不平衡樣本的二分類算法
1.2.3 K-means聚類算法
1.3 本文工作
第二章 理論基礎(chǔ)
2.1 極值定理
2.2 廣義線性模型
2.3 梯度提升算法
2.4 K-means算法
2.5 二分類問題的評價準則
2.6 聚類問題的評價準則
第三章 基于極值分布的不平衡樣本二分類算法
3.1 GEVboost算法描述
3.1.1 F(·) 的估計方法
3.1.2 參數(shù) ξ 的估計方法
3.2 模型的可解釋性
3.3 案例研究I: 澳大利亞的日降水預(yù)報
3.4 案例研究II: 甘肅省的短臨降水預(yù)報
3.4.1 研究區(qū)域
3.4.2 數(shù)據(jù)描述
3.4.3 模型表現(xiàn)
3.4.4 結(jié)果分析
第四章 基于極值分布的K-means改進算法
4.1 K-means聚類中的離群點識別與判別邊界的不確定性
4.2 基于檢驗的K-means算法
4.3 數(shù)值模擬與分析
4.4 案例研究: 甘肅省站點的氣候類型聚類
第五章 總結(jié)與展望
參考文獻
致謝
【參考文獻】:
期刊論文
[1]兩種類型短時強降水形成機理對比分析——以甘肅兩次短時強降水過程為例[J]. 許東蓓,茍尚,肖瑋,孟麗霞,沙宏娥,狄瀟泓,石延召. 高原氣象. 2018(02)
[2]近55年來中國西北地區(qū)降水變化特征及影響因素分析[J]. 劉維成,張強,傅朝. 高原氣象. 2017(06)
[3]C波段雷達資料在強降水過程中的應(yīng)用[J]. 韓文宇,楊麗麗,楊毅. 干旱氣象. 2016(01)
[4]河西走廊中部近53年降水變化及未來趨勢預(yù)測[J]. 劉洪蘭,白虎志,張俊國. 干旱區(qū)研究. 2011(01)
[5]中國氣候區(qū)劃新方案[J]. 鄭景云,尹云鶴,李炳元. 地理學(xué)報. 2010(01)
[6]甘肅省近50a夏季極端強降水量的氣候特征[J]. 張小明,楊金虎,高偉東,全志偉. 干旱氣象. 2008(02)
[7]西北地區(qū)東部干旱半干旱區(qū)極端降水事件的變化[J]. 趙慶云,張武,王式功,劉新偉. 中國沙漠. 2005(06)
[8]近40年來甘肅省降水的變化特征[J]. 林紓,陸登榮. 高原氣象. 2004(06)
[9]甘肅河?xùn)|地區(qū)降雨特征分析研究[J]. 彭素琴,楊興國,柯曉新,張旭東. 水科學(xué)進展. 1996(01)
本文編號:3732514
【文章頁數(shù)】:48 頁
【學(xué)位級別】:碩士
【文章目錄】:
中文摘要
Abstract
第一章 緒論
1.1 研究背景與意義
1.2 文獻綜述
1.2.1 干旱、半干旱地區(qū)的短臨降雨預(yù)報
1.2.2 不平衡樣本的二分類算法
1.2.3 K-means聚類算法
1.3 本文工作
第二章 理論基礎(chǔ)
2.1 極值定理
2.2 廣義線性模型
2.3 梯度提升算法
2.4 K-means算法
2.5 二分類問題的評價準則
2.6 聚類問題的評價準則
第三章 基于極值分布的不平衡樣本二分類算法
3.1 GEVboost算法描述
3.1.1 F(·) 的估計方法
3.1.2 參數(shù) ξ 的估計方法
3.2 模型的可解釋性
3.3 案例研究I: 澳大利亞的日降水預(yù)報
3.4 案例研究II: 甘肅省的短臨降水預(yù)報
3.4.1 研究區(qū)域
3.4.2 數(shù)據(jù)描述
3.4.3 模型表現(xiàn)
3.4.4 結(jié)果分析
第四章 基于極值分布的K-means改進算法
4.1 K-means聚類中的離群點識別與判別邊界的不確定性
4.2 基于檢驗的K-means算法
4.3 數(shù)值模擬與分析
4.4 案例研究: 甘肅省站點的氣候類型聚類
第五章 總結(jié)與展望
參考文獻
致謝
【參考文獻】:
期刊論文
[1]兩種類型短時強降水形成機理對比分析——以甘肅兩次短時強降水過程為例[J]. 許東蓓,茍尚,肖瑋,孟麗霞,沙宏娥,狄瀟泓,石延召. 高原氣象. 2018(02)
[2]近55年來中國西北地區(qū)降水變化特征及影響因素分析[J]. 劉維成,張強,傅朝. 高原氣象. 2017(06)
[3]C波段雷達資料在強降水過程中的應(yīng)用[J]. 韓文宇,楊麗麗,楊毅. 干旱氣象. 2016(01)
[4]河西走廊中部近53年降水變化及未來趨勢預(yù)測[J]. 劉洪蘭,白虎志,張俊國. 干旱區(qū)研究. 2011(01)
[5]中國氣候區(qū)劃新方案[J]. 鄭景云,尹云鶴,李炳元. 地理學(xué)報. 2010(01)
[6]甘肅省近50a夏季極端強降水量的氣候特征[J]. 張小明,楊金虎,高偉東,全志偉. 干旱氣象. 2008(02)
[7]西北地區(qū)東部干旱半干旱區(qū)極端降水事件的變化[J]. 趙慶云,張武,王式功,劉新偉. 中國沙漠. 2005(06)
[8]近40年來甘肅省降水的變化特征[J]. 林紓,陸登榮. 高原氣象. 2004(06)
[9]甘肅河?xùn)|地區(qū)降雨特征分析研究[J]. 彭素琴,楊興國,柯曉新,張旭東. 水科學(xué)進展. 1996(01)
本文編號:3732514
本文鏈接:http://sikaile.net/shoufeilunwen/benkebiyelunwen/3732514.html
最近更新
教材專著