天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 理工論文 > 氣象學(xué)論文 >

樸素貝葉斯分類算法在降雨預(yù)測中的研究與應(yīng)用

發(fā)布時間:2020-05-20 21:14
【摘要】:隨著社會的不斷進步和發(fā)展,各行各業(yè)都與氣象預(yù)報有著密切的關(guān)系,特別是對一些災(zāi)害性天氣的準(zhǔn)確預(yù)報尤為重要。與此同時科技的快速發(fā)展以及氣象觀測技術(shù)的不斷進步,積累了海量的氣象數(shù)據(jù),其中蘊藏著大量氣象規(guī)律,如何從氣象數(shù)據(jù)中獲得有價值的信息成為一項重要的研究內(nèi)容。本文主要研究樸素貝葉斯分類算法(Naive Bayesian Classif1cation,NBC)對降雨等級分類預(yù)測的問題,指出了離散化對樸素貝葉斯分類算法的有效性和屬性賦權(quán)對樸素貝葉斯分類算法的重要性,從預(yù)測因子的屬性值離散化和樸素貝葉斯分類算法假設(shè)屬性之間相互條件獨立兩個方面,來改進樸素貝葉斯分類算法。通過分析樣本氣象數(shù)據(jù),選擇出降雨預(yù)測因子,然后建立改進的樸素貝葉斯分類模型,完成對降雨等級的分類預(yù)測。本論文主要研究以下內(nèi)容:針對氣象數(shù)據(jù)集中降雨類分布的不平衡性和連續(xù)數(shù)值型屬性的離散化問題,提出了改進的類-屬性關(guān)聯(lián)離散化算法(Class-Attribute Interdependency Discretization,CAID)。通過分析類與屬性的二維量化矩陣后,充分考慮了氣象數(shù)據(jù)在屬性中的分布情況,同時結(jié)合了不同的離散標(biāo)準(zhǔn),提出了改進的離散化準(zhǔn)則CAID,然后基于該準(zhǔn)則設(shè)計實現(xiàn)了CAID算法。該算法從候選斷點集中選擇出最佳的斷點,把屬性域分割成若干區(qū)間,在信息損失最少的情況下得到更加合理的離散化方案,并提高了少數(shù)降雨類的識別率,更加有利于后續(xù)模型的學(xué)習(xí)。然后在CAID算法離散后的真實氣象數(shù)據(jù)上構(gòu)建一種基于CAID算法的樸素貝葉斯分類模型(D-NBC),實現(xiàn)對降雨等級的分類預(yù)測。通過分析對比實驗結(jié)果,驗證了本文提出的算法可以更好的解決氣象數(shù)據(jù)中連續(xù)數(shù)值型屬性的離散化問題,相比較其它算法在后續(xù)的分類預(yù)測中有更好的性能提升。針對樸素貝葉斯分類算法假設(shè)屬性之間相互條件獨立的問題,為了提高樸素貝葉斯分類算法的分類精度,提出一種基于屬性加權(quán)的改進樸素貝葉斯分類算法(INBC),該算法使用互信息與條件互信息綜合確定每個屬性的權(quán)值,以此來削弱屬性之間相互條件獨立的假設(shè),然后在CAID算法離散后的真實氣象數(shù)據(jù)下,構(gòu)建基于屬性加權(quán)的樸素貝葉斯降雨等級預(yù)測模型。對比分析實驗結(jié)果表明,本文提出的加權(quán)樸素貝葉斯分類模型具有更好的分類性能,在一定程度上提高了樸素貝葉斯模型對降雨等級分類預(yù)測的精度。
【圖文】:

對比圖,準(zhǔn)確率,等級,對比圖


圖3-3各降雨等級召回率對比圖逡逑圖3-2、3-3統(tǒng)計了邋4種模型處理同一數(shù)據(jù)集對每個降雨等級分類預(yù)測的準(zhǔn)確率回率,可以看出四種模型對C0級的分類預(yù)測準(zhǔn)確率和召回率最高,主要是所選天氣無雨樣本數(shù)比較大,但是仍然可以看出D-NBC模型的預(yù)測性能最好,其準(zhǔn)召回率分別達(dá)到88%和84%左右。從圖3-2、3-3的總體趨勢來看,相比較C-NBC逡逑D-NBC模型,經(jīng)典NBC模型的預(yù)測性能最差,說明對預(yù)測因子屬性值進行離散作,可以在一定程度上提高NBC模型的分類預(yù)測精度。隨著降雨等級分布的越來30逡逑

氣象圖,樣本容量,預(yù)測性能,分類模型


訓(xùn)練行/10*10*10逡逑圖3-4樣本容量與預(yù)測性能對比圖逡逑圖3-4統(tǒng)計了邋NBC、C-NBC、PKNN、D-NBC四種分類模型處理不同容量氣象數(shù)逡逑據(jù)的預(yù)測正確率,對比它們在相同容量下的正確率。從圖3-4可以看出,,當(dāng)樣本容量逡逑較少時,四種模型的預(yù)測性能接近,但是仍然T 以看出D-NBC模型的性能更好。從總逡逑體趨勢來看,一方面,相比較C-NBC和D-NBC模型,經(jīng)典NBC模型的性能最差,而逡逑且達(dá)到穩(wěn)定狀態(tài)的過程需要的樣本容量較大,可見,對預(yù)測因子屬性值進行離散化可逡逑以提高NBC模型的分類性能。當(dāng)數(shù)據(jù)容量為200至400行時,C-NBC、D-NBC模型逡逑的分類正確率接近,無法通過預(yù)測結(jié)果直觀的看出離散方法的好壞,主要是由于樣本逡逑較少時,少數(shù)類樣本數(shù)目極少,氣象數(shù)據(jù)中類分布不平衡性不明顯,本文提出的離散逡逑31逡逑
【學(xué)位授予單位】:南京信息工程大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:P457.6;TP181

【參考文獻】

相關(guān)期刊論文 前10條

1 張晨陽;馬志強;劉利民;常駿;李永利;;Hadoop下基于粗糙集與貝葉斯的氣象數(shù)據(jù)挖掘研究[J];計算機應(yīng)用與軟件;2015年04期

2 韓芳;孫立民;;不平衡樣本集分類算法研究[J];計算機應(yīng)用研究;2015年08期

3 胡邦輝;劉善亮;席巖;王學(xué)忠;游大鳴;張惠君;;一種Bayes降水概率預(yù)報的最優(yōu)子集算法[J];應(yīng)用氣象學(xué)報;2015年02期

4 彭昱忠;王謙;元昌安;林開平;;數(shù)據(jù)挖掘技術(shù)在氣象預(yù)報研究中的應(yīng)用[J];干旱氣象;2015年01期

5 朱軍;胡文波;;貝葉斯機器學(xué)習(xí)前沿進展綜述[J];計算機研究與發(fā)展;2015年01期

6 張清華;王進;王國胤;;粗糙模糊集的近似表示[J];計算機學(xué)報;2015年07期

7 陳凱;王立松;;一種新的加權(quán)最近鄰算法的降水預(yù)報試驗[J];計算機仿真;2014年06期

8 賈嫻;劉培玉;公偉;;基于改進屬性加權(quán)的樸素貝葉斯入侵取證研究[J];計算機工程與應(yīng)用;2013年07期

9 馬勇;仝瑤瑤;程玉虎;;一種改進的最大相關(guān)最小冗余選擇性貝葉斯分類器[J];北京科技大學(xué)學(xué)報;2012年01期

10 楊萍;楊天社;杜小寧;李濟生;黃永宣;;一種基于類別屬性關(guān)聯(lián)程度最大化離散算法[J];控制與決策;2011年04期

相關(guān)碩士學(xué)位論文 前7條

1 李彩鳳;不平衡數(shù)據(jù)的離散化算法及其并行化[D];哈爾濱工業(yè)大學(xué);2017年

2 張永芳;基于Hadoop平臺的并行數(shù)據(jù)挖掘算法研究[D];安徽理工大學(xué);2016年

3 杜婷;基于屬性選擇的樸素貝葉斯分類研究與應(yīng)用[D];中國科學(xué)技術(shù)大學(xué);2016年

4 喻凱西;樸素貝葉斯分類算法的改進及其應(yīng)用[D];北京林業(yè)大學(xué);2016年

5 楊利娟;基于Hadoop云平臺的數(shù)據(jù)挖掘技術(shù)在天氣數(shù)據(jù)的應(yīng)用研究[D];北京郵電大學(xué);2015年

6 閆永剛;基于Hadoop的KNN分類在降水中的研究[D];南京信息工程大學(xué);2013年

7 劉寅;Hadoop下基于貝葉斯分類的氣象數(shù)據(jù)挖掘研究[D];南京信息工程大學(xué);2012年



本文編號:2673211

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/projectlw/qxxlw/2673211.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶78c21***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com