基于決策樹的空氣質(zhì)量建模
【文章頁數(shù)】:3 頁
【部分圖文】:
圖1系統(tǒng)總體設(shè)計(jì)
對(duì)缺省數(shù)據(jù)進(jìn)行處理等。1.3CART算法使用基尼指數(shù)準(zhǔn)則用于決策樹劃分選擇。決策樹算法是一種預(yù)測(cè)模型,描述了對(duì)象屬性與對(duì)象值之間的一種映射關(guān)系,是上個(gè)世紀(jì)60年代到70年代提出的一種用于數(shù)據(jù)分類的算法。自提出以來,就一直不斷發(fā)展,精益求精,從ID3,ID4到CART決策樹算法,再....
圖2criterion算法學(xué)習(xí)曲線
使用相同的方法,得到其他參數(shù)的學(xué)習(xí)曲線。經(jīng)過超參數(shù)學(xué)習(xí)曲線調(diào)整后,大概知道了數(shù)據(jù)的范圍。然后利用網(wǎng)格搜索法搜索最佳的數(shù)值,其模型最佳參數(shù)組合如表2所示。圖3max_depth學(xué)習(xí)曲線
圖3max_depth學(xué)習(xí)曲線
圖2criterion算法學(xué)習(xí)曲線表2網(wǎng)格搜索后的參數(shù)參數(shù)criterionmax_depthmin_samples_leafmin_samples_splitmax_features數(shù)值entropy4293
圖1不調(diào)參的效果圖
選取數(shù)據(jù)集的70%作為訓(xùn)練集,30%用作測(cè)試集。在不加限制情況下,一顆決策樹可以生長到純度最優(yōu),這樣就會(huì)出現(xiàn)在訓(xùn)練集上效果很好,但是在測(cè)試集上效果很差的狀況,把這種現(xiàn)象稱為過擬合[2]。首先在不設(shè)置任何參數(shù)的情況下,查看決策樹算法在訓(xùn)練集和測(cè)試集上的執(zhí)行效果,如圖1所示。從圖中可....
本文編號(hào):3964079
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3964079.html