天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

基于決策樹的空氣質(zhì)量建模

發(fā)布時(shí)間:2024-04-25 05:31
  為了更方便直觀的預(yù)測(cè)空氣質(zhì)量,利用決策樹算法建模。以天水市近三年空氣質(zhì)量數(shù)據(jù)為研究對(duì)象,借助scikit-learn平臺(tái)對(duì)數(shù)據(jù)進(jìn)行建模。采用交叉驗(yàn)證和網(wǎng)格搜索的調(diào)參手段,使剪枝效果達(dá)到最佳。結(jié)果表明,模型在測(cè)試數(shù)據(jù)上準(zhǔn)確率可以達(dá)到94%,說明模型具有一定的預(yù)測(cè)價(jià)值。

【文章頁數(shù)】:3 頁

【部分圖文】:

圖1系統(tǒng)總體設(shè)計(jì)

圖1系統(tǒng)總體設(shè)計(jì)

對(duì)缺省數(shù)據(jù)進(jìn)行處理等。1.3CART算法使用基尼指數(shù)準(zhǔn)則用于決策樹劃分選擇。決策樹算法是一種預(yù)測(cè)模型,描述了對(duì)象屬性與對(duì)象值之間的一種映射關(guān)系,是上個(gè)世紀(jì)60年代到70年代提出的一種用于數(shù)據(jù)分類的算法。自提出以來,就一直不斷發(fā)展,精益求精,從ID3,ID4到CART決策樹算法,再....


圖2criterion算法學(xué)習(xí)曲線

圖2criterion算法學(xué)習(xí)曲線

使用相同的方法,得到其他參數(shù)的學(xué)習(xí)曲線。經(jīng)過超參數(shù)學(xué)習(xí)曲線調(diào)整后,大概知道了數(shù)據(jù)的范圍。然后利用網(wǎng)格搜索法搜索最佳的數(shù)值,其模型最佳參數(shù)組合如表2所示。圖3max_depth學(xué)習(xí)曲線


圖3max_depth學(xué)習(xí)曲線

圖3max_depth學(xué)習(xí)曲線

圖2criterion算法學(xué)習(xí)曲線表2網(wǎng)格搜索后的參數(shù)參數(shù)criterionmax_depthmin_samples_leafmin_samples_splitmax_features數(shù)值entropy4293


圖1不調(diào)參的效果圖

圖1不調(diào)參的效果圖

選取數(shù)據(jù)集的70%作為訓(xùn)練集,30%用作測(cè)試集。在不加限制情況下,一顆決策樹可以生長到純度最優(yōu),這樣就會(huì)出現(xiàn)在訓(xùn)練集上效果很好,但是在測(cè)試集上效果很差的狀況,把這種現(xiàn)象稱為過擬合[2]。首先在不設(shè)置任何參數(shù)的情況下,查看決策樹算法在訓(xùn)練集和測(cè)試集上的執(zhí)行效果,如圖1所示。從圖中可....



本文編號(hào):3964079

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3964079.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶4e587***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com