基于隨機(jī)森林的PM2.5濃度預(yù)測(cè)模型研究
發(fā)布時(shí)間:2022-01-20 01:31
PM2.5顆粒物作為霧霾現(xiàn)象主要的危害性成分,不僅威脅人類健康、破壞自然環(huán)境,還對(duì)經(jīng)濟(jì)的發(fā)展造成了重大影響。對(duì)PM2.5進(jìn)行科學(xué)、準(zhǔn)確地預(yù)測(cè)預(yù)報(bào)工作,有助于環(huán)保部門制定相應(yīng)的防范和治理措施,還可以為政府部門的政策提供科學(xué)依據(jù),降低對(duì)人體的傷害。本文對(duì)PM2.5研究進(jìn)展和預(yù)測(cè)方法進(jìn)行了整理、分析,在此基礎(chǔ)上,結(jié)合機(jī)器學(xué)習(xí)理論和統(tǒng)計(jì)預(yù)測(cè)方法,基于隨機(jī)森林算法設(shè)計(jì)出一種新的PM2.5濃度預(yù)測(cè)模型(Random Forest Pretiction Model,RFP模型),進(jìn)行PM2.5日均值濃度的預(yù)測(cè)。本文主要完成的工作如下:(1)選擇PM2.5濃度較高的西安市地區(qū)為研究對(duì)象,基于Python語(yǔ)言和Scrapy框架,設(shè)計(jì)了爬蟲的五大功能模塊,實(shí)現(xiàn)了從多個(gè)網(wǎng)站自動(dòng)爬取了西安市2013年10月28日至2018年1月31日的歷史數(shù)據(jù),包括PM2.5、PM10、SO2、NO2、CO、O3等大氣污染濃度數(shù)據(jù),溫度、露點(diǎn)、濕度、海平面壓強(qiáng)、能見度、風(fēng)速、風(fēng)向、風(fēng)力、天氣狀態(tài)等氣象條件數(shù)據(jù)。使用牛頓插值法、3δ準(zhǔn)則、前后均值修正法、one-hot編碼等技術(shù)對(duì)原始數(shù)據(jù)做了大量的預(yù)處理工作,從而提高了PM2....
【文章來(lái)源】:西安郵電大學(xué)陜西省
【文章頁(yè)數(shù)】:70 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
論文組織結(jié)構(gòu)
西安郵電大學(xué)碩士學(xué)位論文本容量為 s),保證每次采樣的隨機(jī)性,且每個(gè)訓(xùn)練樣本的容量要等于原始數(shù)據(jù)樣本的容量,即 s=S。經(jīng)過 M 次采樣得到 M 個(gè)采樣集,經(jīng)過獨(dú)立訓(xùn)練得到 M 個(gè)弱學(xué)習(xí)器,再經(jīng)過一定的結(jié)合策略將 M 個(gè)弱學(xué)習(xí)器的結(jié)果結(jié)合,作為強(qiáng)學(xué)習(xí)器的輸出。bagging思想算法原理見圖 2.1 所示。
第 2 章 隨機(jī)森林算法概述(1)利用 bagging 思想,隨機(jī)產(chǎn)生訓(xùn)練樣本子集。(2)利用隨機(jī)子空間思想,隨機(jī)抽取 f 個(gè)特征,并從中選擇出最優(yōu)的特征進(jìn)行節(jié)點(diǎn)分裂并構(gòu)建單棵決策子樹。在節(jié)點(diǎn)分裂時(shí),對(duì)于回歸模型,則基于均方誤差(MeanSquared Error)建立回歸樹;對(duì)于分類模型,則基于基尼指數(shù)(Gini Coefficient)建立分類樹。(3)重復(fù)(1)、(2)步驟,建立 T 棵決策子樹,每棵樹自由生長(zhǎng),不進(jìn)行剪枝處理,從而形成森林。(4)綜合 T 棵決策子樹的預(yù)測(cè)情況得到最終結(jié)果。對(duì)于回歸模型,采用取平均方式;對(duì)于分類模型,采取投票方式。
【參考文獻(xiàn)】:
期刊論文
[1]2016中國(guó)環(huán)境狀況公報(bào)發(fā)布[J]. 本刊編輯部. 中國(guó)能源. 2017(08)
[2]19世紀(jì)英國(guó)人對(duì)倫敦?zé)熿F的認(rèn)知與態(tài)度探析[J]. 陸偉芳. 世界歷史. 2016(05)
[3]基于多元線性回歸的霧霾預(yù)測(cè)方法研究[J]. 付倩嬈. 計(jì)算機(jī)科學(xué). 2016(S1)
[4]洛杉磯光化學(xué)煙霧研究回顧與反思[J]. 李朱辰. 環(huán)境保護(hù)與循環(huán)經(jīng)濟(jì). 2016(05)
[5]基于T-S模型模糊神經(jīng)網(wǎng)絡(luò)的PM2.5質(zhì)量濃度預(yù)測(cè)[J]. 楊云,付彥麗. 陜西科技大學(xué)學(xué)報(bào)(自然科學(xué)版). 2015(06)
[6]空氣中PM2.5濃度的灰色預(yù)測(cè)與關(guān)聯(lián)因素分析[J]. 毛毳,孫宇,馮樷,馮雙喜. 寧夏大學(xué)學(xué)報(bào)(自然科學(xué)版). 2014(03)
[7]基于改進(jìn)型PSO的模糊神經(jīng)網(wǎng)絡(luò)PM2.5濃度預(yù)測(cè)[J]. 馬天成,劉大銘,李雪潔,孫川川. 計(jì)算機(jī)工程與設(shè)計(jì). 2014(09)
[8]中國(guó)霧霾污染的空間效應(yīng)及經(jīng)濟(jì)、能源結(jié)構(gòu)影響[J]. 馬麗梅,張曉. 中國(guó)工業(yè)經(jīng)濟(jì). 2014(04)
[9]日本對(duì)PM2.5的研究及治理[J]. 劉佳聽. 汽車與安全. 2014(03)
[10]大氣細(xì)顆粒物的污染特征及對(duì)人體健康的影響[J]. 陶燕,劉亞夢(mèng),米生權(quán),郭勇濤. 環(huán)境科學(xué)學(xué)報(bào). 2014(03)
碩士論文
[1]基于BP算法的網(wǎng)格資源調(diào)度研究[D]. 呂昌國(guó).哈爾濱理工大學(xué) 2007
[2]兩類有理三次插值樣條的逼近性質(zhì)[D]. 李世龍.山東大學(xué) 2005
本文編號(hào):3597928
【文章來(lái)源】:西安郵電大學(xué)陜西省
【文章頁(yè)數(shù)】:70 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
論文組織結(jié)構(gòu)
西安郵電大學(xué)碩士學(xué)位論文本容量為 s),保證每次采樣的隨機(jī)性,且每個(gè)訓(xùn)練樣本的容量要等于原始數(shù)據(jù)樣本的容量,即 s=S。經(jīng)過 M 次采樣得到 M 個(gè)采樣集,經(jīng)過獨(dú)立訓(xùn)練得到 M 個(gè)弱學(xué)習(xí)器,再經(jīng)過一定的結(jié)合策略將 M 個(gè)弱學(xué)習(xí)器的結(jié)果結(jié)合,作為強(qiáng)學(xué)習(xí)器的輸出。bagging思想算法原理見圖 2.1 所示。
第 2 章 隨機(jī)森林算法概述(1)利用 bagging 思想,隨機(jī)產(chǎn)生訓(xùn)練樣本子集。(2)利用隨機(jī)子空間思想,隨機(jī)抽取 f 個(gè)特征,并從中選擇出最優(yōu)的特征進(jìn)行節(jié)點(diǎn)分裂并構(gòu)建單棵決策子樹。在節(jié)點(diǎn)分裂時(shí),對(duì)于回歸模型,則基于均方誤差(MeanSquared Error)建立回歸樹;對(duì)于分類模型,則基于基尼指數(shù)(Gini Coefficient)建立分類樹。(3)重復(fù)(1)、(2)步驟,建立 T 棵決策子樹,每棵樹自由生長(zhǎng),不進(jìn)行剪枝處理,從而形成森林。(4)綜合 T 棵決策子樹的預(yù)測(cè)情況得到最終結(jié)果。對(duì)于回歸模型,采用取平均方式;對(duì)于分類模型,采取投票方式。
【參考文獻(xiàn)】:
期刊論文
[1]2016中國(guó)環(huán)境狀況公報(bào)發(fā)布[J]. 本刊編輯部. 中國(guó)能源. 2017(08)
[2]19世紀(jì)英國(guó)人對(duì)倫敦?zé)熿F的認(rèn)知與態(tài)度探析[J]. 陸偉芳. 世界歷史. 2016(05)
[3]基于多元線性回歸的霧霾預(yù)測(cè)方法研究[J]. 付倩嬈. 計(jì)算機(jī)科學(xué). 2016(S1)
[4]洛杉磯光化學(xué)煙霧研究回顧與反思[J]. 李朱辰. 環(huán)境保護(hù)與循環(huán)經(jīng)濟(jì). 2016(05)
[5]基于T-S模型模糊神經(jīng)網(wǎng)絡(luò)的PM2.5質(zhì)量濃度預(yù)測(cè)[J]. 楊云,付彥麗. 陜西科技大學(xué)學(xué)報(bào)(自然科學(xué)版). 2015(06)
[6]空氣中PM2.5濃度的灰色預(yù)測(cè)與關(guān)聯(lián)因素分析[J]. 毛毳,孫宇,馮樷,馮雙喜. 寧夏大學(xué)學(xué)報(bào)(自然科學(xué)版). 2014(03)
[7]基于改進(jìn)型PSO的模糊神經(jīng)網(wǎng)絡(luò)PM2.5濃度預(yù)測(cè)[J]. 馬天成,劉大銘,李雪潔,孫川川. 計(jì)算機(jī)工程與設(shè)計(jì). 2014(09)
[8]中國(guó)霧霾污染的空間效應(yīng)及經(jīng)濟(jì)、能源結(jié)構(gòu)影響[J]. 馬麗梅,張曉. 中國(guó)工業(yè)經(jīng)濟(jì). 2014(04)
[9]日本對(duì)PM2.5的研究及治理[J]. 劉佳聽. 汽車與安全. 2014(03)
[10]大氣細(xì)顆粒物的污染特征及對(duì)人體健康的影響[J]. 陶燕,劉亞夢(mèng),米生權(quán),郭勇濤. 環(huán)境科學(xué)學(xué)報(bào). 2014(03)
碩士論文
[1]基于BP算法的網(wǎng)格資源調(diào)度研究[D]. 呂昌國(guó).哈爾濱理工大學(xué) 2007
[2]兩類有理三次插值樣條的逼近性質(zhì)[D]. 李世龍.山東大學(xué) 2005
本文編號(hào):3597928
本文鏈接:http://sikaile.net/kejilunwen/huanjinggongchenglunwen/3597928.html
最近更新
教材專著