基于集成學(xué)習(xí)的O 3 濃度逐小時(shí)預(yù)測(cè)模型研究
發(fā)布時(shí)間:2021-11-21 07:30
對(duì)流層臭氧(O3)濃度不斷增長(zhǎng)已成為全球聚焦的環(huán)境問(wèn)題之一。我國(guó)全方位飛速發(fā)展的同時(shí),也面臨著大范圍O3污染的窘境。研究表明長(zhǎng)時(shí)間暴露在高濃度O3環(huán)境中,會(huì)對(duì)人體健康、動(dòng)植物生長(zhǎng)乃至整個(gè)生態(tài)環(huán)境造成嚴(yán)重危害。然而O3污染成因復(fù)雜,治理困難,在此情況下建立及時(shí)準(zhǔn)確的O3濃度預(yù)測(cè)模型就顯得尤為重要。本文以上海市浦東新區(qū)監(jiān)測(cè)站為例,圍繞構(gòu)建準(zhǔn)確可靠的O3濃度小時(shí)預(yù)測(cè)模型為核心目標(biāo)展開(kāi)相關(guān)研究,研究?jī)?nèi)容主要包括以下幾個(gè)方面:(1)選取20152016年與O3相關(guān)的歷史多指標(biāo)變量為研究數(shù)據(jù)。實(shí)驗(yàn)發(fā)現(xiàn)當(dāng)鄰近點(diǎn)被賦予最優(yōu)權(quán)重時(shí),KNN算法的預(yù)測(cè)精度能夠得到大幅度提升,本文將優(yōu)化的KNN算法用于填補(bǔ)原始數(shù)據(jù)中缺失比例較低的樣本,可以使研究數(shù)據(jù)的整體質(zhì)量得到最大限度的保障。(2)通過(guò)計(jì)算多指標(biāo)與未來(lái)124h延時(shí)O3濃度之間的Pearson相關(guān)系數(shù),探究多指標(biāo)對(duì)不同延時(shí)O3
【文章來(lái)源】:華東師范大學(xué)上海市 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:75 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
預(yù)測(cè)偏差與預(yù)測(cè)方差
成得到的機(jī)器學(xué)習(xí)方法:隨機(jī)森林、GBDT 和 XGBoost 分別用于訓(xùn)練未來(lái) 1~24的 O3濃度回歸預(yù)測(cè)模型,并使用 Stacking 將三種算法進(jìn)行融合,以期實(shí)現(xiàn)預(yù)測(cè)精度的進(jìn)一步提升。其中隨機(jī)森林實(shí)質(zhì)上是以 CART 為基學(xué)習(xí)器構(gòu)建的 Baggin集成算法,而 GBDT 和 XGBoost 實(shí)質(zhì)上是以 CART 為基學(xué)習(xí)器構(gòu)建的 Boostin集成算法,為了更好地了解這三種算法的構(gòu)造原理,及最后三種模型的融合過(guò)程下面從 Bagging、Boosting 和 Stacking 的集成思路展開(kāi)介紹。2.2.1 Bagging裝袋(Bagging)是 1996 年 Breiman[40]提出的集成學(xué)習(xí)方法,其主要思想是將多個(gè)獨(dú)立的基學(xué)習(xí)器的預(yù)測(cè)結(jié)果進(jìn)行整理得到最終結(jié)果,所有學(xué)習(xí)器的構(gòu)造過(guò)程均是并行的。當(dāng)預(yù)測(cè)目標(biāo)為連續(xù)性數(shù)值型數(shù)據(jù)時(shí),以多個(gè)預(yù)測(cè)結(jié)果的平均值作為最終結(jié)果,預(yù)測(cè)目標(biāo)為離散型的數(shù)據(jù)時(shí),通過(guò)投票將基學(xué)習(xí)器中預(yù)測(cè)結(jié)果最多的一類(lèi)作為最后的預(yù)測(cè)結(jié)果。Bagging 實(shí)現(xiàn)原理如圖 2-2 所示。
師范大學(xué) 2018 屆碩士學(xué)位論文 第 2 章 研的是學(xué)習(xí)能力弱的算法,其預(yù)測(cè)精度僅僅優(yōu)于隨機(jī)猜測(cè)的概率。Boost代算法,通過(guò)給每個(gè)訓(xùn)練樣本賦予權(quán)值,迭代地學(xué)習(xí)若干個(gè)學(xué)習(xí)器。訓(xùn)習(xí)器 時(shí),對(duì)訓(xùn)練樣本的權(quán)值重新替換, 學(xué)習(xí)器中預(yù)測(cè)錯(cuò)誤的樣本將較大的權(quán)值,反之,預(yù)測(cè)正確的樣本將被給予較小的權(quán)值。將權(quán)值替換集用于訓(xùn)練之后的學(xué)習(xí)器 。由于權(quán)重不斷被更新,學(xué)習(xí)器 將會(huì)學(xué)習(xí)器 預(yù)測(cè)錯(cuò)誤的樣本,從而通過(guò)不斷彌補(bǔ)前一個(gè)弱分類(lèi)器的不足來(lái)造一個(gè)強(qiáng)學(xué)習(xí)器。最終得到的強(qiáng)學(xué)習(xí)器 F 是根據(jù)每個(gè)基學(xué)習(xí)器的分類(lèi)其賦予相應(yīng)的權(quán)重,并通過(guò)加權(quán)融合得到最后的預(yù)測(cè)結(jié)果[44]。Boosting詳見(jiàn)圖 2-3。
【參考文獻(xiàn)】:
期刊論文
[1]氣象條件對(duì)沈陽(yáng)市環(huán)境空氣臭氧濃度影響研究[J]. 王闖,王帥,楊碧波,張麗輝,王磊,劉閩. 中國(guó)環(huán)境監(jiān)測(cè). 2015(03)
[2]長(zhǎng)江三角洲地區(qū)城市臭氧污染特征與影響因素分析[J]. 易睿,王亞林,張殷俊,史宇,李名升. 環(huán)境科學(xué)學(xué)報(bào). 2015(08)
[3]國(guó)內(nèi)外空氣質(zhì)量模型研究進(jìn)展[J]. 薛文博,王金南,楊金田,雷宇,汪藝梅,陳曦. 環(huán)境與可持續(xù)發(fā)展. 2013(03)
[4]基于廣義線性模型的地表臭氧濃度的預(yù)測(cè)[J]. 張浩,蔣艷斌,孫巍,Ahmet Palazoglu. 清華大學(xué)學(xué)報(bào)(自然科學(xué)版). 2012(03)
[5]神經(jīng)網(wǎng)絡(luò)模型在O3濃度預(yù)測(cè)中的應(yīng)用[J]. 沈路路,王聿絢,段雷. 環(huán)境科學(xué). 2011(08)
[6]中國(guó)地區(qū)臭氧前體物對(duì)地面臭氧的影響[J]. 漏嗣佳,朱彬,廖宏. 大氣科學(xué)學(xué)報(bào). 2010(04)
[7]集合數(shù)值預(yù)報(bào)系統(tǒng)在上海市空氣質(zhì)量預(yù)測(cè)預(yù)報(bào)中的應(yīng)用研究[J]. 王茜,伏晴艷,王自發(fā),王體健,劉萍,陸濤,林陳淵,段玉森,黃嫣旻. 環(huán)境監(jiān)控與預(yù)警. 2010(04)
[8]城市環(huán)境空氣污染預(yù)報(bào)研究進(jìn)展[J]. 任萬(wàn)輝,蘇樅樅,趙宏德. 環(huán)境保護(hù)科學(xué). 2010(03)
[9]天津臭氧濃度與氣象因素的相關(guān)性及其預(yù)測(cè)方法[J]. 姚青,孫玫玲,劉愛(ài)霞. 生態(tài)環(huán)境學(xué)報(bào). 2009(06)
[10]近地層O3污染對(duì)陸地生態(tài)系統(tǒng)的影響[J]. 寇太記,常會(huì)慶,張聯(lián)合,徐曉峰,郭大勇,周文利,朱建國(guó),苗艷芳. 生態(tài)環(huán)境學(xué)報(bào). 2009(02)
博士論文
[1]集成學(xué)習(xí)中若干關(guān)鍵問(wèn)題的研究[D]. 王清.復(fù)旦大學(xué) 2011
[2]北京大氣臭氧濃度變化特征及其形成機(jī)制研究[D]. 安俊琳.南京信息工程大學(xué) 2007
碩士論文
[1]基于數(shù)值預(yù)報(bào)的空氣質(zhì)量預(yù)測(cè)模型的研究[D]. 姚文強(qiáng).浙江理工大學(xué) 2017
[2]北京城區(qū)臭氧濃度變化規(guī)律及預(yù)測(cè)方法研究[D]. 張文方.北京林業(yè)大學(xué) 2010
[3]上海市近地層臭氧濃度時(shí)間序列混沌預(yù)報(bào)模式研究[D]. 張建磊.華東師范大學(xué) 2007
本文編號(hào):3509065
【文章來(lái)源】:華東師范大學(xué)上海市 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:75 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
預(yù)測(cè)偏差與預(yù)測(cè)方差
成得到的機(jī)器學(xué)習(xí)方法:隨機(jī)森林、GBDT 和 XGBoost 分別用于訓(xùn)練未來(lái) 1~24的 O3濃度回歸預(yù)測(cè)模型,并使用 Stacking 將三種算法進(jìn)行融合,以期實(shí)現(xiàn)預(yù)測(cè)精度的進(jìn)一步提升。其中隨機(jī)森林實(shí)質(zhì)上是以 CART 為基學(xué)習(xí)器構(gòu)建的 Baggin集成算法,而 GBDT 和 XGBoost 實(shí)質(zhì)上是以 CART 為基學(xué)習(xí)器構(gòu)建的 Boostin集成算法,為了更好地了解這三種算法的構(gòu)造原理,及最后三種模型的融合過(guò)程下面從 Bagging、Boosting 和 Stacking 的集成思路展開(kāi)介紹。2.2.1 Bagging裝袋(Bagging)是 1996 年 Breiman[40]提出的集成學(xué)習(xí)方法,其主要思想是將多個(gè)獨(dú)立的基學(xué)習(xí)器的預(yù)測(cè)結(jié)果進(jìn)行整理得到最終結(jié)果,所有學(xué)習(xí)器的構(gòu)造過(guò)程均是并行的。當(dāng)預(yù)測(cè)目標(biāo)為連續(xù)性數(shù)值型數(shù)據(jù)時(shí),以多個(gè)預(yù)測(cè)結(jié)果的平均值作為最終結(jié)果,預(yù)測(cè)目標(biāo)為離散型的數(shù)據(jù)時(shí),通過(guò)投票將基學(xué)習(xí)器中預(yù)測(cè)結(jié)果最多的一類(lèi)作為最后的預(yù)測(cè)結(jié)果。Bagging 實(shí)現(xiàn)原理如圖 2-2 所示。
師范大學(xué) 2018 屆碩士學(xué)位論文 第 2 章 研的是學(xué)習(xí)能力弱的算法,其預(yù)測(cè)精度僅僅優(yōu)于隨機(jī)猜測(cè)的概率。Boost代算法,通過(guò)給每個(gè)訓(xùn)練樣本賦予權(quán)值,迭代地學(xué)習(xí)若干個(gè)學(xué)習(xí)器。訓(xùn)習(xí)器 時(shí),對(duì)訓(xùn)練樣本的權(quán)值重新替換, 學(xué)習(xí)器中預(yù)測(cè)錯(cuò)誤的樣本將較大的權(quán)值,反之,預(yù)測(cè)正確的樣本將被給予較小的權(quán)值。將權(quán)值替換集用于訓(xùn)練之后的學(xué)習(xí)器 。由于權(quán)重不斷被更新,學(xué)習(xí)器 將會(huì)學(xué)習(xí)器 預(yù)測(cè)錯(cuò)誤的樣本,從而通過(guò)不斷彌補(bǔ)前一個(gè)弱分類(lèi)器的不足來(lái)造一個(gè)強(qiáng)學(xué)習(xí)器。最終得到的強(qiáng)學(xué)習(xí)器 F 是根據(jù)每個(gè)基學(xué)習(xí)器的分類(lèi)其賦予相應(yīng)的權(quán)重,并通過(guò)加權(quán)融合得到最后的預(yù)測(cè)結(jié)果[44]。Boosting詳見(jiàn)圖 2-3。
【參考文獻(xiàn)】:
期刊論文
[1]氣象條件對(duì)沈陽(yáng)市環(huán)境空氣臭氧濃度影響研究[J]. 王闖,王帥,楊碧波,張麗輝,王磊,劉閩. 中國(guó)環(huán)境監(jiān)測(cè). 2015(03)
[2]長(zhǎng)江三角洲地區(qū)城市臭氧污染特征與影響因素分析[J]. 易睿,王亞林,張殷俊,史宇,李名升. 環(huán)境科學(xué)學(xué)報(bào). 2015(08)
[3]國(guó)內(nèi)外空氣質(zhì)量模型研究進(jìn)展[J]. 薛文博,王金南,楊金田,雷宇,汪藝梅,陳曦. 環(huán)境與可持續(xù)發(fā)展. 2013(03)
[4]基于廣義線性模型的地表臭氧濃度的預(yù)測(cè)[J]. 張浩,蔣艷斌,孫巍,Ahmet Palazoglu. 清華大學(xué)學(xué)報(bào)(自然科學(xué)版). 2012(03)
[5]神經(jīng)網(wǎng)絡(luò)模型在O3濃度預(yù)測(cè)中的應(yīng)用[J]. 沈路路,王聿絢,段雷. 環(huán)境科學(xué). 2011(08)
[6]中國(guó)地區(qū)臭氧前體物對(duì)地面臭氧的影響[J]. 漏嗣佳,朱彬,廖宏. 大氣科學(xué)學(xué)報(bào). 2010(04)
[7]集合數(shù)值預(yù)報(bào)系統(tǒng)在上海市空氣質(zhì)量預(yù)測(cè)預(yù)報(bào)中的應(yīng)用研究[J]. 王茜,伏晴艷,王自發(fā),王體健,劉萍,陸濤,林陳淵,段玉森,黃嫣旻. 環(huán)境監(jiān)控與預(yù)警. 2010(04)
[8]城市環(huán)境空氣污染預(yù)報(bào)研究進(jìn)展[J]. 任萬(wàn)輝,蘇樅樅,趙宏德. 環(huán)境保護(hù)科學(xué). 2010(03)
[9]天津臭氧濃度與氣象因素的相關(guān)性及其預(yù)測(cè)方法[J]. 姚青,孫玫玲,劉愛(ài)霞. 生態(tài)環(huán)境學(xué)報(bào). 2009(06)
[10]近地層O3污染對(duì)陸地生態(tài)系統(tǒng)的影響[J]. 寇太記,常會(huì)慶,張聯(lián)合,徐曉峰,郭大勇,周文利,朱建國(guó),苗艷芳. 生態(tài)環(huán)境學(xué)報(bào). 2009(02)
博士論文
[1]集成學(xué)習(xí)中若干關(guān)鍵問(wèn)題的研究[D]. 王清.復(fù)旦大學(xué) 2011
[2]北京大氣臭氧濃度變化特征及其形成機(jī)制研究[D]. 安俊琳.南京信息工程大學(xué) 2007
碩士論文
[1]基于數(shù)值預(yù)報(bào)的空氣質(zhì)量預(yù)測(cè)模型的研究[D]. 姚文強(qiáng).浙江理工大學(xué) 2017
[2]北京城區(qū)臭氧濃度變化規(guī)律及預(yù)測(cè)方法研究[D]. 張文方.北京林業(yè)大學(xué) 2010
[3]上海市近地層臭氧濃度時(shí)間序列混沌預(yù)報(bào)模式研究[D]. 張建磊.華東師范大學(xué) 2007
本文編號(hào):3509065
本文鏈接:http://sikaile.net/kejilunwen/huanjinggongchenglunwen/3509065.html
最近更新
教材專(zhuān)著