基于集成學(xué)習(xí)的O 3 濃度逐小時預(yù)測模型研究
發(fā)布時間:2021-11-21 07:30
對流層臭氧(O3)濃度不斷增長已成為全球聚焦的環(huán)境問題之一。我國全方位飛速發(fā)展的同時,也面臨著大范圍O3污染的窘境。研究表明長時間暴露在高濃度O3環(huán)境中,會對人體健康、動植物生長乃至整個生態(tài)環(huán)境造成嚴重危害。然而O3污染成因復(fù)雜,治理困難,在此情況下建立及時準確的O3濃度預(yù)測模型就顯得尤為重要。本文以上海市浦東新區(qū)監(jiān)測站為例,圍繞構(gòu)建準確可靠的O3濃度小時預(yù)測模型為核心目標展開相關(guān)研究,研究內(nèi)容主要包括以下幾個方面:(1)選取20152016年與O3相關(guān)的歷史多指標變量為研究數(shù)據(jù)。實驗發(fā)現(xiàn)當鄰近點被賦予最優(yōu)權(quán)重時,KNN算法的預(yù)測精度能夠得到大幅度提升,本文將優(yōu)化的KNN算法用于填補原始數(shù)據(jù)中缺失比例較低的樣本,可以使研究數(shù)據(jù)的整體質(zhì)量得到最大限度的保障。(2)通過計算多指標與未來124h延時O3濃度之間的Pearson相關(guān)系數(shù),探究多指標對不同延時O3
【文章來源】:華東師范大學(xué)上海市 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:75 頁
【學(xué)位級別】:碩士
【部分圖文】:
預(yù)測偏差與預(yù)測方差
成得到的機器學(xué)習(xí)方法:隨機森林、GBDT 和 XGBoost 分別用于訓(xùn)練未來 1~24的 O3濃度回歸預(yù)測模型,并使用 Stacking 將三種算法進行融合,以期實現(xiàn)預(yù)測精度的進一步提升。其中隨機森林實質(zhì)上是以 CART 為基學(xué)習(xí)器構(gòu)建的 Baggin集成算法,而 GBDT 和 XGBoost 實質(zhì)上是以 CART 為基學(xué)習(xí)器構(gòu)建的 Boostin集成算法,為了更好地了解這三種算法的構(gòu)造原理,及最后三種模型的融合過程下面從 Bagging、Boosting 和 Stacking 的集成思路展開介紹。2.2.1 Bagging裝袋(Bagging)是 1996 年 Breiman[40]提出的集成學(xué)習(xí)方法,其主要思想是將多個獨立的基學(xué)習(xí)器的預(yù)測結(jié)果進行整理得到最終結(jié)果,所有學(xué)習(xí)器的構(gòu)造過程均是并行的。當預(yù)測目標為連續(xù)性數(shù)值型數(shù)據(jù)時,以多個預(yù)測結(jié)果的平均值作為最終結(jié)果,預(yù)測目標為離散型的數(shù)據(jù)時,通過投票將基學(xué)習(xí)器中預(yù)測結(jié)果最多的一類作為最后的預(yù)測結(jié)果。Bagging 實現(xiàn)原理如圖 2-2 所示。
師范大學(xué) 2018 屆碩士學(xué)位論文 第 2 章 研的是學(xué)習(xí)能力弱的算法,其預(yù)測精度僅僅優(yōu)于隨機猜測的概率。Boost代算法,通過給每個訓(xùn)練樣本賦予權(quán)值,迭代地學(xué)習(xí)若干個學(xué)習(xí)器。訓(xùn)習(xí)器 時,對訓(xùn)練樣本的權(quán)值重新替換, 學(xué)習(xí)器中預(yù)測錯誤的樣本將較大的權(quán)值,反之,預(yù)測正確的樣本將被給予較小的權(quán)值。將權(quán)值替換集用于訓(xùn)練之后的學(xué)習(xí)器 。由于權(quán)重不斷被更新,學(xué)習(xí)器 將會學(xué)習(xí)器 預(yù)測錯誤的樣本,從而通過不斷彌補前一個弱分類器的不足來造一個強學(xué)習(xí)器。最終得到的強學(xué)習(xí)器 F 是根據(jù)每個基學(xué)習(xí)器的分類其賦予相應(yīng)的權(quán)重,并通過加權(quán)融合得到最后的預(yù)測結(jié)果[44]。Boosting詳見圖 2-3。
【參考文獻】:
期刊論文
[1]氣象條件對沈陽市環(huán)境空氣臭氧濃度影響研究[J]. 王闖,王帥,楊碧波,張麗輝,王磊,劉閩. 中國環(huán)境監(jiān)測. 2015(03)
[2]長江三角洲地區(qū)城市臭氧污染特征與影響因素分析[J]. 易睿,王亞林,張殷俊,史宇,李名升. 環(huán)境科學(xué)學(xué)報. 2015(08)
[3]國內(nèi)外空氣質(zhì)量模型研究進展[J]. 薛文博,王金南,楊金田,雷宇,汪藝梅,陳曦. 環(huán)境與可持續(xù)發(fā)展. 2013(03)
[4]基于廣義線性模型的地表臭氧濃度的預(yù)測[J]. 張浩,蔣艷斌,孫巍,Ahmet Palazoglu. 清華大學(xué)學(xué)報(自然科學(xué)版). 2012(03)
[5]神經(jīng)網(wǎng)絡(luò)模型在O3濃度預(yù)測中的應(yīng)用[J]. 沈路路,王聿絢,段雷. 環(huán)境科學(xué). 2011(08)
[6]中國地區(qū)臭氧前體物對地面臭氧的影響[J]. 漏嗣佳,朱彬,廖宏. 大氣科學(xué)學(xué)報. 2010(04)
[7]集合數(shù)值預(yù)報系統(tǒng)在上海市空氣質(zhì)量預(yù)測預(yù)報中的應(yīng)用研究[J]. 王茜,伏晴艷,王自發(fā),王體健,劉萍,陸濤,林陳淵,段玉森,黃嫣旻. 環(huán)境監(jiān)控與預(yù)警. 2010(04)
[8]城市環(huán)境空氣污染預(yù)報研究進展[J]. 任萬輝,蘇樅樅,趙宏德. 環(huán)境保護科學(xué). 2010(03)
[9]天津臭氧濃度與氣象因素的相關(guān)性及其預(yù)測方法[J]. 姚青,孫玫玲,劉愛霞. 生態(tài)環(huán)境學(xué)報. 2009(06)
[10]近地層O3污染對陸地生態(tài)系統(tǒng)的影響[J]. 寇太記,常會慶,張聯(lián)合,徐曉峰,郭大勇,周文利,朱建國,苗艷芳. 生態(tài)環(huán)境學(xué)報. 2009(02)
博士論文
[1]集成學(xué)習(xí)中若干關(guān)鍵問題的研究[D]. 王清.復(fù)旦大學(xué) 2011
[2]北京大氣臭氧濃度變化特征及其形成機制研究[D]. 安俊琳.南京信息工程大學(xué) 2007
碩士論文
[1]基于數(shù)值預(yù)報的空氣質(zhì)量預(yù)測模型的研究[D]. 姚文強.浙江理工大學(xué) 2017
[2]北京城區(qū)臭氧濃度變化規(guī)律及預(yù)測方法研究[D]. 張文方.北京林業(yè)大學(xué) 2010
[3]上海市近地層臭氧濃度時間序列混沌預(yù)報模式研究[D]. 張建磊.華東師范大學(xué) 2007
本文編號:3509065
【文章來源】:華東師范大學(xué)上海市 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:75 頁
【學(xué)位級別】:碩士
【部分圖文】:
預(yù)測偏差與預(yù)測方差
成得到的機器學(xué)習(xí)方法:隨機森林、GBDT 和 XGBoost 分別用于訓(xùn)練未來 1~24的 O3濃度回歸預(yù)測模型,并使用 Stacking 將三種算法進行融合,以期實現(xiàn)預(yù)測精度的進一步提升。其中隨機森林實質(zhì)上是以 CART 為基學(xué)習(xí)器構(gòu)建的 Baggin集成算法,而 GBDT 和 XGBoost 實質(zhì)上是以 CART 為基學(xué)習(xí)器構(gòu)建的 Boostin集成算法,為了更好地了解這三種算法的構(gòu)造原理,及最后三種模型的融合過程下面從 Bagging、Boosting 和 Stacking 的集成思路展開介紹。2.2.1 Bagging裝袋(Bagging)是 1996 年 Breiman[40]提出的集成學(xué)習(xí)方法,其主要思想是將多個獨立的基學(xué)習(xí)器的預(yù)測結(jié)果進行整理得到最終結(jié)果,所有學(xué)習(xí)器的構(gòu)造過程均是并行的。當預(yù)測目標為連續(xù)性數(shù)值型數(shù)據(jù)時,以多個預(yù)測結(jié)果的平均值作為最終結(jié)果,預(yù)測目標為離散型的數(shù)據(jù)時,通過投票將基學(xué)習(xí)器中預(yù)測結(jié)果最多的一類作為最后的預(yù)測結(jié)果。Bagging 實現(xiàn)原理如圖 2-2 所示。
師范大學(xué) 2018 屆碩士學(xué)位論文 第 2 章 研的是學(xué)習(xí)能力弱的算法,其預(yù)測精度僅僅優(yōu)于隨機猜測的概率。Boost代算法,通過給每個訓(xùn)練樣本賦予權(quán)值,迭代地學(xué)習(xí)若干個學(xué)習(xí)器。訓(xùn)習(xí)器 時,對訓(xùn)練樣本的權(quán)值重新替換, 學(xué)習(xí)器中預(yù)測錯誤的樣本將較大的權(quán)值,反之,預(yù)測正確的樣本將被給予較小的權(quán)值。將權(quán)值替換集用于訓(xùn)練之后的學(xué)習(xí)器 。由于權(quán)重不斷被更新,學(xué)習(xí)器 將會學(xué)習(xí)器 預(yù)測錯誤的樣本,從而通過不斷彌補前一個弱分類器的不足來造一個強學(xué)習(xí)器。最終得到的強學(xué)習(xí)器 F 是根據(jù)每個基學(xué)習(xí)器的分類其賦予相應(yīng)的權(quán)重,并通過加權(quán)融合得到最后的預(yù)測結(jié)果[44]。Boosting詳見圖 2-3。
【參考文獻】:
期刊論文
[1]氣象條件對沈陽市環(huán)境空氣臭氧濃度影響研究[J]. 王闖,王帥,楊碧波,張麗輝,王磊,劉閩. 中國環(huán)境監(jiān)測. 2015(03)
[2]長江三角洲地區(qū)城市臭氧污染特征與影響因素分析[J]. 易睿,王亞林,張殷俊,史宇,李名升. 環(huán)境科學(xué)學(xué)報. 2015(08)
[3]國內(nèi)外空氣質(zhì)量模型研究進展[J]. 薛文博,王金南,楊金田,雷宇,汪藝梅,陳曦. 環(huán)境與可持續(xù)發(fā)展. 2013(03)
[4]基于廣義線性模型的地表臭氧濃度的預(yù)測[J]. 張浩,蔣艷斌,孫巍,Ahmet Palazoglu. 清華大學(xué)學(xué)報(自然科學(xué)版). 2012(03)
[5]神經(jīng)網(wǎng)絡(luò)模型在O3濃度預(yù)測中的應(yīng)用[J]. 沈路路,王聿絢,段雷. 環(huán)境科學(xué). 2011(08)
[6]中國地區(qū)臭氧前體物對地面臭氧的影響[J]. 漏嗣佳,朱彬,廖宏. 大氣科學(xué)學(xué)報. 2010(04)
[7]集合數(shù)值預(yù)報系統(tǒng)在上海市空氣質(zhì)量預(yù)測預(yù)報中的應(yīng)用研究[J]. 王茜,伏晴艷,王自發(fā),王體健,劉萍,陸濤,林陳淵,段玉森,黃嫣旻. 環(huán)境監(jiān)控與預(yù)警. 2010(04)
[8]城市環(huán)境空氣污染預(yù)報研究進展[J]. 任萬輝,蘇樅樅,趙宏德. 環(huán)境保護科學(xué). 2010(03)
[9]天津臭氧濃度與氣象因素的相關(guān)性及其預(yù)測方法[J]. 姚青,孫玫玲,劉愛霞. 生態(tài)環(huán)境學(xué)報. 2009(06)
[10]近地層O3污染對陸地生態(tài)系統(tǒng)的影響[J]. 寇太記,常會慶,張聯(lián)合,徐曉峰,郭大勇,周文利,朱建國,苗艷芳. 生態(tài)環(huán)境學(xué)報. 2009(02)
博士論文
[1]集成學(xué)習(xí)中若干關(guān)鍵問題的研究[D]. 王清.復(fù)旦大學(xué) 2011
[2]北京大氣臭氧濃度變化特征及其形成機制研究[D]. 安俊琳.南京信息工程大學(xué) 2007
碩士論文
[1]基于數(shù)值預(yù)報的空氣質(zhì)量預(yù)測模型的研究[D]. 姚文強.浙江理工大學(xué) 2017
[2]北京城區(qū)臭氧濃度變化規(guī)律及預(yù)測方法研究[D]. 張文方.北京林業(yè)大學(xué) 2010
[3]上海市近地層臭氧濃度時間序列混沌預(yù)報模式研究[D]. 張建磊.華東師范大學(xué) 2007
本文編號:3509065
本文鏈接:http://sikaile.net/kejilunwen/huanjinggongchenglunwen/3509065.html
最近更新
教材專著