基于XGBoost算法的地下綜合管廊安全狀況評(píng)估方法
發(fā)布時(shí)間:2021-09-19 15:45
針對(duì)地下綜合管廊安全狀況復(fù)雜、風(fēng)險(xiǎn)評(píng)估困難的問(wèn)題,提出了一種基于XGBoost算法的安全狀況評(píng)估方法,利用地下綜合管廊數(shù)據(jù)構(gòu)建模型。首先,對(duì)采集到的地下綜合管廊數(shù)據(jù)進(jìn)行異常值檢測(cè)、缺失值處理,用描述性統(tǒng)計(jì)與特征組合的方法構(gòu)造統(tǒng)計(jì)特征以及交叉特征;其次,使用邏輯回歸(LR)、隨機(jī)森林(RF)、最近鄰分類(lèi)器(NC)、支持向量機(jī)(SVM)算法、XGBoost算法構(gòu)建安全評(píng)估模型;最后,使用貝葉斯算法對(duì)模型參數(shù)進(jìn)行優(yōu)化。實(shí)驗(yàn)結(jié)果表明,優(yōu)化后的XGBoost相較于LR、RF、NC、SVM構(gòu)建的模型在地下綜合管廊的安全評(píng)估上具有更高的準(zhǔn)確率,最高可達(dá)0.920 9。
【文章來(lái)源】:計(jì)算機(jī)應(yīng)用. 2020,40(S1)北大核心CSCD
【文章頁(yè)數(shù)】:5 頁(yè)
【部分圖文】:
模型構(gòu)建流程
地下綜合管廊中數(shù)據(jù)在采集過(guò)程中會(huì)存在數(shù)據(jù)缺失,本文首先對(duì)數(shù)據(jù)集的缺失值進(jìn)行統(tǒng)計(jì),根據(jù)每個(gè)特征的缺失值構(gòu)造出is_null與isnull_Seg這兩個(gè)特征,訓(xùn)練集缺失值分布情況如圖2所示,測(cè)試集的數(shù)據(jù)缺失值分布如圖3所示。可以看出,訓(xùn)練集測(cè)試集的數(shù)據(jù)缺失值分布基本一致,因此這兩部分?jǐn)?shù)據(jù)可以使用同一種缺失值處理策略。數(shù)據(jù)集中G_HS1與G_HS2這兩個(gè)特征缺失值比例明顯大于80%,這兩個(gè)特征會(huì)帶入較大的噪聲,對(duì)結(jié)果造成不良影響,因此直接將其進(jìn)行剔除。其中G_CH1、C_HS1、C_HS2、G_H1這些特征的缺失值比例在30%~80%,可能是某一種屬性值的缺失,因此使用-1填充;其他的特征缺失值比例均在30%以下,說(shuō)明在數(shù)據(jù)采集的過(guò)程中出現(xiàn)了數(shù)據(jù)丟失,本文使用均值填充。經(jīng)過(guò)缺失值預(yù)處理之后的訓(xùn)練集大小為(6 700,32),測(cè)試集大小為(3 300,32)。圖3 測(cè)試集數(shù)據(jù)缺失值分布情況
測(cè)試集數(shù)據(jù)缺失值分布情況
【參考文獻(xiàn)】:
期刊論文
[1]基于梯度分布調(diào)節(jié)策略的Xgboost算法優(yōu)化[J]. 李浩,朱焱. 計(jì)算機(jī)應(yīng)用. 2020(06)
[2]地下綜合管廊全生命周期安全評(píng)估技術(shù)[J]. 商冬凡,盧明,苗雷強(qiáng),趙一凡. 建筑結(jié)構(gòu). 2019(S2)
[3]綜合管廊全生命周期安全風(fēng)險(xiǎn)辨識(shí)體系[J]. 強(qiáng)萬(wàn)明,商冬凡,盧明,趙一凡. 土木工程與管理學(xué)報(bào). 2019(05)
[4]基于深度LightGBM集成學(xué)習(xí)模型的谷歌商店顧客購(gòu)買(mǎi)力預(yù)測(cè)[J]. 葉志宇,馮愛(ài)民,高航. 計(jì)算機(jī)應(yīng)用. 2019(12)
[5]地下綜合管廊全壽命周期風(fēng)險(xiǎn)評(píng)估與分析[J]. 張勇,張然然. 西安建筑科技大學(xué)學(xué)報(bào)(自然科學(xué)版). 2019(02)
[6]利用先驗(yàn)正態(tài)分布的貝葉斯網(wǎng)絡(luò)參數(shù)學(xué)習(xí)[J]. 柴慧敏,趙昀瑤,方敏. 系統(tǒng)工程與電子技術(shù). 2018(10)
[7]綜合管廊多災(zāi)種耦合致災(zāi)風(fēng)險(xiǎn)評(píng)價(jià)方法[J]. 王述紅,張澤,侯文帥,王斐笠. 東北大學(xué)學(xué)報(bào)(自然科學(xué)版). 2018(06)
[8]貝葉斯優(yōu)化方法和應(yīng)用綜述[J]. 崔佳旭,楊博. 軟件學(xué)報(bào). 2018(10)
[9]基于數(shù)據(jù)融合的高速公路交通狀況檢測(cè)[J]. 崔艷玲,金蓓弘,張扶桑. 計(jì)算機(jī)學(xué)報(bào). 2017(08)
碩士論文
[1]城市地下綜合管廊運(yùn)維安全風(fēng)險(xiǎn)管理研究[D]. 李宏遠(yuǎn).北京建筑大學(xué) 2019
[2]綜合管廊環(huán)境安全性監(jiān)測(cè)多源信息融合應(yīng)用研究[D]. 趙婷.西安建筑科技大學(xué) 2018
[3]Logistic回歸及其相關(guān)方法在個(gè)人信用評(píng)分中的應(yīng)用[D]. 張婷婷.太原理工大學(xué) 2017
[4]基于連續(xù)貝葉斯網(wǎng)絡(luò)的火災(zāi)預(yù)警研究[D]. 呂燦.廣東工業(yè)大學(xué) 2016
本文編號(hào):3401891
【文章來(lái)源】:計(jì)算機(jī)應(yīng)用. 2020,40(S1)北大核心CSCD
【文章頁(yè)數(shù)】:5 頁(yè)
【部分圖文】:
模型構(gòu)建流程
地下綜合管廊中數(shù)據(jù)在采集過(guò)程中會(huì)存在數(shù)據(jù)缺失,本文首先對(duì)數(shù)據(jù)集的缺失值進(jìn)行統(tǒng)計(jì),根據(jù)每個(gè)特征的缺失值構(gòu)造出is_null與isnull_Seg這兩個(gè)特征,訓(xùn)練集缺失值分布情況如圖2所示,測(cè)試集的數(shù)據(jù)缺失值分布如圖3所示。可以看出,訓(xùn)練集測(cè)試集的數(shù)據(jù)缺失值分布基本一致,因此這兩部分?jǐn)?shù)據(jù)可以使用同一種缺失值處理策略。數(shù)據(jù)集中G_HS1與G_HS2這兩個(gè)特征缺失值比例明顯大于80%,這兩個(gè)特征會(huì)帶入較大的噪聲,對(duì)結(jié)果造成不良影響,因此直接將其進(jìn)行剔除。其中G_CH1、C_HS1、C_HS2、G_H1這些特征的缺失值比例在30%~80%,可能是某一種屬性值的缺失,因此使用-1填充;其他的特征缺失值比例均在30%以下,說(shuō)明在數(shù)據(jù)采集的過(guò)程中出現(xiàn)了數(shù)據(jù)丟失,本文使用均值填充。經(jīng)過(guò)缺失值預(yù)處理之后的訓(xùn)練集大小為(6 700,32),測(cè)試集大小為(3 300,32)。圖3 測(cè)試集數(shù)據(jù)缺失值分布情況
測(cè)試集數(shù)據(jù)缺失值分布情況
【參考文獻(xiàn)】:
期刊論文
[1]基于梯度分布調(diào)節(jié)策略的Xgboost算法優(yōu)化[J]. 李浩,朱焱. 計(jì)算機(jī)應(yīng)用. 2020(06)
[2]地下綜合管廊全生命周期安全評(píng)估技術(shù)[J]. 商冬凡,盧明,苗雷強(qiáng),趙一凡. 建筑結(jié)構(gòu). 2019(S2)
[3]綜合管廊全生命周期安全風(fēng)險(xiǎn)辨識(shí)體系[J]. 強(qiáng)萬(wàn)明,商冬凡,盧明,趙一凡. 土木工程與管理學(xué)報(bào). 2019(05)
[4]基于深度LightGBM集成學(xué)習(xí)模型的谷歌商店顧客購(gòu)買(mǎi)力預(yù)測(cè)[J]. 葉志宇,馮愛(ài)民,高航. 計(jì)算機(jī)應(yīng)用. 2019(12)
[5]地下綜合管廊全壽命周期風(fēng)險(xiǎn)評(píng)估與分析[J]. 張勇,張然然. 西安建筑科技大學(xué)學(xué)報(bào)(自然科學(xué)版). 2019(02)
[6]利用先驗(yàn)正態(tài)分布的貝葉斯網(wǎng)絡(luò)參數(shù)學(xué)習(xí)[J]. 柴慧敏,趙昀瑤,方敏. 系統(tǒng)工程與電子技術(shù). 2018(10)
[7]綜合管廊多災(zāi)種耦合致災(zāi)風(fēng)險(xiǎn)評(píng)價(jià)方法[J]. 王述紅,張澤,侯文帥,王斐笠. 東北大學(xué)學(xué)報(bào)(自然科學(xué)版). 2018(06)
[8]貝葉斯優(yōu)化方法和應(yīng)用綜述[J]. 崔佳旭,楊博. 軟件學(xué)報(bào). 2018(10)
[9]基于數(shù)據(jù)融合的高速公路交通狀況檢測(cè)[J]. 崔艷玲,金蓓弘,張扶桑. 計(jì)算機(jī)學(xué)報(bào). 2017(08)
碩士論文
[1]城市地下綜合管廊運(yùn)維安全風(fēng)險(xiǎn)管理研究[D]. 李宏遠(yuǎn).北京建筑大學(xué) 2019
[2]綜合管廊環(huán)境安全性監(jiān)測(cè)多源信息融合應(yīng)用研究[D]. 趙婷.西安建筑科技大學(xué) 2018
[3]Logistic回歸及其相關(guān)方法在個(gè)人信用評(píng)分中的應(yīng)用[D]. 張婷婷.太原理工大學(xué) 2017
[4]基于連續(xù)貝葉斯網(wǎng)絡(luò)的火災(zāi)預(yù)警研究[D]. 呂燦.廣東工業(yè)大學(xué) 2016
本文編號(hào):3401891
本文鏈接:http://sikaile.net/guanlilunwen/chengjian/3401891.html
最近更新
教材專(zhuān)著