基于孤立森林算法的取用水量異常數(shù)據(jù)檢測(cè)方法
發(fā)布時(shí)間:2021-11-04 15:52
水資源管理系統(tǒng)中儲(chǔ)存著海量的取用水量數(shù)據(jù),通過(guò)篩選數(shù)據(jù)中的異常值定位異常取水行為,是水資源監(jiān)管的重要手段。對(duì)取用水量數(shù)據(jù)中的異常值普遍缺乏明確定義,傳統(tǒng)的異常值檢測(cè)算法在實(shí)時(shí)性和穩(wěn)定性方面存在不足。在總結(jié)歸納現(xiàn)階段取用水量異常數(shù)據(jù)種類、特點(diǎn)的基礎(chǔ)上,首先運(yùn)用平均插值法對(duì)可直觀識(shí)別異常值進(jìn)行預(yù)處理,在預(yù)處理后的數(shù)據(jù)中隨機(jī)取樣訓(xùn)練,建立多個(gè)孤立二叉樹(shù)形成孤立森林,以此為工具對(duì)數(shù)據(jù)樣本進(jìn)行異常值檢測(cè)。對(duì)某供水公司連續(xù)兩年日取水量監(jiān)測(cè)數(shù)據(jù)的實(shí)證分析結(jié)果表明,基于孤立森林算法的異常值檢測(cè)方法將數(shù)據(jù)樣本的特征通過(guò)非監(jiān)督學(xué)習(xí)方式存儲(chǔ)在森林中,具有更高的穩(wěn)定性;能夠準(zhǔn)確檢測(cè)出數(shù)據(jù)樣本中的異常值,相比于傳統(tǒng)最小二乘擬合方法具有更高的檢出率。
【文章來(lái)源】:中國(guó)水利水電科學(xué)研究院學(xué)報(bào). 2020,18(01)北大核心
【文章頁(yè)數(shù)】:9 頁(yè)
【部分圖文】:
孤立森林算法原理
同上,對(duì)該城市供水企業(yè)2016年數(shù)據(jù)進(jìn)行可直觀識(shí)別異常值的處理。在全部366條數(shù)據(jù)中,共有有效數(shù)據(jù)364條,缺失數(shù)據(jù)2條。數(shù)據(jù)中不存在負(fù)值、零值、固定值等情況,補(bǔ)充缺失數(shù)據(jù)后可直接進(jìn)行分析檢測(cè)異常值,數(shù)據(jù)預(yù)處理結(jié)果如表4所示,2016年數(shù)據(jù)預(yù)處理前后效果對(duì)比見(jiàn)圖3。與對(duì)2017年數(shù)據(jù)的處理方式相同,對(duì)預(yù)處理后的2016年樣本數(shù)據(jù)進(jìn)行特征分析,結(jié)果如表5所示。圖3 2016年數(shù)據(jù)預(yù)處理前后效果對(duì)比
2016年數(shù)據(jù)預(yù)處理前后效果對(duì)比
【參考文獻(xiàn)】:
期刊論文
[1]基于用戶畫像的異常行為檢測(cè)[J]. 朱佳俊,陳功,施勇,薛質(zhì). 通信技術(shù). 2017(10)
[2]基于EEMD的水資源監(jiān)測(cè)數(shù)據(jù)異常值檢測(cè)與校正[J]. 方海泉,薛惠鋒,蔣云鐘,周鐵軍,萬(wàn)毅,王海寧. 農(nóng)業(yè)機(jī)械學(xué)報(bào). 2017(09)
[3]拉依達(dá)準(zhǔn)則在處理區(qū)域水文數(shù)據(jù)異常值中的應(yīng)用[J]. 侍建國(guó),張亦飛. 海河水利. 2016(05)
[4]時(shí)間序列異常值探測(cè)的Bayes方法及其GNSS數(shù)據(jù)質(zhì)量控制中的應(yīng)用[J]. 王琰,張倩倩,車通宇,劉永. 中國(guó)慣性技術(shù)學(xué)報(bào). 2016(01)
[5]一種新的基于回歸分析的異常值檢測(cè)[J]. 尚華,張貝貝,紀(jì)宏. 河南大學(xué)學(xué)報(bào)(自然科學(xué)版). 2015(06)
[6]一種基于小波變換的超高壓線路故障選相方法[J]. 王愛(ài)軍,李宏,張小桃. 電力系統(tǒng)保護(hù)與控制. 2013(12)
[7]一種基于陰性選擇算法的飛行數(shù)據(jù)異常值檢測(cè)方法[J]. 韓旻,趙清洲. 航空計(jì)算技術(shù). 2010(04)
[8]基于格拉布斯法的試驗(yàn)數(shù)據(jù)分析方法[J]. 肖樹(shù)臣,秦玉勛,韓吉慶. 彈箭與制導(dǎo)學(xué)報(bào). 2007(01)
[9]基于小波分析的異常樣本處理[J]. 彭小奇,宋彥坡,唐英. 信息與控制. 2005(06)
碩士論文
[1]基于機(jī)器學(xué)習(xí)的電力異常數(shù)據(jù)檢測(cè)[D]. 張為金.電子科技大學(xué) 2018
[2]基于數(shù)據(jù)挖掘的用電數(shù)據(jù)異常的分析與研究[D]. 張榮昌.北京交通大學(xué) 2017
[3]基于小波分析的時(shí)間序列異常值檢驗(yàn)[D]. 張利紅.湘潭大學(xué) 2017
本文編號(hào):3476039
【文章來(lái)源】:中國(guó)水利水電科學(xué)研究院學(xué)報(bào). 2020,18(01)北大核心
【文章頁(yè)數(shù)】:9 頁(yè)
【部分圖文】:
孤立森林算法原理
同上,對(duì)該城市供水企業(yè)2016年數(shù)據(jù)進(jìn)行可直觀識(shí)別異常值的處理。在全部366條數(shù)據(jù)中,共有有效數(shù)據(jù)364條,缺失數(shù)據(jù)2條。數(shù)據(jù)中不存在負(fù)值、零值、固定值等情況,補(bǔ)充缺失數(shù)據(jù)后可直接進(jìn)行分析檢測(cè)異常值,數(shù)據(jù)預(yù)處理結(jié)果如表4所示,2016年數(shù)據(jù)預(yù)處理前后效果對(duì)比見(jiàn)圖3。與對(duì)2017年數(shù)據(jù)的處理方式相同,對(duì)預(yù)處理后的2016年樣本數(shù)據(jù)進(jìn)行特征分析,結(jié)果如表5所示。圖3 2016年數(shù)據(jù)預(yù)處理前后效果對(duì)比
2016年數(shù)據(jù)預(yù)處理前后效果對(duì)比
【參考文獻(xiàn)】:
期刊論文
[1]基于用戶畫像的異常行為檢測(cè)[J]. 朱佳俊,陳功,施勇,薛質(zhì). 通信技術(shù). 2017(10)
[2]基于EEMD的水資源監(jiān)測(cè)數(shù)據(jù)異常值檢測(cè)與校正[J]. 方海泉,薛惠鋒,蔣云鐘,周鐵軍,萬(wàn)毅,王海寧. 農(nóng)業(yè)機(jī)械學(xué)報(bào). 2017(09)
[3]拉依達(dá)準(zhǔn)則在處理區(qū)域水文數(shù)據(jù)異常值中的應(yīng)用[J]. 侍建國(guó),張亦飛. 海河水利. 2016(05)
[4]時(shí)間序列異常值探測(cè)的Bayes方法及其GNSS數(shù)據(jù)質(zhì)量控制中的應(yīng)用[J]. 王琰,張倩倩,車通宇,劉永. 中國(guó)慣性技術(shù)學(xué)報(bào). 2016(01)
[5]一種新的基于回歸分析的異常值檢測(cè)[J]. 尚華,張貝貝,紀(jì)宏. 河南大學(xué)學(xué)報(bào)(自然科學(xué)版). 2015(06)
[6]一種基于小波變換的超高壓線路故障選相方法[J]. 王愛(ài)軍,李宏,張小桃. 電力系統(tǒng)保護(hù)與控制. 2013(12)
[7]一種基于陰性選擇算法的飛行數(shù)據(jù)異常值檢測(cè)方法[J]. 韓旻,趙清洲. 航空計(jì)算技術(shù). 2010(04)
[8]基于格拉布斯法的試驗(yàn)數(shù)據(jù)分析方法[J]. 肖樹(shù)臣,秦玉勛,韓吉慶. 彈箭與制導(dǎo)學(xué)報(bào). 2007(01)
[9]基于小波分析的異常樣本處理[J]. 彭小奇,宋彥坡,唐英. 信息與控制. 2005(06)
碩士論文
[1]基于機(jī)器學(xué)習(xí)的電力異常數(shù)據(jù)檢測(cè)[D]. 張為金.電子科技大學(xué) 2018
[2]基于數(shù)據(jù)挖掘的用電數(shù)據(jù)異常的分析與研究[D]. 張榮昌.北京交通大學(xué) 2017
[3]基于小波分析的時(shí)間序列異常值檢驗(yàn)[D]. 張利紅.湘潭大學(xué) 2017
本文編號(hào):3476039
本文鏈接:http://sikaile.net/kejilunwen/shuiwenshuili/3476039.html
最近更新
教材專著