基于孤立森林算法的取用水量異常數據檢測方法
發(fā)布時間:2021-11-04 15:52
水資源管理系統(tǒng)中儲存著海量的取用水量數據,通過篩選數據中的異常值定位異常取水行為,是水資源監(jiān)管的重要手段。對取用水量數據中的異常值普遍缺乏明確定義,傳統(tǒng)的異常值檢測算法在實時性和穩(wěn)定性方面存在不足。在總結歸納現階段取用水量異常數據種類、特點的基礎上,首先運用平均插值法對可直觀識別異常值進行預處理,在預處理后的數據中隨機取樣訓練,建立多個孤立二叉樹形成孤立森林,以此為工具對數據樣本進行異常值檢測。對某供水公司連續(xù)兩年日取水量監(jiān)測數據的實證分析結果表明,基于孤立森林算法的異常值檢測方法將數據樣本的特征通過非監(jiān)督學習方式存儲在森林中,具有更高的穩(wěn)定性;能夠準確檢測出數據樣本中的異常值,相比于傳統(tǒng)最小二乘擬合方法具有更高的檢出率。
【文章來源】:中國水利水電科學研究院學報. 2020,18(01)北大核心
【文章頁數】:9 頁
【部分圖文】:
孤立森林算法原理
同上,對該城市供水企業(yè)2016年數據進行可直觀識別異常值的處理。在全部366條數據中,共有有效數據364條,缺失數據2條。數據中不存在負值、零值、固定值等情況,補充缺失數據后可直接進行分析檢測異常值,數據預處理結果如表4所示,2016年數據預處理前后效果對比見圖3。與對2017年數據的處理方式相同,對預處理后的2016年樣本數據進行特征分析,結果如表5所示。圖3 2016年數據預處理前后效果對比
2016年數據預處理前后效果對比
【參考文獻】:
期刊論文
[1]基于用戶畫像的異常行為檢測[J]. 朱佳俊,陳功,施勇,薛質. 通信技術. 2017(10)
[2]基于EEMD的水資源監(jiān)測數據異常值檢測與校正[J]. 方海泉,薛惠鋒,蔣云鐘,周鐵軍,萬毅,王海寧. 農業(yè)機械學報. 2017(09)
[3]拉依達準則在處理區(qū)域水文數據異常值中的應用[J]. 侍建國,張亦飛. 海河水利. 2016(05)
[4]時間序列異常值探測的Bayes方法及其GNSS數據質量控制中的應用[J]. 王琰,張倩倩,車通宇,劉永. 中國慣性技術學報. 2016(01)
[5]一種新的基于回歸分析的異常值檢測[J]. 尚華,張貝貝,紀宏. 河南大學學報(自然科學版). 2015(06)
[6]一種基于小波變換的超高壓線路故障選相方法[J]. 王愛軍,李宏,張小桃. 電力系統(tǒng)保護與控制. 2013(12)
[7]一種基于陰性選擇算法的飛行數據異常值檢測方法[J]. 韓旻,趙清洲. 航空計算技術. 2010(04)
[8]基于格拉布斯法的試驗數據分析方法[J]. 肖樹臣,秦玉勛,韓吉慶. 彈箭與制導學報. 2007(01)
[9]基于小波分析的異常樣本處理[J]. 彭小奇,宋彥坡,唐英. 信息與控制. 2005(06)
碩士論文
[1]基于機器學習的電力異常數據檢測[D]. 張為金.電子科技大學 2018
[2]基于數據挖掘的用電數據異常的分析與研究[D]. 張榮昌.北京交通大學 2017
[3]基于小波分析的時間序列異常值檢驗[D]. 張利紅.湘潭大學 2017
本文編號:3476039
【文章來源】:中國水利水電科學研究院學報. 2020,18(01)北大核心
【文章頁數】:9 頁
【部分圖文】:
孤立森林算法原理
同上,對該城市供水企業(yè)2016年數據進行可直觀識別異常值的處理。在全部366條數據中,共有有效數據364條,缺失數據2條。數據中不存在負值、零值、固定值等情況,補充缺失數據后可直接進行分析檢測異常值,數據預處理結果如表4所示,2016年數據預處理前后效果對比見圖3。與對2017年數據的處理方式相同,對預處理后的2016年樣本數據進行特征分析,結果如表5所示。圖3 2016年數據預處理前后效果對比
2016年數據預處理前后效果對比
【參考文獻】:
期刊論文
[1]基于用戶畫像的異常行為檢測[J]. 朱佳俊,陳功,施勇,薛質. 通信技術. 2017(10)
[2]基于EEMD的水資源監(jiān)測數據異常值檢測與校正[J]. 方海泉,薛惠鋒,蔣云鐘,周鐵軍,萬毅,王海寧. 農業(yè)機械學報. 2017(09)
[3]拉依達準則在處理區(qū)域水文數據異常值中的應用[J]. 侍建國,張亦飛. 海河水利. 2016(05)
[4]時間序列異常值探測的Bayes方法及其GNSS數據質量控制中的應用[J]. 王琰,張倩倩,車通宇,劉永. 中國慣性技術學報. 2016(01)
[5]一種新的基于回歸分析的異常值檢測[J]. 尚華,張貝貝,紀宏. 河南大學學報(自然科學版). 2015(06)
[6]一種基于小波變換的超高壓線路故障選相方法[J]. 王愛軍,李宏,張小桃. 電力系統(tǒng)保護與控制. 2013(12)
[7]一種基于陰性選擇算法的飛行數據異常值檢測方法[J]. 韓旻,趙清洲. 航空計算技術. 2010(04)
[8]基于格拉布斯法的試驗數據分析方法[J]. 肖樹臣,秦玉勛,韓吉慶. 彈箭與制導學報. 2007(01)
[9]基于小波分析的異常樣本處理[J]. 彭小奇,宋彥坡,唐英. 信息與控制. 2005(06)
碩士論文
[1]基于機器學習的電力異常數據檢測[D]. 張為金.電子科技大學 2018
[2]基于數據挖掘的用電數據異常的分析與研究[D]. 張榮昌.北京交通大學 2017
[3]基于小波分析的時間序列異常值檢驗[D]. 張利紅.湘潭大學 2017
本文編號:3476039
本文鏈接:http://sikaile.net/kejilunwen/shuiwenshuili/3476039.html