天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 電力論文 >

面向不平衡數(shù)據(jù)集分類的離散高維空間距離采樣和極端隨機樹算法

發(fā)布時間:2021-03-10 01:34
  針對電網(wǎng)故障診斷數(shù)據(jù)的類別分布不平衡,即故障類別相對正常類別比值小問題,提出一種基于Trees)的電網(wǎng)故障診斷方法。在采樣階段根據(jù)故障類樣本的內(nèi)部分布密度自適應計算合成新樣本數(shù)量;在合成新樣本時,計算離散型數(shù)據(jù)樣本點之間的高維空間距離,使點之間的合成數(shù)量與距離成負相關關系,進行合成新樣本;在基分類器生成過程中,節(jié)點分裂時隨機選擇特征,巧妙借助極端隨機樹隨機性強方差低的特性解決了噪聲數(shù)據(jù)的影響。實驗結(jié)果對比傳統(tǒng)分類和常用不平衡分類表明,該算法有效地提升了故障類的精度,同時克服了以往別的算法隨機過采樣導致的正常類精度下降,G-mean值達到82.6%,具有優(yōu)越的電網(wǎng)故障診斷預測性能。 

【文章來源】:計算機應用與軟件. 2020,37(07)北大核心

【文章頁數(shù)】:7 頁

【部分圖文】:

面向不平衡數(shù)據(jù)集分類的離散高維空間距離采樣和極端隨機樹算法


各采樣算法合成樣本對比圖

流程圖,流程圖,數(shù)據(jù)集,分類器


本文實驗的流程圖如圖2所示。首先基于多源數(shù)據(jù)庫的數(shù)據(jù)進行數(shù)據(jù)預處理(數(shù)據(jù)清理、數(shù)據(jù)集成),得到以上數(shù)據(jù)集。數(shù)據(jù)集按照6∶4對每個類進行隨機采樣,得到訓練集Dtrain和測試集Dtest。然后使用ADASYN-DHSD-ET算法對Dtrain訓練故障診斷模型,算法對4個故障類進行過采樣,根據(jù)故障類的密度分布自動生成新樣本,改變數(shù)據(jù)集的平衡度,并使采樣后的數(shù)據(jù)保持原樣本的特征。對生成新樣本數(shù)量進行調(diào)參,依次設置采樣數(shù)量為原樣本的10、20、50、100、200倍直到與正常類樣本數(shù)量相同。每個基分類器對全部的新數(shù)據(jù)集進行分類,在節(jié)點分裂時在11個特征中隨機選取分裂特征,不減枝,充分考慮數(shù)據(jù)集特征。對基分類器的數(shù)量進行調(diào)參,依次設置生成基分類器數(shù)量100、200、500、1 000。集成分類器進行投票得到訓練模型。使用Dtest驗證訓練模型,根據(jù)每個參數(shù)設置進行實驗,得到最優(yōu)模型。

【參考文獻】:
期刊論文
[1]不均衡數(shù)據(jù)分類算法的綜述[J]. 陶新民,郝思媛,張冬雪,徐鵬.  重慶郵電大學學報(自然科學版). 2013(01)



本文編號:3073823

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/dianlilw/3073823.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶06b84***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com