天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 電力論文 >

面向不平衡數(shù)據(jù)集分類的離散高維空間距離采樣和極端隨機(jī)樹(shù)算法

發(fā)布時(shí)間:2021-03-10 01:34
  針對(duì)電網(wǎng)故障診斷數(shù)據(jù)的類別分布不平衡,即故障類別相對(duì)正常類別比值小問(wèn)題,提出一種基于Trees)的電網(wǎng)故障診斷方法。在采樣階段根據(jù)故障類樣本的內(nèi)部分布密度自適應(yīng)計(jì)算合成新樣本數(shù)量;在合成新樣本時(shí),計(jì)算離散型數(shù)據(jù)樣本點(diǎn)之間的高維空間距離,使點(diǎn)之間的合成數(shù)量與距離成負(fù)相關(guān)關(guān)系,進(jìn)行合成新樣本;在基分類器生成過(guò)程中,節(jié)點(diǎn)分裂時(shí)隨機(jī)選擇特征,巧妙借助極端隨機(jī)樹(shù)隨機(jī)性強(qiáng)方差低的特性解決了噪聲數(shù)據(jù)的影響。實(shí)驗(yàn)結(jié)果對(duì)比傳統(tǒng)分類和常用不平衡分類表明,該算法有效地提升了故障類的精度,同時(shí)克服了以往別的算法隨機(jī)過(guò)采樣導(dǎo)致的正常類精度下降,G-mean值達(dá)到82.6%,具有優(yōu)越的電網(wǎng)故障診斷預(yù)測(cè)性能。 

【文章來(lái)源】:計(jì)算機(jī)應(yīng)用與軟件. 2020,37(07)北大核心

【文章頁(yè)數(shù)】:7 頁(yè)

【部分圖文】:

面向不平衡數(shù)據(jù)集分類的離散高維空間距離采樣和極端隨機(jī)樹(shù)算法


各采樣算法合成樣本對(duì)比圖

流程圖,流程圖,數(shù)據(jù)集,分類器


本文實(shí)驗(yàn)的流程圖如圖2所示。首先基于多源數(shù)據(jù)庫(kù)的數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理(數(shù)據(jù)清理、數(shù)據(jù)集成),得到以上數(shù)據(jù)集。數(shù)據(jù)集按照6∶4對(duì)每個(gè)類進(jìn)行隨機(jī)采樣,得到訓(xùn)練集Dtrain和測(cè)試集Dtest。然后使用ADASYN-DHSD-ET算法對(duì)Dtrain訓(xùn)練故障診斷模型,算法對(duì)4個(gè)故障類進(jìn)行過(guò)采樣,根據(jù)故障類的密度分布自動(dòng)生成新樣本,改變數(shù)據(jù)集的平衡度,并使采樣后的數(shù)據(jù)保持原樣本的特征。對(duì)生成新樣本數(shù)量進(jìn)行調(diào)參,依次設(shè)置采樣數(shù)量為原樣本的10、20、50、100、200倍直到與正常類樣本數(shù)量相同。每個(gè)基分類器對(duì)全部的新數(shù)據(jù)集進(jìn)行分類,在節(jié)點(diǎn)分裂時(shí)在11個(gè)特征中隨機(jī)選取分裂特征,不減枝,充分考慮數(shù)據(jù)集特征。對(duì)基分類器的數(shù)量進(jìn)行調(diào)參,依次設(shè)置生成基分類器數(shù)量100、200、500、1 000。集成分類器進(jìn)行投票得到訓(xùn)練模型。使用Dtest驗(yàn)證訓(xùn)練模型,根據(jù)每個(gè)參數(shù)設(shè)置進(jìn)行實(shí)驗(yàn),得到最優(yōu)模型。

【參考文獻(xiàn)】:
期刊論文
[1]不均衡數(shù)據(jù)分類算法的綜述[J]. 陶新民,郝思媛,張冬雪,徐鵬.  重慶郵電大學(xué)學(xué)報(bào)(自然科學(xué)版). 2013(01)



本文編號(hào):3073823

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/dianlilw/3073823.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶06b84***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com