天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

面向粒計(jì)算的動(dòng)態(tài)鄰域不平衡數(shù)據(jù)分類算法

發(fā)布時(shí)間:2021-10-25 22:53
  數(shù)據(jù)分布不平衡問題是機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘領(lǐng)域的研究熱點(diǎn),在許多現(xiàn)實(shí)世界的實(shí)際應(yīng)用中人們往往更關(guān)注那些數(shù)量稀少的少數(shù)類數(shù)據(jù)。為了改進(jìn)不平衡數(shù)據(jù)分類算法的分類效果,通常從數(shù)據(jù)采樣和分類算法這兩個(gè)方向上進(jìn)行完善。但是數(shù)據(jù)采樣方法大多數(shù)只能在全局層面上改善數(shù)據(jù)集的不平衡程度,而無法改善在局部中的數(shù)據(jù)分布。因此近鄰算法、鄰域粗糙集理論以及三支決策等理論需要不斷改進(jìn)以更適應(yīng)數(shù)據(jù)的不平衡分布。本文使用一種新的鄰域構(gòu)建方法,構(gòu)造動(dòng)態(tài)均等查詢鄰域,通過生成動(dòng)態(tài)鄰域判別稀疏程度,調(diào)整正向后驗(yàn)概率估計(jì)細(xì)化分類決策。該方法提高了對(duì)稀有數(shù)據(jù)的靈敏度,并為所有數(shù)據(jù)提供相同的查詢機(jī)會(huì),而不會(huì)過于偏向稀有類。利用鄰域粗糙集理論對(duì)極端分布情況進(jìn)行處理,消除缺乏稀有類數(shù)據(jù)的不確定性。根據(jù)細(xì)化后實(shí)例分布情況再分類決定后,基于鄰域粗糙集的動(dòng)態(tài)均等近鄰分類算法可以將查詢實(shí)例更準(zhǔn)確地分類到類別中。本文還提出一種基于三支決策的動(dòng)態(tài)均等近鄰分類算法,首先構(gòu)建動(dòng)態(tài)均等查詢鄰域,之后利用三支決策理論更準(zhǔn)確細(xì)致的對(duì)待測(cè)樣本進(jìn)行分類。利用正域和負(fù)域確定性信息先對(duì)一部分確定性高的樣本進(jìn)行分類,然后在邊界域中細(xì)化局部鄰域數(shù)據(jù)分布情況。調(diào)整后驗(yàn)概率... 

【文章來源】:大連海事大學(xué)遼寧省 211工程院校

【文章頁數(shù)】:59 頁

【學(xué)位級(jí)別】:碩士

【部分圖文】:

面向粒計(jì)算的動(dòng)態(tài)鄰域不平衡數(shù)據(jù)分類算法


圖5.1?ROC曲線圖??Fig.?5.1?ROC?graph??

【參考文獻(xiàn)】:
期刊論文
[1]一種基于質(zhì)心空間的不均衡數(shù)據(jù)欠采樣方法[J]. 金旭,王磊,孫國梓,李華康.  計(jì)算機(jī)科學(xué). 2019(02)
[2]不平衡數(shù)據(jù)分類預(yù)測(cè)的閾值優(yōu)化算法ε-KSVM[J]. 金鑫,葛國青,陸旭,趙永彬.  計(jì)算機(jī)應(yīng)用與軟件. 2018(01)
[3]基于圖和改進(jìn)K近鄰模型的高效協(xié)同過濾推薦算法[J]. 孟桓羽,劉真,王芳,徐家棟,張國強(qiáng).  計(jì)算機(jī)研究與發(fā)展. 2017(07)
[4]基于隨機(jī)森林和欠采樣集成的垃圾網(wǎng)頁檢測(cè)[J]. 盧曉勇,陳木生.  計(jì)算機(jī)應(yīng)用. 2016(03)
[5]自動(dòng)發(fā)音錯(cuò)誤檢測(cè)中基于最大化F1值準(zhǔn)則的區(qū)分性特征補(bǔ)償訓(xùn)練算法[J]. 黃浩,徐海華,王羨慧,吾守爾·斯拉木.  電子學(xué)報(bào). 2015(07)
[6]基于鄰域粗糙集的多標(biāo)記分類特征選擇算法[J]. 段潔,胡清華,張靈均,錢宇華,李德玉.  計(jì)算機(jī)研究與發(fā)展. 2015(01)
[7]不平衡情感分類中的特征選擇方法研究[J]. 王志昊,王中卿,李壽山,李培峰.  中文信息學(xué)報(bào). 2013(04)
[8]不平衡數(shù)據(jù)分類方法及其在入侵檢測(cè)中的應(yīng)用研究[J]. 江頡,王卓芳,GONG Rong-sheng,陳鐵明.  計(jì)算機(jī)科學(xué). 2013(04)
[9]一種SVM不平衡分類方法及在故障診斷的應(yīng)用[J]. 王德成,林輝.  電機(jī)與控制學(xué)報(bào). 2012(09)
[10]類別不平衡的分類方法及在生物信息學(xué)中的應(yīng)用[J]. 鄒權(quán),郭茂祖,劉揚(yáng),王峻.  計(jì)算機(jī)研究與發(fā)展. 2010(08)



本文編號(hào):3458316

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/lindaojc/3458316.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶387f0***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com