天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 自動(dòng)化論文 >

不平衡數(shù)據(jù);瘜W(xué)習(xí)機(jī)建模研究

發(fā)布時(shí)間:2021-01-18 21:12
  不平衡數(shù)據(jù)處理是數(shù)據(jù)挖掘領(lǐng)域的重要研究?jī)?nèi)容。由于不平衡數(shù)據(jù)集的樣本類間數(shù)量嚴(yán)重不平衡,傳統(tǒng)的分類模型關(guān)注數(shù)據(jù)的整體準(zhǔn)確率,少數(shù)類樣本識(shí)別精度低。當(dāng)數(shù)據(jù)不平衡比較大時(shí),傳統(tǒng)模型難以提高少數(shù)類樣本的分類精度,且普遍存在運(yùn)算時(shí)間長(zhǎng)、計(jì)算成本高等問(wèn)題。因此,針對(duì)不平衡數(shù)據(jù)的結(jié)構(gòu)特點(diǎn),研究既能提高少數(shù)類樣本的識(shí)別精度,又能降低數(shù)據(jù)規(guī)模的算法具有重要的現(xiàn)實(shí)意義。數(shù)據(jù);墙档蛿(shù)據(jù)維度的有效方法,以不同的粒化方法與分類器結(jié)合作為分類工具,降低數(shù)據(jù)維度、提高少數(shù)類樣本識(shí)別精度為主要目標(biāo),提出了新的粒化學(xué)習(xí)機(jī)建模方法。主要貢獻(xiàn)如下:1.針對(duì)數(shù)據(jù)粒化后,傳統(tǒng)算法仍需在所有粒層上進(jìn)行建模學(xué)習(xí),計(jì)算時(shí)間較長(zhǎng)的問(wèn)題,探索一種基于粒計(jì)算學(xué)習(xí)機(jī)模型構(gòu)建方法,獲取最優(yōu)粒層,提升算法學(xué)習(xí)效率。2.針對(duì)采用Tomek-Link方法的欠采樣算法,剔除邊界樣本較少,不能有效平衡數(shù)據(jù)結(jié)構(gòu)的問(wèn)題,在Tomek-Link方法的基礎(chǔ)上,提出一種基于Tomek-Link的改進(jìn);惴ú(gòu)建模型,克服Tomek-Link算法剔除樣本少的問(wèn)題。3.針對(duì)在集成學(xué)習(xí)框架下,模型集成策略主觀性較強(qiáng)的問(wèn)題,提出Bagging;訖(quán)集成分類模型,... 

【文章來(lái)源】:華北理工大學(xué)河北省

【文章頁(yè)數(shù)】:83 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

不平衡數(shù)據(jù)粒化學(xué)習(xí)機(jī)建模研究


不平衡數(shù)據(jù)散點(diǎn)圖

模糊化處理,數(shù)據(jù),空間,模糊集


華北理工大學(xué)碩士學(xué)位論文-10-第2章基于粒計(jì)算的學(xué)習(xí)機(jī)模型構(gòu)建本章主要介紹了基于粒計(jì)算的學(xué)習(xí)機(jī)模型的預(yù)備知識(shí)、粒劃分與模型構(gòu)建、;(jì)算、實(shí)驗(yàn)對(duì)比與性能分析及本章小結(jié)五個(gè)方面的內(nèi)容。2.1預(yù)備知識(shí)本節(jié)主要介紹了模糊集與模糊商空間和二元關(guān)系的基礎(chǔ)知識(shí)與定義。2.1.1模糊集與模糊商空間模糊集用于表示界限或邊界不分明的具有特定性質(zhì)的集合,模糊等價(jià)關(guān)系考慮的并不是有無(wú)關(guān)系,而是關(guān)系的深淺程度,目前模糊集已被廣泛應(yīng)用于數(shù)據(jù)預(yù)處理階段[50]。圖2數(shù)據(jù)模糊化處理Fig.2Datafuzzification商空間理論有助于解決多粒度計(jì)算問(wèn)題,多粒度計(jì)算是人類求解問(wèn)題的主要特征之一。商空間可以模擬人類從不同粒度視角觀察世界,其主要內(nèi)容包括復(fù)雜問(wèn)題的商空間描述、商空間粒度計(jì)算、粒度空間關(guān)系的推理等[51-53]。命題1[52]設(shè)d是X上任意兩個(gè)屬性之間的距離,令,,yxdyxd,10,稱d為d的截關(guān)系。若定義d對(duì)應(yīng)的商空間為X,則X10為X上的分層遞階結(jié)構(gòu)。命題2[52]給定X上的一個(gè)模糊等價(jià)關(guān)系,則對(duì)應(yīng)一個(gè)X上的分層遞階結(jié)構(gòu)。

二元關(guān)系,;^(guò)程


第2章基于粒計(jì)算的學(xué)習(xí)機(jī)模型構(gòu)建-11-2.1.2二元關(guān)系定義1:設(shè)二元關(guān)系R和S是論域U上的二元關(guān)系,則:RxSyxRyyxS}|),{((1)RxSyxRyyxS}|),{((2)公式(1)為二元關(guān)系的交運(yùn)算;公式(2)為二元關(guān)系的并運(yùn)算。采用二元關(guān)系交運(yùn)算實(shí)現(xiàn)數(shù)據(jù)劃分,稱為等價(jià)劃分[54]。使用關(guān)系R和S獲得劃分的粒,應(yīng)用二元關(guān)系的交運(yùn)算,對(duì)合并后的;瘮(shù)據(jù)集進(jìn)行粒層細(xì)化計(jì)算,新的粒包含在兩個(gè)參與運(yùn)算的舊信息粒中,具體粒化運(yùn)算過(guò)程如圖3所示。圖3二元關(guān)系;^(guò)程Fig.3Binaryrelationshipgranulationprocess2.2粒劃分與模型構(gòu)建屬性重要度不僅差異很大且具有高度非線性的特征[55]。在這種情況下直接應(yīng)用機(jī)器學(xué)習(xí)進(jìn)行建模處理,往往很難獲得問(wèn)題的有效解。因此,結(jié)合排序結(jié)果應(yīng)用二元關(guān)系進(jìn)行粒層劃分,獲得不同的數(shù)據(jù)集粒層空間,進(jìn)而應(yīng)用極限學(xué)習(xí)機(jī)建模,將會(huì)大大加快數(shù)據(jù)處理速度,精簡(jiǎn)網(wǎng)絡(luò)結(jié)構(gòu)[56]?紤]數(shù)據(jù)集中多屬性特征,以屬性重要度權(quán)重為粒子,實(shí)施權(quán)重;。模型流程如圖4所示。具體步驟如下:第1步:數(shù)據(jù)處理中,樣本集數(shù)據(jù)存在量綱、取值范圍等因素的影響,直接應(yīng)用數(shù)據(jù)進(jìn)行計(jì)算,將產(chǎn)生很大誤差,導(dǎo)致結(jié)果不收斂。針對(duì)這一問(wèn)題,研究數(shù)據(jù)規(guī)范化處理算法,將樣本中各屬性轉(zhuǎn)換到固定統(tǒng)一的區(qū)間上,以便于后續(xù)計(jì)算。第2步:利用夾角余弦公式(3)構(gòu)建樣本間的模糊相似矩陣。

【參考文獻(xiàn)】:
期刊論文
[1]基于CSD-ELM的不平衡數(shù)據(jù)分類算法[J]. 王大飛,解武杰,董文瀚.  計(jì)算機(jī)工程. 2019(11)
[2]改進(jìn)SMOTE的不平衡數(shù)據(jù)集成分類算法[J]. 王忠震,黃勃,方志軍,高永彬,張娟.  計(jì)算機(jī)應(yīng)用. 2019(09)
[3]基于概率采樣和集成學(xué)習(xí)的不平衡數(shù)據(jù)分類算法[J]. 曹雅茜,黃海燕.  計(jì)算機(jī)科學(xué). 2019(05)
[4]一種改進(jìn)型的不平衡數(shù)據(jù)欠采樣算法[J]. 魏力,張育平.  小型微型計(jì)算機(jī)系統(tǒng). 2019(05)
[5]劃分序乘積空間:基于劃分的粒計(jì)算模型[J]. 徐怡,姚一豫.  計(jì)算機(jī)研究與發(fā)展. 2019(04)
[6]一種基于質(zhì)心空間的不均衡數(shù)據(jù)欠采樣方法[J]. 金旭,王磊,孫國(guó)梓,李華康.  計(jì)算機(jī)科學(xué). 2019(02)
[7]基于粒計(jì)算的極限學(xué)習(xí)機(jī)模型設(shè)計(jì)與應(yīng)用[J]. 陳麗芳,代琪,付其峰.  計(jì)算機(jī)科學(xué). 2018(10)
[8]基于屬性;垲惻c回聲狀態(tài)網(wǎng)絡(luò)的末制導(dǎo)雷達(dá)故障診斷[J]. 逯程,徐廷學(xué),王虹.  上海交通大學(xué)學(xué)報(bào). 2018(09)
[9]監(jiān)督鄰域粗糙集[J]. 汪琳娜,楊新,楊習(xí)貝.  計(jì)算機(jī)科學(xué). 2018(08)
[10]基于類重疊度欠采樣的不平衡模糊多類支持向量機(jī)[J]. 吳園園,申立勇.  中國(guó)科學(xué)院大學(xué)學(xué)報(bào). 2018(04)

博士論文
[1]粒度聚類方法研究[D]. 朱紅.中國(guó)礦業(yè)大學(xué) 2013

碩士論文
[1]基于CART決策樹的高分遙感影像建筑物提取研究[D]. 劉兆彬.華中師范大學(xué) 2018
[2]基于膜計(jì)算的人工魚群優(yōu)化算法研究[D]. 寧貴敏.西南交通大學(xué) 2017
[3]基于支持向量機(jī)的不平衡數(shù)據(jù)分類算法研究[D]. 劉東啟.浙江大學(xué) 2017
[4]一種基于數(shù)據(jù)聚類的信息粒化方法[D]. 雷聰聰.鄭州大學(xué) 2010



本文編號(hào):2985678

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2985678.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶13038***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com