面向在線不均衡數(shù)據(jù)分類的極限學(xué)習(xí)機(jī)算法研究
本文關(guān)鍵詞:面向在線不均衡數(shù)據(jù)分類的極限學(xué)習(xí)機(jī)算法研究
更多相關(guān)文章: 極限學(xué)習(xí)機(jī) 不均衡分類 在線貫序數(shù)據(jù) 主曲線 留一交叉驗(yàn)證
【摘要】:在實(shí)際工程問(wèn)題中,存在大量的類別不均衡問(wèn)題,如故障診斷、網(wǎng)絡(luò)入侵檢測(cè)等。且該類問(wèn)題具有明顯的時(shí)間特點(diǎn),尤其是在大規(guī)模數(shù)據(jù)環(huán)境下,數(shù)據(jù)通常是按序到達(dá),是一種典型的在線不均衡分類問(wèn)題。極限學(xué)習(xí)機(jī)作為一種單隱層前饋神經(jīng)網(wǎng)絡(luò),具有極端快速的特點(diǎn),同時(shí)其泛化性能良好,可有效解決在線貫序數(shù)據(jù)的分類問(wèn)題。然而,極限學(xué)習(xí)機(jī)通常是以提高樣本整體的分類精度為目標(biāo),當(dāng)類別嚴(yán)重不均衡時(shí),極易導(dǎo)致分類面偏移,造成“虛假”的分類效果。因此,本文將根據(jù)數(shù)據(jù)特點(diǎn)和應(yīng)用需求,在前端充分采集數(shù)據(jù)和處理數(shù)據(jù)的基礎(chǔ)上,進(jìn)行后端機(jī)器學(xué)習(xí)理論和算法的研究,提出一系列更適合在線不均衡分類問(wèn)題的算法。主要工作和貢獻(xiàn)如下:(1)為提高不均衡在線貫序數(shù)據(jù)中少類樣本的分類精度,提出一種基于不均衡樣本重構(gòu)的加權(quán)在線極限學(xué)習(xí)機(jī)算法。該算法的關(guān)鍵是在提取數(shù)據(jù)分布特性的基礎(chǔ)上,對(duì)不均衡樣本重構(gòu)。為此,引入主曲線的概念,并在此基礎(chǔ)上改進(jìn)SMOTE方法,從而提高少類樣本的過(guò)采樣質(zhì)量,同時(shí),為突出樣本重要性,采用動(dòng)態(tài)加權(quán)的思想,根據(jù)訓(xùn)練誤差為在線樣本賦以相應(yīng)大小的權(quán)重。最終在不增加算法復(fù)雜度的前提下,對(duì)少類樣本的預(yù)測(cè)精度更高,同時(shí)數(shù)值穩(wěn)定性良好。(2)針對(duì)現(xiàn)有分類算法泛化性能較低的問(wèn)題,提出一種基于留一交叉驗(yàn)證的在線極限學(xué)習(xí)機(jī)算法,既實(shí)現(xiàn)了對(duì)在線泛化誤差的快速有效估計(jì),又大大降低了時(shí)間復(fù)雜度。為解決在線樣本的不均衡問(wèn)題,根據(jù)留一誤差進(jìn)行欠采樣,同時(shí),為保證模型的簡(jiǎn)約性,采用增刪機(jī)制動(dòng)態(tài)更新網(wǎng)絡(luò)權(quán)值,并從信息熵的角度給出在線欠采樣過(guò)程中存在損失信息上界,進(jìn)而從理論上證明了該算法的有效性。(3)為進(jìn)一步提高不均衡在線數(shù)據(jù)中少類樣本的識(shí)別率,同時(shí)盡可能減少多類樣本的分類精度損失,提出一種基于混合采樣策略的在線極限學(xué)習(xí)機(jī)算法。該算法在遵循樣本分布特性的同時(shí),根據(jù)樣本重要度指標(biāo)篩選最具價(jià)值的樣本點(diǎn),實(shí)現(xiàn)樣本重構(gòu)。同時(shí)為保證模型的泛化性能,根據(jù)在線留一誤差進(jìn)行動(dòng)態(tài)模型調(diào)整,以確保最優(yōu)網(wǎng)絡(luò)結(jié)構(gòu),并通過(guò)理論分析和大量仿真實(shí)驗(yàn)證明該算法的合理性和有效性。本文研究不僅拓寬了極限學(xué)習(xí)機(jī)的理論與算法研究,也為在線不均衡分類問(wèn)題提供了新的解決方案,同時(shí)本文所研究的理論和相應(yīng)算法,均可直接應(yīng)用于其他領(lǐng)域的信號(hào)處理,對(duì)于實(shí)際工程問(wèn)題中的不均衡分類問(wèn)題的解決,如網(wǎng)絡(luò)入侵檢測(cè),疾病診斷等,也具有良好的借鑒意義。
【學(xué)位授予單位】:河南師范大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP181
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 葛磊;武芳;王鵬波;張冬林;;3維建筑綜合中基于最小特征的面平移算法[J];測(cè)繪科學(xué)技術(shù)學(xué)報(bào);2009年02期
2 駱雯,孫延明,陳振威,陳錦昌;判斷點(diǎn)與封閉多邊形相對(duì)關(guān)系的改進(jìn)算法[J];機(jī)械;1999年03期
3 李林;盧顯良;;一種基于切割映射的規(guī)則沖突消除算法[J];電子學(xué)報(bào);2008年02期
4 劉巧玲;張紅英;林茂松;;一種簡(jiǎn)單快速的圖像去霧算法[J];計(jì)算機(jī)應(yīng)用與軟件;2013年07期
5 林亞平,楊小林;快速概率分析進(jìn)化算法及其性能研究[J];電子學(xué)報(bào);2001年02期
6 章郡鋒;吳曉紅;黃曉強(qiáng);何小海;;基于暗原色先驗(yàn)去霧的改進(jìn)算法[J];電視技術(shù);2013年23期
7 楊鐵軍;靳婷;;一種動(dòng)態(tài)整周模糊值求解算法及其仿真分析[J];系統(tǒng)工程與電子技術(shù);2007年01期
8 周秀玲;郭平;陳寶維;王靜;;幾種計(jì)算超體積算法的比較研究[J];計(jì)算機(jī)工程;2011年03期
9 吳一戎,胡東輝,彭海良;Chirp Scaling SAR成象算法及其實(shí)現(xiàn)[J];電子科學(xué)學(xué)刊;1995年03期
10 王貴竹;一種產(chǎn)生單向分解值的算法[J];安徽大學(xué)學(xué)報(bào)(自然科學(xué)版);2001年03期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條
1 尹冀鋒;;一種新的圖象自適應(yīng)增強(qiáng)算法[A];四川省通信學(xué)會(huì)一九九二年學(xué)術(shù)年會(huì)論文集[C];1992年
2 寧春平;田家瑋;郭延輝;王影;張英濤;鄭桂霞;劉研;;計(jì)算機(jī)輔助增強(qiáng)、分割算法在鑒別乳腺良、惡性腫塊中的應(yīng)用價(jià)值[A];中華醫(yī)學(xué)會(huì)第十次全國(guó)超聲醫(yī)學(xué)學(xué)術(shù)會(huì)議論文匯編[C];2009年
3 謝麗聰;;SVB查詢改寫算法的改進(jìn)[A];第二十一屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2004年
4 鄭存紅;;復(fù)雜背景下相關(guān)跟蹤算法研究及DSP實(shí)現(xiàn)[A];中國(guó)光學(xué)學(xué)會(huì)2010年光學(xué)大會(huì)論文集[C];2010年
5 楊文杰;吳軍;;RFID抗沖突算法研究[A];2008通信理論與技術(shù)新進(jìn)展——第十三屆全國(guó)青年通信學(xué)術(shù)會(huì)議論文集(上)[C];2008年
6 高山;畢篤彥;魏娜;;一種基于UPF的小目標(biāo)TBD算法[A];第十四屆全國(guó)圖象圖形學(xué)學(xué)術(shù)會(huì)議論文集[C];2008年
7 周磊;張衛(wèi)華;王曉奇;張軍;;基于流水算法的智能路障機(jī)器人設(shè)計(jì)[A];2011年全國(guó)電子信息技術(shù)與應(yīng)用學(xué)術(shù)會(huì)議論文集[C];2011年
8 潘巍;李戰(zhàn)懷;陳群;索博;李衛(wèi)榜;;面向MapReduce的非對(duì)稱分片復(fù)制連接算法優(yōu)化技術(shù)研究[A];第29屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(B輯)(NDBC2012)[C];2012年
9 李偉偉;蔡康穎;鄭新;王文成;;3D模型中重復(fù)結(jié)構(gòu)的多尺度快速檢測(cè)算法[A];第六屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2010)、第19屆全國(guó)多媒體學(xué)術(shù)會(huì)議(NCMT2010)、第6屆全國(guó)人機(jī)交互學(xué)術(shù)會(huì)議(CHCI2010)、第5屆全國(guó)普適計(jì)算學(xué)術(shù)會(huì)議(PCC2010)論文集[C];2010年
10 楊任爾;陳懇;勵(lì)金祥;;基于棱邊方向檢測(cè)的運(yùn)動(dòng)自適應(yīng)去隔行算法[A];Proceedings of 2010 Chinese Control and Decision Conference[C];2010年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前1條
1 國(guó)泰君安資產(chǎn)管理部;“算法交易”是道指暴跌罪魁禍?zhǔn)?[N];上海證券報(bào);2010年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 馮輝;網(wǎng)絡(luò)化的并行與分布式優(yōu)化算法研究及應(yīng)用[D];復(fù)旦大學(xué);2013年
2 許玉杰;云計(jì)算環(huán)境下海量數(shù)據(jù)的并行聚類算法研究[D];大連海事大學(xué);2014年
3 李琰;基于貓群算法的高光譜遙感森林類型識(shí)別研究[D];東北林業(yè)大學(xué);2015年
4 陳加順;海洋環(huán)境下聚類算法的研究[D];南京航空航天大學(xué);2014年
5 王洋;基于群體智能的通信網(wǎng)絡(luò)告警關(guān)聯(lián)規(guī)則挖掘算法研究[D];太原理工大學(xué);2015年
6 雷雨;面向考試時(shí)間表問(wèn)題的啟發(fā)式進(jìn)化算法研究[D];西安電子科技大學(xué);2015年
7 熊霖;大數(shù)據(jù)下的數(shù)據(jù)選擇與學(xué)習(xí)算法研究[D];西安電子科技大學(xué);2015年
8 周雷;基于圖結(jié)構(gòu)的目標(biāo)檢測(cè)與分割算法研究[D];上海交通大學(xué);2014年
9 王冰;人工蜂群算法的改進(jìn)及相關(guān)應(yīng)用的研究[D];北京理工大學(xué);2015年
10 蔣亦樟;多視角和遷移學(xué)習(xí)識(shí)別方法和智能建模研究[D];江南大學(xué);2015年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 姚鑫宇;EMD去噪與MUSIC算法在DOA估計(jì)中的聯(lián)合應(yīng)用[D];昆明理工大學(xué);2015年
2 陸進(jìn);面向含噪數(shù)據(jù)聚類相關(guān)算法的研究[D];復(fù)旦大學(xué);2014年
3 葉一舟;紅外弱小目標(biāo)檢測(cè)算法研究[D];上海交通大學(xué);2015年
4 王繼重;基于Hadoop和Mahout的K-Means算法設(shè)計(jì)與實(shí)現(xiàn)[D];大連海事大學(xué);2016年
5 何靜;遙感圖像的快速壓縮算法研究[D];北京交通大學(xué);2016年
6 章華燕;鋼軌擦傷檢測(cè)算法研究[D];北京交通大學(xué);2016年
7 王一博;MODIS地震熱異常的數(shù)據(jù)處理與算法研究[D];中國(guó)石油大學(xué)(華東);2014年
8 成鑫;基于組合優(yōu)化問(wèn)題的多目標(biāo)模因算法的研究[D];南京航空航天大學(xué);2015年
9 傅致暉;基于協(xié)同分割的視頻目標(biāo)分割算法研究[D];上海交通大學(xué);2015年
10 張媛;運(yùn)動(dòng)車輛檢測(cè)與跟蹤算法的研究與實(shí)現(xiàn)[D];大連海事大學(xué);2016年
,本文編號(hào):1212372
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/1212372.html