當(dāng)前位置：主頁(yè) > 科技論文 > 自動(dòng)化論文 >

基于深度森林的小數(shù)據(jù)集分類研究

發(fā)布時(shí)間：2025-02-15 10:35

　　隨著現(xiàn)代數(shù)字信息技術(shù)的飛速發(fā)展,各行各業(yè)都生成并存儲(chǔ)了海量數(shù)據(jù),對(duì)這些海量數(shù)據(jù)的準(zhǔn)確分類是對(duì)數(shù)據(jù)后續(xù)有效分析的基礎(chǔ)。由于個(gè)人隱私和安全問(wèn)題,在一些信息保密性高的行業(yè)僅能獲得少量的存儲(chǔ)數(shù)據(jù),并且標(biāo)注大量數(shù)據(jù)的人工成本過(guò)大,這使得可利用的數(shù)據(jù)是非常有限的。研究表明,深度學(xué)習(xí)模型對(duì)訓(xùn)練數(shù)據(jù)需求較大,在一些小規(guī)模數(shù)據(jù)的任務(wù)上易出現(xiàn)過(guò)擬合問(wèn)題,因此,研究小數(shù)據(jù)集分類問(wèn)題具有深遠(yuǎn)的影響價(jià)值。深度森林模型因其可理解性高和自動(dòng)確定級(jí)聯(lián)層數(shù)的特點(diǎn),在處理小數(shù)據(jù)集分類任務(wù)中具有明顯的優(yōu)勢(shì)。小數(shù)據(jù)集樣本量少通常會(huì)存在類別不均衡和多樣性差等問(wèn)題,類別不均衡會(huì)影響隨機(jī)森林不能有效學(xué)習(xí)到類別間的準(zhǔn)確區(qū)分特征,數(shù)據(jù)多樣性差會(huì)導(dǎo)致模型學(xué)習(xí)不到原始數(shù)據(jù)的整體數(shù)據(jù)分布,從而可能導(dǎo)致深度森林模型出現(xiàn)過(guò)擬合現(xiàn)象,使得模型的分類性能不佳。本文針對(duì)這兩個(gè)問(wèn)題作了如下深入分析:1)針對(duì)小數(shù)據(jù)集類別不均衡問(wèn)題,研究了多粒度掃描部分的按類建樹策略,提出了跳躍森林(Skip Connection Forest,SCForest)模型。通過(guò)在深度森林級(jí)聯(lián)層中加入跳躍連接,有效緩解了特征向量后向傳播時(shí)易出現(xiàn)特征消失或特征爆炸現(xiàn)象,并且級(jí)聯(lián)層采...

【文章頁(yè)數(shù)】：59 頁(yè)

【學(xué)位級(jí)別】：碩士

【部分圖文】：

圖2-1選擇禮物問(wèn)題的一顆決策樹

彩薔霾呤骷?傻囊恢旨?裳?埃?哂心Ｐ統(tǒng)?問(wèn)?�、模型竻矀�?低、可并行操作等優(yōu)點(diǎn)。這一部分從決策樹擴(kuò)展到集成學(xué)習(xí)，逐步擴(kuò)展到深度森林模型原理。2.1.1決策樹原理決策樹是一種常見(jiàn)的基于樹結(jié)構(gòu)的學(xué)習(xí)方法。決策樹中的每個(gè)內(nèi)部節(jié)點(diǎn)表示特征屬性的選取試驗(yàn)，每個(gè)分支表示屬性的試驗(yàn)結(jié)果，葉結(jié)點(diǎn)....

圖2-3集成學(xué)習(xí)框架

第2章基本理論基礎(chǔ)9Gini（D）是從數(shù)據(jù)集D中隨機(jī)抽取兩個(gè)樣品的結(jié)果，以及類別標(biāo)記不相符的可能性。也就是說(shuō)，Gini（D）越小D的純度越校在此基礎(chǔ)上，將屬性a的基尼指數(shù)定義為：1||<sub>,</sub>（）||VvvvDGiniindexDaGiniDD2.6然后選擇候選集....

圖2-4Stacking算法框架

??蠐λ婊?≡衿渲?一個(gè)。加權(quán)表決與加權(quán)平均數(shù)相似。標(biāo)準(zhǔn)的絕對(duì)多數(shù)表決方法為“可靠性預(yù)測(cè)”提供了一種選擇。學(xué)習(xí)方法：如果有大量的訓(xùn)練數(shù)據(jù)，適合用“學(xué)習(xí)方法”來(lái)結(jié)合學(xué)習(xí)者。stacking[47]是學(xué)習(xí)方法的典型代表。如圖2-4所示，Stacking是一個(gè)綜合性的分層模型框架，通常....

圖2-5深度森林的多粒度滑窗框架

第2章基本理論基礎(chǔ)13究表明，將學(xué)習(xí)者的輸出類概率作為二級(jí)學(xué)習(xí)者的輸入屬性，MRL作為二級(jí)學(xué)習(xí)算法[58]和MLR中的各種屬性集[49]是比較好的。2.1.3深度森林原理深度森林是一種新的決策樹集成方法。這一方法提供了一種串聯(lián)結(jié)構(gòu)深層森林的集成，從而能夠?qū)W習(xí)數(shù)據(jù)特性。如果輸入較大....

本文編號(hào)：4034173

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會(huì)員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/4034173.html

上一篇：輸出誤差模型加權(quán)多新息隨機(jī)梯度辨識(shí)算法
下一篇：沒(méi)有了

論文發(fā)表

·知網(wǎng)|萬(wàn)方|維普|龍?jiān)磡省級(jí)|國(guó)家級(jí)|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于深度森林的小數(shù)據(jù)集分類研究