因果特征選擇與結(jié)構(gòu)學(xué)習(xí)算法研究
發(fā)布時(shí)間:2021-08-18 09:30
在過去的三十年中,特征選擇作為一種維數(shù)約減技術(shù),一直是機(jī)器學(xué)習(xí)領(lǐng)域的研究熱點(diǎn)之一。傳統(tǒng)的特征選擇算法由于僅基于特征與類屬性之間相關(guān)性,可能導(dǎo)致預(yù)測分類模型缺乏可解釋性、可操作性和魯棒性。因果特征選擇是發(fā)現(xiàn)類屬性的貝葉斯網(wǎng)絡(luò)(Bayesian network,BN)的子結(jié)構(gòu),即馬爾科夫毯(Markov blanket,MB),該MB由類屬性的父母(直接原因),孩子(直接結(jié)果)和配偶(直接結(jié)果的其他直接原因)組成,從而明確地推導(dǎo)出局部類屬性和特征之間的因果關(guān)系。因此,因果特征選擇作為一種新興的特征選擇方法,通過識別潛在因果特征以構(gòu)建可解釋、可操作且健壯的預(yù)測分類模型,已引起機(jī)器學(xué)習(xí)和因果發(fā)現(xiàn)領(lǐng)域的廣泛關(guān)注。除了用作特征選擇以進(jìn)行分類之外,作為BN的子結(jié)構(gòu),因果特征選擇在學(xué)習(xí)感興趣變量的局部BN結(jié)構(gòu)中起著至關(guān)重要的作用。同時(shí),如果能夠識別數(shù)據(jù)集中所有變量的MB,則這些MB可以用作約束條件以減少搜索空間,從而實(shí)現(xiàn)高效的局部到全局BN結(jié)構(gòu)學(xué)習(xí)。本文以因果特征選擇為核心,開展了分類和因果結(jié)構(gòu)學(xué)習(xí)的相關(guān)研究,主要取得了如下創(chuàng)新性成果:(1)針對因果特征選擇分類問題,同步類因果特征選擇方法將當(dāng)前選擇的...
【文章來源】:合肥工業(yè)大學(xué)安徽省 211工程院校 教育部直屬院校
【文章頁數(shù)】:92 頁
【學(xué)位級別】:博士
【部分圖文】:
本文主要研究內(nèi)容
(2)我們使用七個(gè)基準(zhǔn)貝葉斯網(wǎng)絡(luò)和十個(gè)真實(shí)世界數(shù)據(jù)集進(jìn)行了全面的實(shí)驗(yàn),并將BAMB與十二種現(xiàn)有方法進(jìn)行了比較,其中包括八種最先進(jìn)的MB發(fā)現(xiàn)算法和其他四種經(jīng)典的特征選擇方法,以驗(yàn)證BAMB的效率和準(zhǔn)確性。3.2 提出的BAMB算法
第3.2節(jié)的其余部分按如下方式組織。第3.2.1節(jié)詳細(xì)介紹了BAMB。第3.2.2節(jié)給出了BAMB的跟蹤示例。第3.2.3節(jié)和第3.2.4節(jié)分別分析了BAMB的正確性和計(jì)算復(fù)雜性。3.2.1 算法描述
本文編號:3349636
【文章來源】:合肥工業(yè)大學(xué)安徽省 211工程院校 教育部直屬院校
【文章頁數(shù)】:92 頁
【學(xué)位級別】:博士
【部分圖文】:
本文主要研究內(nèi)容
(2)我們使用七個(gè)基準(zhǔn)貝葉斯網(wǎng)絡(luò)和十個(gè)真實(shí)世界數(shù)據(jù)集進(jìn)行了全面的實(shí)驗(yàn),并將BAMB與十二種現(xiàn)有方法進(jìn)行了比較,其中包括八種最先進(jìn)的MB發(fā)現(xiàn)算法和其他四種經(jīng)典的特征選擇方法,以驗(yàn)證BAMB的效率和準(zhǔn)確性。3.2 提出的BAMB算法
第3.2節(jié)的其余部分按如下方式組織。第3.2.1節(jié)詳細(xì)介紹了BAMB。第3.2.2節(jié)給出了BAMB的跟蹤示例。第3.2.3節(jié)和第3.2.4節(jié)分別分析了BAMB的正確性和計(jì)算復(fù)雜性。3.2.1 算法描述
本文編號:3349636
本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/3349636.html
最近更新
教材專著