基于Boosting的基因表達(dá)數(shù)據(jù)分類
發(fā)布時(shí)間:2021-12-22 03:29
基因表達(dá)水平可以通過DNA微陣列技術(shù)進(jìn)行測量,由此產(chǎn)生了基因表達(dá)數(shù)據(jù)。通過分析研究基因表達(dá)數(shù)據(jù)可以挖掘有效信息,有助于病理分析與疾病診斷,利用基因表達(dá)數(shù)據(jù)進(jìn)行癌癥分類診斷是一種重要的癌癥檢測方法。但由于基因表達(dá)數(shù)據(jù)具有維數(shù)高、樣本少的特點(diǎn),使得傳統(tǒng)的模式識別方法容易陷入“維數(shù)災(zāi)難”。Boosting是一種集成學(xué)習(xí)算法,它可以將任意分類算法作為基分類算法進(jìn)行集成,進(jìn)而提高基分類算法的分類正確率。堆棧自動(dòng)編碼器是一種深度學(xué)習(xí)方法,它通過大量訓(xùn)練樣本可以學(xué)習(xí)到數(shù)據(jù)中的高層次特征,使其在諸多模式識別問題上具有良好的分類性能。由于基因表達(dá)數(shù)據(jù)樣本數(shù)較少,使用深度學(xué)習(xí)方法對基因表達(dá)數(shù)據(jù)分類易出現(xiàn)分類精度不高的問題。Boosting是一種迭代算法,每輪學(xué)習(xí)使用的訓(xùn)練樣本都不同,可以一定程度上彌補(bǔ)樣本數(shù)不足的問題。因此本文提出一種基于堆棧自動(dòng)編碼器與Boosting相結(jié)合的方法對基因表達(dá)數(shù)據(jù)分類,本算法首先采用主成分分析對基因表達(dá)數(shù)據(jù)降維,然后將堆棧自動(dòng)編碼器作為Boosting的基分類算法進(jìn)行學(xué)習(xí)訓(xùn)練,最后組合多個(gè)堆棧自動(dòng)編碼器進(jìn)行決策。通過在9組真實(shí)基因表達(dá)數(shù)據(jù)上實(shí)驗(yàn)發(fā)現(xiàn)本算法將堆棧自動(dòng)編碼器的分...
【文章來源】:西安電子科技大學(xué)陜西省 211工程院校 教育部直屬院校
【文章頁數(shù)】:83 頁
【學(xué)位級別】:碩士
【部分圖文】:
cDNA微陣列獲取基因表達(dá)數(shù)據(jù)過程示意圖
圖 4. 1 決策樹實(shí)例類過程從測試顏色開始,判定顏色,如喜歡”,如果為黑色,則繼續(xù)判斷價(jià)格如果價(jià)格判定為實(shí)惠,則樣本分類為“一個(gè)遞歸算法,在每一步對特征進(jìn)行測拆分將數(shù)據(jù)集劃分為子集,子集構(gòu)成的定,直到葉子節(jié)點(diǎn),即可得到待測樣本。an 提出的一種決策樹算法實(shí)現(xiàn)方法,ID增益作為評價(jià)標(biāo)準(zhǔn),進(jìn)而實(shí)現(xiàn)對數(shù)據(jù)歸,選取信息增益最大的屬性進(jìn)行分裂。大,信息越不確定。 logcEntropy S p p
本文編號:3545674
【文章來源】:西安電子科技大學(xué)陜西省 211工程院校 教育部直屬院校
【文章頁數(shù)】:83 頁
【學(xué)位級別】:碩士
【部分圖文】:
cDNA微陣列獲取基因表達(dá)數(shù)據(jù)過程示意圖
圖 4. 1 決策樹實(shí)例類過程從測試顏色開始,判定顏色,如喜歡”,如果為黑色,則繼續(xù)判斷價(jià)格如果價(jià)格判定為實(shí)惠,則樣本分類為“一個(gè)遞歸算法,在每一步對特征進(jìn)行測拆分將數(shù)據(jù)集劃分為子集,子集構(gòu)成的定,直到葉子節(jié)點(diǎn),即可得到待測樣本。an 提出的一種決策樹算法實(shí)現(xiàn)方法,ID增益作為評價(jià)標(biāo)準(zhǔn),進(jìn)而實(shí)現(xiàn)對數(shù)據(jù)歸,選取信息增益最大的屬性進(jìn)行分裂。大,信息越不確定。 logcEntropy S p p
本文編號:3545674
本文鏈接:http://sikaile.net/kejilunwen/jiyingongcheng/3545674.html
最近更新
教材專著