【摘要】:阿茲海默癥(Alzheimer’s Disease,AD)是一種在老年人中高發(fā)的進(jìn)行性神經(jīng)退行性疾病,病因未明,病程不可逆。早期診斷與治療是延緩病情發(fā)展的一般措施,對(duì)于延長(zhǎng)患者存活時(shí)間和提高生活質(zhì)量具有重要意義。目前對(duì)AD的分類(lèi)和輕度認(rèn)知障礙(Mild Cognitive Impairment,MCI)轉(zhuǎn)化預(yù)測(cè)研究,主要集中于對(duì)影像數(shù)據(jù)和生化標(biāo)記物的分析。外周血基因表達(dá)數(shù)據(jù)可以及時(shí)反映生理狀態(tài)和疾病的發(fā)展?fàn)顟B(tài),對(duì)于AD早期診斷具有潛在的應(yīng)用價(jià)值,但是由于數(shù)據(jù)獲取和分析上存在的挑戰(zhàn)還沒(méi)有得到有效的轉(zhuǎn)化應(yīng)用。深度學(xué)習(xí)算法的提出和在多個(gè)領(lǐng)域中的成功應(yīng)用,為基因表達(dá)數(shù)據(jù)的分析和AD相關(guān)特征的識(shí)別與分類(lèi)提供了強(qiáng)力的工具。本論文利用堆疊去噪自編碼器(stacked-denoise autoencoder,SDAE)開(kāi)展提取阿茲海默癥基因表達(dá)特征的研究,輔助AD分類(lèi)和MCI轉(zhuǎn)化預(yù)測(cè)。本文將深度學(xué)習(xí)算法應(yīng)用于微陣列基因表達(dá)數(shù)據(jù)的分析。使用國(guó)際上應(yīng)用廣泛的ADNI(Alzheimer′s disease neuroimaging initiative)專(zhuān)業(yè)數(shù)據(jù)庫(kù)中的基因表達(dá)數(shù)據(jù),構(gòu)建了3層的堆疊去噪自編碼器來(lái)提取阿茲海默癥的基因表達(dá)特征,通過(guò)使用10折交叉驗(yàn)證實(shí)驗(yàn)來(lái)優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu)參數(shù),確定最優(yōu)的三個(gè)隱層節(jié)點(diǎn)數(shù)分別為5000、500、50,受損水平分別為0.1,0.2,0.1。利用SDAE提取的基因表達(dá)特征構(gòu)建SVM(Support Vector Machine)分類(lèi)器,對(duì)246名健康人與498名MCIAD患者的基因表達(dá)數(shù)據(jù)進(jìn)行分類(lèi)分析,與原始探針、主成分分析(PCA)和差異表達(dá)分析三種特征提取方法進(jìn)行對(duì)比,結(jié)果表明,基于SDAE特征的分類(lèi)結(jié)果在準(zhǔn)確率、精確率、召回率和AUC這4個(gè)性能指標(biāo)上均要優(yōu)于三種對(duì)照的方法。如果將SDAE的三層特征組合,對(duì)阿茲海默癥的分類(lèi)準(zhǔn)確率達(dá)到100%。對(duì)SDAE提取的特征進(jìn)行進(jìn)一步的分析,找出對(duì)分類(lèi)貢獻(xiàn)較大的節(jié)點(diǎn),以降低特征維度。使用改進(jìn)的SVM RFE特征選擇方法,從SDAE第一層隱層的5000個(gè)節(jié)點(diǎn)中,選擇43個(gè)高貢獻(xiàn)節(jié)點(diǎn)作為特征,對(duì)相同數(shù)據(jù)集進(jìn)行分類(lèi),其ROC曲線(xiàn)表明在分類(lèi)性能上只有微弱的下降;同時(shí),使用非高貢獻(xiàn)節(jié)點(diǎn)為特征的分類(lèi)性能有大幅度的下降,表明了高貢獻(xiàn)節(jié)點(diǎn)方法對(duì)于樣本分類(lèi)的有效性。提取43個(gè)高貢獻(xiàn)節(jié)點(diǎn)中的5437個(gè)高權(quán)重探針進(jìn)行功能分析,KEGG通路富集分析顯示,高權(quán)重探針顯著富集于阿茲海默癥、帕金森癥和亨廷頓癥這三個(gè)通路,表明這些基因與這三種神經(jīng)性疾病的高度相關(guān);同時(shí)通路聚類(lèi)結(jié)果表明,非酒精性脂肪肝也與這三個(gè)通路具有較強(qiáng)的相關(guān)性,隱含著它們存在共同的分子機(jī)制。比較高權(quán)重探針作為特征和基于高權(quán)重探針構(gòu)建的SDAE特征的分類(lèi)結(jié)果,發(fā)現(xiàn)SDAE特征節(jié)點(diǎn)的分類(lèi)效果更好。將這些SDAE特征應(yīng)用于GSE6613數(shù)據(jù)集的分析,其分類(lèi)性能明顯優(yōu)于采用原始探針數(shù)據(jù)、主成分分析和差異表達(dá)分析等方法,進(jìn)一步驗(yàn)證了SDAE特征節(jié)點(diǎn)具有較好的分類(lèi)效果,SDAE更為有效地提取了基因表達(dá)數(shù)據(jù)中的分類(lèi)特征。對(duì)ADNI數(shù)據(jù)庫(kù)中80名MCI轉(zhuǎn)化為AD的患者和271名MCI未轉(zhuǎn)化為AD患者構(gòu)建基于堆疊去噪自編碼器的MCI轉(zhuǎn)化預(yù)測(cè)模型。與原始探針值、主成分分析和差異表達(dá)分析方法進(jìn)行比較,SDAE模型可以顯著地提升預(yù)測(cè)結(jié)果。采用SDAE三層組合特征,分類(lèi)準(zhǔn)確率為0.8577,精確率為0.8720,召回率為0.9240,AUC值為0.91。對(duì)SDAE第一隱層的5000個(gè)節(jié)點(diǎn)進(jìn)行特征篩選,以338個(gè)高權(quán)重探針形成52個(gè)新特征,其分類(lèi)性能下降較大,準(zhǔn)確率只有0.7746。但是相比主成分分析和差異表達(dá)分析,SDAE特征對(duì)于MCI轉(zhuǎn)化預(yù)測(cè)仍然具有優(yōu)勢(shì)。本文立足于對(duì)基因表達(dá)數(shù)據(jù)的特征提取和分類(lèi)預(yù)測(cè),構(gòu)建了基于堆疊去噪自編碼器的AD分類(lèi)和MCI轉(zhuǎn)化預(yù)測(cè)模型,取得了良好的效果,再一次表明了SDAE在表達(dá)數(shù)據(jù)特征提取中的優(yōu)越性,對(duì)于整合更多生物標(biāo)志物輔助AD早期診斷具有重要意義。
【圖文】:
第二章 基于堆疊去噪自編碼器的阿茲海默癥分類(lèi)二章 基于堆疊去噪自編碼器的阿茲海默癥分類(lèi)于 ADNI 數(shù)據(jù)庫(kù)中的阿茲海默癥基因表達(dá)數(shù)據(jù),構(gòu)建了堆疊去噪自茲海默癥的基因表達(dá)模式。利用提取的特征,訓(xùn)練支持向量機(jī)分類(lèi)器的分類(lèi),并與主成分分析、差異表達(dá)分析等方法進(jìn)行比較。算法原理 堆疊去噪自編碼器 Rumelhart[70]提出了自動(dòng)編碼器(AutoEncoder, AE),,它是一種特殊的如圖 2-1 所示。自編碼器對(duì)輸入向量 x 進(jìn)行編碼計(jì)算,形成隱藏層的行解碼,形成重構(gòu)后的信息 z,通過(guò)最小化 x 與 z 的誤差完成訓(xùn)練。監(jiān)督學(xué)習(xí)算法,它的輸入向量等于輸出向量,通過(guò)中間隱層可以學(xué)習(xí)中間隱層的信息可以應(yīng)用于其他機(jī)器學(xué)習(xí)問(wèn)題,例如分類(lèi)。

圖 2-2 去噪自編碼器結(jié)構(gòu)[72]Vincent 提出了 AE 的改良版——去噪自編碼器(Denoising AutoEncoder, DAE)[72],如圖 2-2 所示。根據(jù)吉布斯采樣原理,從剩余集合中預(yù)測(cè)任意變量的子集是完全獲得一個(gè)集合的變量間聯(lián)合分布的充分條件。因此,為了使隱藏層發(fā)現(xiàn)更多魯棒的特征,去噪自編碼器使用受損的輸入來(lái)訓(xùn)練自編碼器重構(gòu)輸入。在實(shí)現(xiàn)過(guò)程中,就是以一定概率分布(通常使用二項(xiàng)分布)將原始輸入向量中的值隨機(jī)置 0,以此受損的數(shù)據(jù) x'去計(jì)算 y,z,但是目標(biāo)函數(shù)仍然是 ( , )。這樣,DAE 就相當(dāng)于在原始數(shù)據(jù)的監(jiān)督下,學(xué)習(xí)了這個(gè)破損的數(shù)據(jù),從而生成更具代表性的特征。置 0 數(shù)據(jù)占總體的比例稱(chēng)為受損水平。圖 2-3 堆疊去噪自編碼器預(yù)訓(xùn)練過(guò)程[71]
【學(xué)位授予單位】:東南大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2018
【分類(lèi)號(hào)】:R749.16;TP18
【參考文獻(xiàn)】
相關(guān)期刊論文 前4條
1 楊亞超;許凡宇;范vd;;早晚期輕度認(rèn)知功能障礙和阿爾茨海默病的MRI分析及MRI與MMSE評(píng)分的相關(guān)性研究[J];中國(guó)當(dāng)代醫(yī)藥;2015年29期
2 岑桂英;郭圣文;池敏越;匡翠立;牛傳筱;賴(lài)春任;;輕度認(rèn)知障礙的早期檢測(cè)與轉(zhuǎn)化預(yù)測(cè)研究進(jìn)展[J];生命科學(xué);2015年02期
3 馮春花;徐曉云;;輕度認(rèn)知障礙的轉(zhuǎn)化及相關(guān)因素研究進(jìn)展[J];國(guó)際神經(jīng)病學(xué)神經(jīng)外科學(xué)雜志;2013年04期
4 曹文君;侯國(guó)強(qiáng);李運(yùn)明;張威;張揚(yáng);陳長(zhǎng)生;;基因集分析方法統(tǒng)計(jì)理論探討[J];中國(guó)衛(wèi)生統(tǒng)計(jì);2013年04期
相關(guān)博士學(xué)位論文 前1條
1 陳玖;基于神經(jīng)影像特征的遺忘型輕度認(rèn)知損害患者癡呆轉(zhuǎn)化模型構(gòu)建與臨床應(yīng)用研究[D];東南大學(xué);2017年
相關(guān)碩士學(xué)位論文 前3條
1 孔莉莉;Arc基因與我國(guó)漢族人群阿爾茨海默病的遺傳相關(guān)性研究[D];安徽大學(xué);2017年
2 楊利紅;基于主成分分析的模糊時(shí)間序列研究[D];大連海事大學(xué);2017年
3 李珊;衰老相關(guān)的外周全血基因表達(dá)與DNA甲基化標(biāo)志物的可重復(fù)性[D];電子科技大學(xué);2014年
本文編號(hào):
2610785
本文鏈接:http://sikaile.net/kejilunwen/jiyingongcheng/2610785.html