聚類演化的集群算法在多模態(tài)腦科學(xué)數(shù)據(jù)分析中的應(yīng)用
發(fā)布時間:2022-01-07 09:07
融合遺傳與神經(jīng)影像因素對大腦進行聯(lián)合探索是目前腦科研究領(lǐng)域的前沿問題,是眾多國家投入大量資源進行爭奪的科技制高點。檢測基因數(shù)據(jù)和大腦靜息態(tài)功能磁共振成像數(shù)據(jù)的相關(guān)性,是從遺傳角度解釋大腦的奧秘的有效方法。本研究通過構(gòu)建腦區(qū)與基因的相關(guān)性作為樣本多模態(tài)融合特征,并基于聚類演化隨機集群技術(shù)設(shè)計數(shù)據(jù)分析模型,對阿爾茨海默癥(Alzheimer’s Disease,AD)和帕金森癥(Parkinson’s Disease,PD)的多模態(tài)數(shù)據(jù)進行融合分析。主要內(nèi)容如下:(1)本研究提出了聚類演化隨機集群技術(shù)。該技術(shù)創(chuàng)新性地將聚類演化策略與集成學(xué)習(xí)進行結(jié)合,提升了集成學(xué)習(xí)器在樣本識別和特征篩選中的性能。具體地,該方法通過隨機選擇樣本和樣本屬性構(gòu)建初始隨機集群,之后采用閾值過濾和層次聚類對集成學(xué)習(xí)器進行多級動態(tài)演化,并使用演化后的隨機集群進行樣本分類和特征提取。多級聚類演化和閾值過濾有效地保證了集成模型中基學(xué)習(xí)器的多樣性和有效性。(2)使用聚類演化隨機森林對阿爾茨海默癥進行研究。本研究從ADNI數(shù)據(jù)庫獲取了40名正常人和38名AD患者的靜息態(tài)功能磁共振成像數(shù)據(jù)和基因數(shù)據(jù),并從中提取基因與腦區(qū)的相關(guān)性...
【文章來源】:湖南師范大學(xué)湖南省 211工程院校
【文章頁數(shù)】:67 頁
【學(xué)位級別】:碩士
【部分圖文】:
初始決策樹數(shù)目為300時的層次聚類演化情況
聚類演化的集群算法在多模態(tài)腦科學(xué)數(shù)據(jù)分析中的應(yīng)用27圖3-3聚類演化次數(shù)與初始決策樹數(shù)目之間的關(guān)系曲線3.3.2提取重要“腦區(qū)-基因?qū)Α鲍@得了本研究所需的最終CERF后,對測試集進行測試的最高準確識別率接近90%,說明演化后的CERF能夠有效地篩選出正常人和AD患者之間具有顯著差異的特征,并利用這些特征進行分類。因此,對最終CERF的每個決策樹選中的特征進行分析,可以找到對分類貢獻較大的重要特征即重要“腦區(qū)-基因?qū)Α。具體過程如下,首先提取出最終CERF中每個決策樹所選擇的“腦區(qū)-基因?qū)Α,然后計算每個“腦區(qū)-基因?qū)Α钡念l數(shù),頻數(shù)越大意味著對分類的貢獻率越高,該特征在正常人和病人之間常差異度也越大,因此本研究將前400個高頻數(shù)“腦區(qū)-基因?qū)Α弊鳛橹匾澳X區(qū)-基因?qū)Α薄?.3.3提取最優(yōu)“腦區(qū)-基因?qū)Α庇捎诓捎妙l數(shù)為標準選擇重要“腦區(qū)-基因?qū)Α,使得其中可能包含一些對分類貢獻較少的特征,因此對重要“腦區(qū)-基因?qū)Α崩^續(xù)進行篩選,找出區(qū)分能力最強的最優(yōu)“腦區(qū)-基因?qū)Α薄0凑諏嶒炘O(shè)置的步驟5將重要“腦區(qū)-基因?qū)Α眲澐殖扇舾勺蛹,再使用常?guī)隨機森林檢測這些子集的分類性能,結(jié)果如圖3-4所示。當使用重要“腦區(qū)-基因?qū)Α敝蓄l數(shù)最高的前290個“腦區(qū)-基因?qū)Α睒?gòu)建子集,再每次從子集中隨機選擇57個特征構(gòu)建普通隨機森林,此時隨機森林的分類準確率達到最高值91.3%,因此我們將頻數(shù)最高的前290個“腦區(qū)-基因?qū)Α弊鳛樽顑?yōu)“腦區(qū)-基因?qū)Α。另外,最?yōu)“腦區(qū)-基因?qū)Α敝蟹诸愋Ч顬轱@著的40個融合特征如圖3-5所示。
碩士學(xué)位論文28圖3-4不同重要“腦區(qū)-基因?qū)Α弊蛹碾S機森林精度圖3-5分類效果最為顯著的40個“腦區(qū)-基因?qū)Α?.3.4疾病關(guān)聯(lián)基因與異常腦區(qū)從上述實驗結(jié)果來看,最優(yōu)“腦區(qū)-基因?qū)Α睂颖痉诸惸芰ψ詈茫舱f明這些特征在病人與正常人之間存在巨大差異。根據(jù)實驗設(shè)置,本研究分別統(tǒng)計最優(yōu)“腦區(qū)-基因?qū)Α敝心X區(qū)和基因的頻數(shù)作為權(quán)重,權(quán)重較大的腦區(qū)和基因則為AD異常腦區(qū)
【參考文獻】:
期刊論文
[1]淀粉樣前體蛋白基因啟動子區(qū)-2335C/T和+37C/G基因多態(tài)性與Alzheimer病的關(guān)系[J]. 童偉隆,高莉,趙桂琴. 臨床精神醫(yī)學(xué)雜志. 2019(02)
[2]基于腦連接網(wǎng)絡(luò)的阿爾茨海默病臨床變量值預(yù)測[J]. 路子祥,屠黎陽,祖辰,張道強. 智能系統(tǒng)學(xué)報. 2017(03)
本文編號:3574259
【文章來源】:湖南師范大學(xué)湖南省 211工程院校
【文章頁數(shù)】:67 頁
【學(xué)位級別】:碩士
【部分圖文】:
初始決策樹數(shù)目為300時的層次聚類演化情況
聚類演化的集群算法在多模態(tài)腦科學(xué)數(shù)據(jù)分析中的應(yīng)用27圖3-3聚類演化次數(shù)與初始決策樹數(shù)目之間的關(guān)系曲線3.3.2提取重要“腦區(qū)-基因?qū)Α鲍@得了本研究所需的最終CERF后,對測試集進行測試的最高準確識別率接近90%,說明演化后的CERF能夠有效地篩選出正常人和AD患者之間具有顯著差異的特征,并利用這些特征進行分類。因此,對最終CERF的每個決策樹選中的特征進行分析,可以找到對分類貢獻較大的重要特征即重要“腦區(qū)-基因?qū)Α。具體過程如下,首先提取出最終CERF中每個決策樹所選擇的“腦區(qū)-基因?qū)Α,然后計算每個“腦區(qū)-基因?qū)Α钡念l數(shù),頻數(shù)越大意味著對分類的貢獻率越高,該特征在正常人和病人之間常差異度也越大,因此本研究將前400個高頻數(shù)“腦區(qū)-基因?qū)Α弊鳛橹匾澳X區(qū)-基因?qū)Α薄?.3.3提取最優(yōu)“腦區(qū)-基因?qū)Α庇捎诓捎妙l數(shù)為標準選擇重要“腦區(qū)-基因?qū)Α,使得其中可能包含一些對分類貢獻較少的特征,因此對重要“腦區(qū)-基因?qū)Α崩^續(xù)進行篩選,找出區(qū)分能力最強的最優(yōu)“腦區(qū)-基因?qū)Α薄0凑諏嶒炘O(shè)置的步驟5將重要“腦區(qū)-基因?qū)Α眲澐殖扇舾勺蛹,再使用常?guī)隨機森林檢測這些子集的分類性能,結(jié)果如圖3-4所示。當使用重要“腦區(qū)-基因?qū)Α敝蓄l數(shù)最高的前290個“腦區(qū)-基因?qū)Α睒?gòu)建子集,再每次從子集中隨機選擇57個特征構(gòu)建普通隨機森林,此時隨機森林的分類準確率達到最高值91.3%,因此我們將頻數(shù)最高的前290個“腦區(qū)-基因?qū)Α弊鳛樽顑?yōu)“腦區(qū)-基因?qū)Α。另外,最?yōu)“腦區(qū)-基因?qū)Α敝蟹诸愋Ч顬轱@著的40個融合特征如圖3-5所示。
碩士學(xué)位論文28圖3-4不同重要“腦區(qū)-基因?qū)Α弊蛹碾S機森林精度圖3-5分類效果最為顯著的40個“腦區(qū)-基因?qū)Α?.3.4疾病關(guān)聯(lián)基因與異常腦區(qū)從上述實驗結(jié)果來看,最優(yōu)“腦區(qū)-基因?qū)Α睂颖痉诸惸芰ψ詈茫舱f明這些特征在病人與正常人之間存在巨大差異。根據(jù)實驗設(shè)置,本研究分別統(tǒng)計最優(yōu)“腦區(qū)-基因?qū)Α敝心X區(qū)和基因的頻數(shù)作為權(quán)重,權(quán)重較大的腦區(qū)和基因則為AD異常腦區(qū)
【參考文獻】:
期刊論文
[1]淀粉樣前體蛋白基因啟動子區(qū)-2335C/T和+37C/G基因多態(tài)性與Alzheimer病的關(guān)系[J]. 童偉隆,高莉,趙桂琴. 臨床精神醫(yī)學(xué)雜志. 2019(02)
[2]基于腦連接網(wǎng)絡(luò)的阿爾茨海默病臨床變量值預(yù)測[J]. 路子祥,屠黎陽,祖辰,張道強. 智能系統(tǒng)學(xué)報. 2017(03)
本文編號:3574259
本文鏈接:http://sikaile.net/shoufeilunwen/benkebiyelunwen/3574259.html
最近更新
教材專著