基于傳統(tǒng)特征提取和深度學(xué)習(xí)方法相結(jié)合的基因表達數(shù)據(jù)降維研究
發(fā)布時間:2021-06-21 08:44
DNA微陣列技術(shù)的使用促使越來越多的基因表達數(shù)據(jù)產(chǎn)生。大量的信息蘊含在基因表達數(shù)據(jù)中,通過分析基因表達數(shù)據(jù),能夠增加對腫瘤細胞和正常細胞之間的基因表達差異的了解,同時也可以找出與腫瘤形成關(guān)系密切的基因,這對于癌癥的診斷、治療和預(yù)防都具有非常重要的意義。分類是實現(xiàn)癌癥診斷的重要手段,然而,由于基因表達數(shù)據(jù)具有特征維數(shù)高、存在大量冗余信息等特點,如果采用傳統(tǒng)的分類方法對樣本直接分類,可能會出現(xiàn)“維數(shù)災(zāi)難”。如果采用傳統(tǒng)的特征降維方法先降低原始數(shù)據(jù)的維數(shù),可以解決基因表達數(shù)據(jù)的“維數(shù)災(zāi)難”問題,但會影響基因表達數(shù)據(jù)的分類正確率。因此,選擇合適的特征提取方法是對基因表達數(shù)據(jù)分類前的關(guān)鍵一步。深度學(xué)習(xí)是一種特征學(xué)習(xí)方法,能夠?qū)W習(xí)高維數(shù)據(jù)中的復(fù)雜結(jié)構(gòu)。因此,本文首先研究自動編碼器對基因表達數(shù)據(jù)的降維作用,并與傳統(tǒng)的特征提取方法主成分分析方法、線性判別分析方法和核主成分分析方法進行比較。實驗結(jié)果表明在8種基因表達數(shù)據(jù)集上,自動編碼器的降維效果整體要優(yōu)于主成分分析方法、線性判別分析方法和核主成分分析方法,同時,也驗證了自動編碼器對基因表達數(shù)據(jù)降維的有效性。由于基因表達數(shù)據(jù)特征維數(shù)比較高,自動編碼器學(xué)習(xí)...
【文章來源】:西安電子科技大學(xué)陜西省 211工程院校 教育部直屬院校
【文章頁數(shù)】:72 頁
【學(xué)位級別】:碩士
【部分圖文】:
cDNA微陣列獲取基因表達數(shù)據(jù)過程示意圖
26(g)ALLAML (h)9_Tumors圖 3.5 PCA 特征和 AE 特征對 softmax 分類器性能的影響對于 PCA 特征,當保留 99.9999%的方差變化時,數(shù)據(jù)集 colon、lymphoma、prostate、gcm、nci64、mit、ALLAML 和 9_Tumors 的 PCA 特征維數(shù)分別為 61、61、101、189、63、71、37、59。對于每個數(shù)據(jù)集,當特征維數(shù)從 1 開始變化時,自動編碼器的隱藏
29(g)ALLAML (h)9_Tumors圖 3.7 KPCA 特征和 AE 特征對 softmax 分類器性能的影響從以上三個實驗可知,在大多數(shù)的數(shù)據(jù)集上,自動編碼器的降維作用要優(yōu)于PCA、LDA 和 KPCA,同時,也驗證了自動編碼器對基因表達數(shù)據(jù)降維的有效性。然而,由于基因表達數(shù)據(jù)的特征維數(shù)比較高,自動編碼器學(xué)習(xí)基因表達數(shù)據(jù)中的
【參考文獻】:
期刊論文
[1]生物醫(yī)學(xué)數(shù)據(jù)分析中的深度學(xué)習(xí)方法應(yīng)用[J]. 李淵,駱志剛,管乃洋,尹曉堯,王兵,伯曉晨,李非. 生物化學(xué)與生物物理進展. 2016(05)
[2]基于稀疏類別保留投影的基因表達數(shù)據(jù)降維方法[J]. 王文俊. 電子學(xué)報. 2016(04)
[3]第3講 深度學(xué)習(xí)中的經(jīng)典網(wǎng)絡(luò)模型及訓(xùn)練方法[J]. 韓偉,張雄偉,張煒,吳從明,吳燕軍. 軍事通信技術(shù). 2016(01)
[4]第2講 深度學(xué)習(xí)基本理論概述[J]. 陳栩杉,張雄偉,喬林,王健,李治中. 軍事通信技術(shù). 2015(04)
[5]一種基于稀疏主成分的基因表達數(shù)據(jù)特征提取方法[J]. 沈?qū)幟?李靜,周培云,莊毅. 計算機科學(xué). 2015(S1)
[6]深度學(xué)習(xí)技術(shù)及其在腫瘤分類中的應(yīng)用[J]. 雷成,葉小勇,李小波. 智能計算機與應(yīng)用. 2014(06)
[7]基于PCA和LDA方法的腫瘤基因表達譜數(shù)據(jù)分類[J]. 李志文,蔡先發(fā),韋佳,周怡. 北京生物醫(yī)學(xué)工程. 2014(01)
[8]基于鑒別主成份分析的基因表達數(shù)據(jù)特征提取[J]. 廖海斌,徐洪章. 燕山大學(xué)學(xué)報. 2010(05)
博士論文
[1]基因表達數(shù)據(jù)的相似性度量和特征提取研究[D]. 王文俊.西安電子科技大學(xué) 2011
碩士論文
[1]基于深度學(xué)習(xí)的癌癥分類模型研究[D]. 葉永盛.華中科技大學(xué) 2015
本文編號:3240364
【文章來源】:西安電子科技大學(xué)陜西省 211工程院校 教育部直屬院校
【文章頁數(shù)】:72 頁
【學(xué)位級別】:碩士
【部分圖文】:
cDNA微陣列獲取基因表達數(shù)據(jù)過程示意圖
26(g)ALLAML (h)9_Tumors圖 3.5 PCA 特征和 AE 特征對 softmax 分類器性能的影響對于 PCA 特征,當保留 99.9999%的方差變化時,數(shù)據(jù)集 colon、lymphoma、prostate、gcm、nci64、mit、ALLAML 和 9_Tumors 的 PCA 特征維數(shù)分別為 61、61、101、189、63、71、37、59。對于每個數(shù)據(jù)集,當特征維數(shù)從 1 開始變化時,自動編碼器的隱藏
29(g)ALLAML (h)9_Tumors圖 3.7 KPCA 特征和 AE 特征對 softmax 分類器性能的影響從以上三個實驗可知,在大多數(shù)的數(shù)據(jù)集上,自動編碼器的降維作用要優(yōu)于PCA、LDA 和 KPCA,同時,也驗證了自動編碼器對基因表達數(shù)據(jù)降維的有效性。然而,由于基因表達數(shù)據(jù)的特征維數(shù)比較高,自動編碼器學(xué)習(xí)基因表達數(shù)據(jù)中的
【參考文獻】:
期刊論文
[1]生物醫(yī)學(xué)數(shù)據(jù)分析中的深度學(xué)習(xí)方法應(yīng)用[J]. 李淵,駱志剛,管乃洋,尹曉堯,王兵,伯曉晨,李非. 生物化學(xué)與生物物理進展. 2016(05)
[2]基于稀疏類別保留投影的基因表達數(shù)據(jù)降維方法[J]. 王文俊. 電子學(xué)報. 2016(04)
[3]第3講 深度學(xué)習(xí)中的經(jīng)典網(wǎng)絡(luò)模型及訓(xùn)練方法[J]. 韓偉,張雄偉,張煒,吳從明,吳燕軍. 軍事通信技術(shù). 2016(01)
[4]第2講 深度學(xué)習(xí)基本理論概述[J]. 陳栩杉,張雄偉,喬林,王健,李治中. 軍事通信技術(shù). 2015(04)
[5]一種基于稀疏主成分的基因表達數(shù)據(jù)特征提取方法[J]. 沈?qū)幟?李靜,周培云,莊毅. 計算機科學(xué). 2015(S1)
[6]深度學(xué)習(xí)技術(shù)及其在腫瘤分類中的應(yīng)用[J]. 雷成,葉小勇,李小波. 智能計算機與應(yīng)用. 2014(06)
[7]基于PCA和LDA方法的腫瘤基因表達譜數(shù)據(jù)分類[J]. 李志文,蔡先發(fā),韋佳,周怡. 北京生物醫(yī)學(xué)工程. 2014(01)
[8]基于鑒別主成份分析的基因表達數(shù)據(jù)特征提取[J]. 廖海斌,徐洪章. 燕山大學(xué)學(xué)報. 2010(05)
博士論文
[1]基因表達數(shù)據(jù)的相似性度量和特征提取研究[D]. 王文俊.西安電子科技大學(xué) 2011
碩士論文
[1]基于深度學(xué)習(xí)的癌癥分類模型研究[D]. 葉永盛.華中科技大學(xué) 2015
本文編號:3240364
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3240364.html
最近更新
教材專著