面向癌癥基因表達(dá)數(shù)據(jù)挖掘的低秩表示方法研究
發(fā)布時間:2023-05-14 07:41
當(dāng)今,癌癥是威脅人類生命的一大殺手。隨著第二代測序技術(shù)的發(fā)展,產(chǎn)生了海量可用的基因表達(dá)數(shù)據(jù)。雖然,這類癌癥數(shù)據(jù)包含豐富的基因表達(dá)信息,為科研工作者從分子水平揭露癌癥的發(fā)病機(jī)制提供了數(shù)據(jù)支撐。但是,癌癥測序數(shù)據(jù)通常具有“高維、小樣本和強(qiáng)噪聲”的特點,這無疑是癌癥數(shù)據(jù)挖掘工作中的一個極大的挑戰(zhàn)。低秩表示(Low-rank Representation,LRR)是一種實現(xiàn)數(shù)據(jù)降維、減小噪聲影響的矩陣分解方法,在癌癥數(shù)據(jù)挖掘方面已取得了很多的成功。在查閱歸納了大量國內(nèi)外相關(guān)文獻(xiàn)的基礎(chǔ)上,本論文針對現(xiàn)有LRR方法存在的部分不足,提出三種新的LRR方法,并將之應(yīng)用到癌癥基因表達(dá)數(shù)據(jù)挖據(jù)中,旨在研究癌癥病變的內(nèi)部機(jī)理,更精確地分析癌癥亞型。具體研究內(nèi)容如下:(1)提出聯(lián)合截斷核范數(shù)和圖正則的低秩表示方法:LRR方法從觀測數(shù)據(jù)矩陣分解出的低秩矩陣的奇異值是快速減小的數(shù)據(jù)序列,因此,最小化所有奇異值的核范數(shù)不是近似矩陣秩函數(shù)的最佳選擇。該方法采用截斷核范數(shù)代替核范數(shù)處理低秩矩陣的凸松弛問題,保留了與矩陣相關(guān)的主要成分的信息,有效降低了奇異值收縮造成的損害,更準(zhǔn)確地近似了矩陣的秩。并且新方法引入了圖正則項...
【文章頁數(shù)】:72 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 研究背景和意義
1.1.1 研究背景
1.1.2 研究意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 論文主要內(nèi)容
1.3.1 論文主要研究工作
1.3.2 論文創(chuàng)新點
1.3.3 論文組織結(jié)構(gòu)
1.4 論文研究方法
第2章 相關(guān)研究工作、數(shù)據(jù)集及相關(guān)平臺簡介
2.1 相關(guān)研究工作
2.1.1 低秩表示(LRR)方法概述
2.1.2 潛在低秩表示(Lat LRR)方法概述
2.1.3 系統(tǒng)實現(xiàn)框架
2.2 數(shù)據(jù)集簡介
2.2.1 基因表達(dá)數(shù)據(jù)簡介
2.2.2 數(shù)據(jù)庫簡介
2.2.3 實驗數(shù)據(jù)簡介
2.3 結(jié)果分析平臺簡介
2.3.1 Gene Cards平臺簡介
2.3.2 Topp Gene Suite平臺簡介
第3章 聯(lián)合截斷核范數(shù)和圖正則的低秩表示方法的研究及應(yīng)用
3.1 引言
3.2 截斷核范數(shù)和圖正則化簡介
3.2.1 截斷核范數(shù)簡介
3.2.2 圖正則簡介
3.3 聯(lián)合截斷核范數(shù)和圖正則的低秩表示(TLLRR)方法
3.3.1 TLLRR模型構(gòu)建
3.3.2 TLLRR模型求解
3.3.3 TLLRR算法的收斂性和時間復(fù)雜度分析
3.4 參數(shù)設(shè)置
3.4.1 實驗數(shù)據(jù)
3.4.2 選參結(jié)果
3.5 實驗結(jié)果與討論
3.5.1 評價指標(biāo)
3.5.2 差異表達(dá)基因識別
3.5.3 癌癥樣本聚類
3.6 本章小結(jié)
第4章 雙超圖正則化的低秩表示方法的研究及應(yīng)用
4.1 引言
4.2 超圖正則簡介
4.3 雙超圖正則化的低秩表示(DHLRR)方法
4.3.1 DHLRR模型構(gòu)建
4.3.2 DHLRR模型求解
4.3.3 DHLRR算法的收斂性和時間復(fù)雜度分析
4.4 參數(shù)設(shè)置
4.4.1 實驗數(shù)據(jù)
4.4.2 選參結(jié)果
4.5 實驗結(jié)果與討論
4.5.1 評價指標(biāo)
4.5.2 差異表達(dá)基因識別
4.5.3 癌癥樣本聚類
4.6 本章小結(jié)
第5章 聯(lián)合截斷核范數(shù)和圖正則的潛在低秩表示方法的研究及應(yīng)用
5.1 引言
5.2 聯(lián)合截斷核范數(shù)和圖正則的潛在低秩表示(Lat-TGLRR)方法
5.2.1 Lat-TGLRR模型構(gòu)建
5.2.2 Lat-TGLRR模型求解
5.2.3 Lat-TGLRR算法的收斂性和時間復(fù)雜度分析
5.3 參數(shù)設(shè)置
5.3.1 實驗數(shù)據(jù)
5.3.2 選參結(jié)果
5.4 實驗結(jié)果與討論
5.4.1 評價指標(biāo)
5.4.2 共差異表達(dá)基因識別
5.4.3 癌癥樣本聚類
5.5 本章小結(jié)
第6章 總結(jié)與展望
6.1 總結(jié)
6.2 展望
參考文獻(xiàn)
在讀期間發(fā)表的學(xué)術(shù)論文及研究成果
致謝
本文編號:3817477
【文章頁數(shù)】:72 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 研究背景和意義
1.1.1 研究背景
1.1.2 研究意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 論文主要內(nèi)容
1.3.1 論文主要研究工作
1.3.2 論文創(chuàng)新點
1.3.3 論文組織結(jié)構(gòu)
1.4 論文研究方法
第2章 相關(guān)研究工作、數(shù)據(jù)集及相關(guān)平臺簡介
2.1 相關(guān)研究工作
2.1.1 低秩表示(LRR)方法概述
2.1.2 潛在低秩表示(Lat LRR)方法概述
2.1.3 系統(tǒng)實現(xiàn)框架
2.2 數(shù)據(jù)集簡介
2.2.1 基因表達(dá)數(shù)據(jù)簡介
2.2.2 數(shù)據(jù)庫簡介
2.2.3 實驗數(shù)據(jù)簡介
2.3 結(jié)果分析平臺簡介
2.3.1 Gene Cards平臺簡介
2.3.2 Topp Gene Suite平臺簡介
第3章 聯(lián)合截斷核范數(shù)和圖正則的低秩表示方法的研究及應(yīng)用
3.1 引言
3.2 截斷核范數(shù)和圖正則化簡介
3.2.1 截斷核范數(shù)簡介
3.2.2 圖正則簡介
3.3 聯(lián)合截斷核范數(shù)和圖正則的低秩表示(TLLRR)方法
3.3.1 TLLRR模型構(gòu)建
3.3.2 TLLRR模型求解
3.3.3 TLLRR算法的收斂性和時間復(fù)雜度分析
3.4 參數(shù)設(shè)置
3.4.1 實驗數(shù)據(jù)
3.4.2 選參結(jié)果
3.5 實驗結(jié)果與討論
3.5.1 評價指標(biāo)
3.5.2 差異表達(dá)基因識別
3.5.3 癌癥樣本聚類
3.6 本章小結(jié)
第4章 雙超圖正則化的低秩表示方法的研究及應(yīng)用
4.1 引言
4.2 超圖正則簡介
4.3 雙超圖正則化的低秩表示(DHLRR)方法
4.3.1 DHLRR模型構(gòu)建
4.3.2 DHLRR模型求解
4.3.3 DHLRR算法的收斂性和時間復(fù)雜度分析
4.4 參數(shù)設(shè)置
4.4.1 實驗數(shù)據(jù)
4.4.2 選參結(jié)果
4.5 實驗結(jié)果與討論
4.5.1 評價指標(biāo)
4.5.2 差異表達(dá)基因識別
4.5.3 癌癥樣本聚類
4.6 本章小結(jié)
第5章 聯(lián)合截斷核范數(shù)和圖正則的潛在低秩表示方法的研究及應(yīng)用
5.1 引言
5.2 聯(lián)合截斷核范數(shù)和圖正則的潛在低秩表示(Lat-TGLRR)方法
5.2.1 Lat-TGLRR模型構(gòu)建
5.2.2 Lat-TGLRR模型求解
5.2.3 Lat-TGLRR算法的收斂性和時間復(fù)雜度分析
5.3 參數(shù)設(shè)置
5.3.1 實驗數(shù)據(jù)
5.3.2 選參結(jié)果
5.4 實驗結(jié)果與討論
5.4.1 評價指標(biāo)
5.4.2 共差異表達(dá)基因識別
5.4.3 癌癥樣本聚類
5.5 本章小結(jié)
第6章 總結(jié)與展望
6.1 總結(jié)
6.2 展望
參考文獻(xiàn)
在讀期間發(fā)表的學(xué)術(shù)論文及研究成果
致謝
本文編號:3817477
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3817477.html
最近更新
教材專著