聯(lián)合約束非負(fù)矩陣分解方法研究及在組學(xué)數(shù)據(jù)中的應(yīng)用
發(fā)布時間:2022-01-21 19:03
癌癥是嚴(yán)重影響人類健康的重大疾病之一。隨著基因芯片技術(shù)和第二代測序技術(shù)的發(fā)展,產(chǎn)生了大量的癌癥組學(xué)數(shù)據(jù)。此類數(shù)據(jù)往往具有數(shù)量大、增速快、價值高及高維小樣本的特點。矩陣分解作為一種有效的降維技術(shù),在生物信息學(xué)中有著廣泛的應(yīng)用。常用的矩陣分解技術(shù)有主成分分析(Principal Component Analysis,PCA)、矢量量化(Vector Quantization,VQ)及非負(fù)矩陣分解(Nonnegative Matrix Factorization,NMF)等。隨著研究的不斷深入,現(xiàn)有模型無法滿足組學(xué)數(shù)據(jù)挖掘日益增長的需求。因此,本論文基于癌癥基因圖譜(The Cancer Genome Atlas,TCGA)中的組學(xué)數(shù)據(jù),通過對現(xiàn)有NMF相關(guān)方法進行改進,從而提高方法的性能,為癌癥的預(yù)防、診斷和治療工作提供一定的參考價值。具體研究分為以下幾個部分:(1)提出多約束非負(fù)矩陣分解(Multi-constrained Non-negative Matrix Factorization,MCNMF)方法。針對原有方法易受不穩(wěn)定分解及數(shù)據(jù)噪聲的影響,MCNMF方法在提高方法性能的同時能...
【文章來源】:曲阜師范大學(xué)山東省
【文章頁數(shù)】:67 頁
【學(xué)位級別】:碩士
【部分圖文】:
MCNMF方法框架
第2章多約束非負(fù)矩陣分解方法9這個參數(shù)最佳選擇非常重要,取決于數(shù)據(jù)本身的類別數(shù)。對于無監(jiān)督學(xué)習(xí),最佳參數(shù)的選擇至關(guān)重要。使用所有參數(shù)組合來表示MCNMF的選參過程。為了節(jié)省空間,圖2.2顯示了Data1數(shù)據(jù)集和的選參結(jié)果。從圖中可以看出MCNMF方法在較大范圍內(nèi)具有較高的結(jié)果,其中明亮的顏色表示良好的結(jié)果。圖2.2MCNMF方法選參示意圖2.3.3.收斂性分析通過在64GRAM的3.6GHzWindowsServer上的Inter(R)i7-7700CPUMatlabR2016a中實現(xiàn)MCNMF算法。四個數(shù)據(jù)集在MCNMF方法上的收斂曲線如圖2.3所示。從圖中可以看出,MCNMF方法大約在100次迭代時實現(xiàn)了收斂。圖2.3MCNMF方法收斂性示意圖2.4結(jié)果與討論一種新的矩陣分解方法應(yīng)用于組學(xué)數(shù)據(jù)集,目的是在矩陣分解后更準(zhǔn)確地挖掘出共差異表達基因,而不是從原始的生物信息學(xué)數(shù)據(jù)中挖掘共差異表達基因。通過矩陣分解發(fā)現(xiàn),生物過程對于疾病所需的聚類具有生物學(xué)意義。此外,在這些過程中挖掘的共差異表達基因有助于提高聚類性能。
第2章多約束非負(fù)矩陣分解方法9這個參數(shù)最佳選擇非常重要,取決于數(shù)據(jù)本身的類別數(shù)。對于無監(jiān)督學(xué)習(xí),最佳參數(shù)的選擇至關(guān)重要。使用所有參數(shù)組合來表示MCNMF的選參過程。為了節(jié)省空間,圖2.2顯示了Data1數(shù)據(jù)集和的選參結(jié)果。從圖中可以看出MCNMF方法在較大范圍內(nèi)具有較高的結(jié)果,其中明亮的顏色表示良好的結(jié)果。圖2.2MCNMF方法選參示意圖2.3.3.收斂性分析通過在64GRAM的3.6GHzWindowsServer上的Inter(R)i7-7700CPUMatlabR2016a中實現(xiàn)MCNMF算法。四個數(shù)據(jù)集在MCNMF方法上的收斂曲線如圖2.3所示。從圖中可以看出,MCNMF方法大約在100次迭代時實現(xiàn)了收斂。圖2.3MCNMF方法收斂性示意圖2.4結(jié)果與討論一種新的矩陣分解方法應(yīng)用于組學(xué)數(shù)據(jù)集,目的是在矩陣分解后更準(zhǔn)確地挖掘出共差異表達基因,而不是從原始的生物信息學(xué)數(shù)據(jù)中挖掘共差異表達基因。通過矩陣分解發(fā)現(xiàn),生物過程對于疾病所需的聚類具有生物學(xué)意義。此外,在這些過程中挖掘的共差異表達基因有助于提高聚類性能。
【參考文獻】:
期刊論文
[1]包含標(biāo)簽信息的最小二乘多標(biāo)簽特征選擇算法[J]. 陳紅,馬盈倉,楊小飛,續(xù)秋霞. 南京理工大學(xué)學(xué)報. 2019(04)
[2]TCGA數(shù)據(jù)庫:海量癌癥數(shù)據(jù)的源泉[J]. 謝龍祥,閆中義,黨藝方,厲永強,董寰,郭向前. 河南大學(xué)學(xué)報(醫(yī)學(xué)版). 2018(03)
[3]ErbB3結(jié)合蛋白1的上調(diào)抑制食管癌細(xì)胞生長[J]. 姜浩,劉冬平,謝東,魏東芝. 生理學(xué)報. 2016(06)
[4]基于聯(lián)合非負(fù)矩陣分解的協(xié)同過濾推薦算法[J]. 黃波,嚴(yán)宣輝,林建輝. 模式識別與人工智能. 2016(08)
[5]Robust Assignment of Airport Gates with Operational Safety Constraints[J]. Shuo Liu,Wen-Hua Chen,Jiyin Liu. International Journal of Automation and Computing. 2016(01)
[6]稀疏約束圖正則非負(fù)矩陣分解[J]. 姜偉,李宏,余震國,楊炳儒. 計算機科學(xué). 2013(01)
[7]基于超圖正則化模型的本體概念相似度計算[J]. 高煒,梁立. 微電子學(xué)與計算機. 2011(05)
[8]基于簇的K最近鄰(KNN)分類算法研究[J]. 潘麗芳,楊炳儒. 計算機工程與設(shè)計. 2009(18)
[9]高維數(shù)據(jù)降維方法研究[J]. 余肖生,周寧. 情報科學(xué). 2007(08)
[10]運用共詞聚類分析法研究生物信息學(xué)的學(xué)科熱點[J]. 張晗,崔雷. 醫(yī)學(xué)情報工作. 2004(05)
碩士論文
[1]基于多維屬性探索深度學(xué)習(xí)的多尺度疾病診斷預(yù)測研究[D]. 王偉偉.山東大學(xué) 2018
[2]基于基因本體術(shù)語相似性的通路功能網(wǎng)絡(luò)構(gòu)建和分析[D]. 陳明明.哈爾濱工業(yè)大學(xué) 2015
本文編號:3600791
【文章來源】:曲阜師范大學(xué)山東省
【文章頁數(shù)】:67 頁
【學(xué)位級別】:碩士
【部分圖文】:
MCNMF方法框架
第2章多約束非負(fù)矩陣分解方法9這個參數(shù)最佳選擇非常重要,取決于數(shù)據(jù)本身的類別數(shù)。對于無監(jiān)督學(xué)習(xí),最佳參數(shù)的選擇至關(guān)重要。使用所有參數(shù)組合來表示MCNMF的選參過程。為了節(jié)省空間,圖2.2顯示了Data1數(shù)據(jù)集和的選參結(jié)果。從圖中可以看出MCNMF方法在較大范圍內(nèi)具有較高的結(jié)果,其中明亮的顏色表示良好的結(jié)果。圖2.2MCNMF方法選參示意圖2.3.3.收斂性分析通過在64GRAM的3.6GHzWindowsServer上的Inter(R)i7-7700CPUMatlabR2016a中實現(xiàn)MCNMF算法。四個數(shù)據(jù)集在MCNMF方法上的收斂曲線如圖2.3所示。從圖中可以看出,MCNMF方法大約在100次迭代時實現(xiàn)了收斂。圖2.3MCNMF方法收斂性示意圖2.4結(jié)果與討論一種新的矩陣分解方法應(yīng)用于組學(xué)數(shù)據(jù)集,目的是在矩陣分解后更準(zhǔn)確地挖掘出共差異表達基因,而不是從原始的生物信息學(xué)數(shù)據(jù)中挖掘共差異表達基因。通過矩陣分解發(fā)現(xiàn),生物過程對于疾病所需的聚類具有生物學(xué)意義。此外,在這些過程中挖掘的共差異表達基因有助于提高聚類性能。
第2章多約束非負(fù)矩陣分解方法9這個參數(shù)最佳選擇非常重要,取決于數(shù)據(jù)本身的類別數(shù)。對于無監(jiān)督學(xué)習(xí),最佳參數(shù)的選擇至關(guān)重要。使用所有參數(shù)組合來表示MCNMF的選參過程。為了節(jié)省空間,圖2.2顯示了Data1數(shù)據(jù)集和的選參結(jié)果。從圖中可以看出MCNMF方法在較大范圍內(nèi)具有較高的結(jié)果,其中明亮的顏色表示良好的結(jié)果。圖2.2MCNMF方法選參示意圖2.3.3.收斂性分析通過在64GRAM的3.6GHzWindowsServer上的Inter(R)i7-7700CPUMatlabR2016a中實現(xiàn)MCNMF算法。四個數(shù)據(jù)集在MCNMF方法上的收斂曲線如圖2.3所示。從圖中可以看出,MCNMF方法大約在100次迭代時實現(xiàn)了收斂。圖2.3MCNMF方法收斂性示意圖2.4結(jié)果與討論一種新的矩陣分解方法應(yīng)用于組學(xué)數(shù)據(jù)集,目的是在矩陣分解后更準(zhǔn)確地挖掘出共差異表達基因,而不是從原始的生物信息學(xué)數(shù)據(jù)中挖掘共差異表達基因。通過矩陣分解發(fā)現(xiàn),生物過程對于疾病所需的聚類具有生物學(xué)意義。此外,在這些過程中挖掘的共差異表達基因有助于提高聚類性能。
【參考文獻】:
期刊論文
[1]包含標(biāo)簽信息的最小二乘多標(biāo)簽特征選擇算法[J]. 陳紅,馬盈倉,楊小飛,續(xù)秋霞. 南京理工大學(xué)學(xué)報. 2019(04)
[2]TCGA數(shù)據(jù)庫:海量癌癥數(shù)據(jù)的源泉[J]. 謝龍祥,閆中義,黨藝方,厲永強,董寰,郭向前. 河南大學(xué)學(xué)報(醫(yī)學(xué)版). 2018(03)
[3]ErbB3結(jié)合蛋白1的上調(diào)抑制食管癌細(xì)胞生長[J]. 姜浩,劉冬平,謝東,魏東芝. 生理學(xué)報. 2016(06)
[4]基于聯(lián)合非負(fù)矩陣分解的協(xié)同過濾推薦算法[J]. 黃波,嚴(yán)宣輝,林建輝. 模式識別與人工智能. 2016(08)
[5]Robust Assignment of Airport Gates with Operational Safety Constraints[J]. Shuo Liu,Wen-Hua Chen,Jiyin Liu. International Journal of Automation and Computing. 2016(01)
[6]稀疏約束圖正則非負(fù)矩陣分解[J]. 姜偉,李宏,余震國,楊炳儒. 計算機科學(xué). 2013(01)
[7]基于超圖正則化模型的本體概念相似度計算[J]. 高煒,梁立. 微電子學(xué)與計算機. 2011(05)
[8]基于簇的K最近鄰(KNN)分類算法研究[J]. 潘麗芳,楊炳儒. 計算機工程與設(shè)計. 2009(18)
[9]高維數(shù)據(jù)降維方法研究[J]. 余肖生,周寧. 情報科學(xué). 2007(08)
[10]運用共詞聚類分析法研究生物信息學(xué)的學(xué)科熱點[J]. 張晗,崔雷. 醫(yī)學(xué)情報工作. 2004(05)
碩士論文
[1]基于多維屬性探索深度學(xué)習(xí)的多尺度疾病診斷預(yù)測研究[D]. 王偉偉.山東大學(xué) 2018
[2]基于基因本體術(shù)語相似性的通路功能網(wǎng)絡(luò)構(gòu)建和分析[D]. 陳明明.哈爾濱工業(yè)大學(xué) 2015
本文編號:3600791
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3600791.html
最近更新
教材專著