非負(fù)矩陣分解及在基因表達(dá)數(shù)據(jù)分析中的應(yīng)用研究
發(fā)布時間:2017-12-21 03:00
本文關(guān)鍵詞:非負(fù)矩陣分解及在基因表達(dá)數(shù)據(jù)分析中的應(yīng)用研究 出處:《曲阜師范大學(xué)》2015年碩士論文 論文類型:學(xué)位論文
更多相關(guān)文章: 基因表達(dá)數(shù)據(jù)分析 聚類分析 特征基因提取 非負(fù)矩陣分解 基因本體論
【摘要】:生物信息學(xué)作為一門集計算機(jī)科學(xué)、統(tǒng)計學(xué)及應(yīng)用數(shù)學(xué)于一體的新興交叉學(xué)科,被用來解釋和研究隱藏的生物資源,進(jìn)一步揭示隱藏在大量數(shù)據(jù)背后的生物奧秘。隨著科技的迅速發(fā)展,每天都有成千上萬的數(shù)據(jù)被輸入生物數(shù)據(jù)庫。在生物信息學(xué)中,怎樣從大量的基因表達(dá)數(shù)據(jù)中準(zhǔn)確而又高效率地找出潛在的基因功能和對應(yīng)基因表達(dá)水平。DNA微陣列的產(chǎn)生很好地解決了這個問題。其中,DNA微陣列產(chǎn)生的基因表達(dá)數(shù)據(jù)是最受研究人員關(guān)注的數(shù)據(jù)。基因表達(dá)數(shù)據(jù)矩陣一般具超高維小樣本的特點,這給基因表達(dá)數(shù)據(jù)的分析和處理帶來挑戰(zhàn)。因此在基因表達(dá)數(shù)據(jù)分析中,選擇合適有效的聚類分析和降維方法是至關(guān)重要的。本文利用非負(fù)矩陣分解相關(guān)理論來對癌癥樣本進(jìn)行聚類分析和對特征基因進(jìn)行提取。為了在降維的基礎(chǔ)上更好地提高效率,本文提出兩種改進(jìn)的非負(fù)矩陣方法,并應(yīng)用于特征基因提取方面。實驗驗證了這兩種改進(jìn)方法的可行性及有效性。本文研究的主要工作有:(1)非負(fù)矩陣分解在基因表達(dá)數(shù)據(jù)中的聚類分析。首先對非負(fù)矩陣分解(NMF)做系統(tǒng)概括;其次利用圖正則非負(fù)矩陣分解(GNMF)對腫瘤樣本進(jìn)行聚類分析;最后用NMF,SNMF和GNMF這三種方法在腫瘤樣本中進(jìn)行聚類分析。(2)基于L0范數(shù)圖正則非負(fù)矩陣分解算法。本文將GNMF和L0范數(shù)約束NMF的原理進(jìn)行結(jié)合,提出了基于L0范數(shù)圖正則非負(fù)矩陣分解算法(GL0NMF),并將其應(yīng)用到基因表達(dá)數(shù)據(jù)提取中進(jìn)行研究分析,最后將實驗結(jié)果導(dǎo)入基因本體論(GO)中分析。通過與PMD,SPCA和GNMF算法對比,實驗驗證了筆者提出的算法在基因提取方面具有一定的可行性與有效性。(3)監(jiān)督性稀疏非負(fù)矩陣分解算法。為提高NMF在基因表達(dá)數(shù)據(jù)分析中的效率,本文在稀疏控制的非負(fù)矩陣分解算法上引入類別信息,提出監(jiān)督性稀疏非負(fù)矩陣分解算法(CISNMF),并將其在基因表達(dá)數(shù)據(jù)提取中進(jìn)行研究分析,最后利用GO進(jìn)行定性分析。通過與PMD,SPCA,SNMF和SVM-RFE進(jìn)行對比,實驗結(jié)果表明CISNMF算法具有一定的可行性與有效性。本文的創(chuàng)新點主要是提出了兩種改進(jìn)的非負(fù)矩陣算法:基于L0范數(shù)圖正則非負(fù)矩陣分解算法(GL0NMF)和監(jiān)督性稀疏非負(fù)矩陣分解算法(CISNMF)。并將這兩種算法分別應(yīng)用到基因表達(dá)數(shù)據(jù)提取中,實驗驗證了本文提出的算法在基因提取方面具有一定的可行性與有效性。
【學(xué)位授予單位】:曲阜師范大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:Q811.4;O151.21
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前2條
1 李樂;章毓晉;;非負(fù)矩陣分解算法綜述[J];電子學(xué)報;2008年04期
2 汪鵬;;非負(fù)矩陣分解:數(shù)學(xué)的奇妙力量[J];計算機(jī)教育;2004年10期
,本文編號:1314407
本文鏈接:http://sikaile.net/kejilunwen/yysx/1314407.html
最近更新
教材專著