天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于癌癥數(shù)據(jù)的子空間聚類算法及DNA甲基化調(diào)控基因表達(dá)的泛癌分析

發(fā)布時(shí)間:2021-10-21 10:26
  癌癥的惡性轉(zhuǎn)化是一個(gè)多步驟的過程,在此過程中積累了大量的分子變化。這些分子的變化與腫瘤微環(huán)境相互作用,影響腫瘤內(nèi)的細(xì)胞功能。目前,大量的基因變異的記錄,但是,基因的改變不足以解釋癌癥中普遍存在的基因表達(dá)改變和細(xì)胞功能改變,有報(bào)道稱表觀遺傳改變可以取代基因改變導(dǎo)致腫瘤抑制基因[1]的基因表達(dá)改變。表觀遺傳改變是一種可遺傳的性狀,通過干擾與DNA序列無關(guān)的基因表達(dá)而影響表型[2,3]。近幾十年來,具有功能影響的表觀遺傳改變已經(jīng)成為人們關(guān)注的關(guān)鍵目標(biāo),值得注意的是,新興的表觀遺傳療法可以逆轉(zhuǎn)癌癥的特定表觀遺傳改變[4-7]。隨之而來的挑戰(zhàn)是腫瘤內(nèi)部的異質(zhì)性加劇了個(gè)體間異質(zhì)性的影響,這進(jìn)一步模糊了表觀遺傳調(diào)節(jié)劑與癌癥基因表達(dá)之間的潛在功能關(guān)系。由此,本文設(shè)計(jì)了一種方案來促進(jìn)癌癥表觀遺傳學(xué)在腫瘤內(nèi)外的異質(zhì)性的研究,闡明了不同的表觀遺傳機(jī)制之間的關(guān)系以及他們的基因表達(dá)協(xié)同作用。本文通過大量分析基因表達(dá)數(shù)據(jù)和DNA甲基化數(shù)據(jù),并將它們逐一分解之后,使用本文開發(fā)的RMR算法去掉影響最大的離散值,試圖擬合出兩種相關(guān)的調(diào)控關(guān)系。最終找到在癌... 

【文章來源】:吉林大學(xué)吉林省 211工程院校 985工程院校 教育部直屬院校

【文章頁數(shù)】:78 頁

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于癌癥數(shù)據(jù)的子空間聚類算法及DNA甲基化調(diào)控基因表達(dá)的泛癌分析


回歸分析研究?jī)?nèi)容,預(yù)測(cè)與潛在類型的回歸混合模型;虛線表示潛在的類變量所捕獲的效應(yīng)的異質(zhì)性,是模型中的預(yù)測(cè)因子,是結(jié)果,是類比-殘差,是本文感興趣的路徑

原理圖,原理圖,算法,聚類


第2章理論基礎(chǔ)16即:........(2.11)2.3聚類分析理論基礎(chǔ)聚類分析(Clusteranalysis)亦叫做群集分析,這種技術(shù)主要是應(yīng)用在跟統(tǒng)計(jì)學(xué)相關(guān)的一些領(lǐng)域,并且有著相當(dāng)廣泛的應(yīng)用,這些應(yīng)用領(lǐng)域包括比如機(jī)器學(xué)習(xí),數(shù)據(jù)挖掘,模式識(shí)別,圖像分析和生物信息等眾多的方面。聚類分析,通俗來講就是把相似的東西放在一起,把不相似的東西區(qū)分開,這樣,在一個(gè)相似的子集中,互相之間會(huì)有相似的特性。通常數(shù)據(jù)聚類被歸類為一種非監(jiān)督學(xué)習(xí)。下面本文將介紹三種類型的聚類算法,其中K-Means是比較主流的聚類算法,雙聚類和子空間聚類則是本文主要的研究探討對(duì)象。2.3.1K-Means(K均值)聚類K-Means算法被廣泛使用,并且它是很多入門級(jí)數(shù)據(jù)科學(xué)以及研究機(jī)器學(xué)習(xí)課程的內(nèi)容。而且在代碼中理解和實(shí)現(xiàn)也十分輕松。圖2-2k-means算法原理圖示K-Means聚類的基本步驟1首先,我們需要選擇一些類/組,然后需要隨機(jī)初始化這些類各自的中心點(diǎn)。2為了算出要使用的類的數(shù)量,最好快速查看一下數(shù)據(jù),并嘗試識(shí)別不同的組。中心點(diǎn)是跟每個(gè)數(shù)據(jù)點(diǎn)的向量長(zhǎng)度相同的一個(gè)位置。11()(|)(|)()(|)...()(|)iiinnPAPBAPABPAPBAPAPBA=++

分布圖,分布圖,數(shù)據(jù),離群值


第3章DNA甲基化線性調(diào)控基因表達(dá)與RMR算法22。EM算法通常用于計(jì)算密度函數(shù)的最大似然估計(jì),貝葉斯信息準(zhǔn)則(BIC)可用于估計(jì)群的數(shù)目,混合回歸對(duì)異常值非常敏感,如圖3-1所示。頂部為有離群值的混合回歸結(jié)果,底部為無離群值的混合回歸結(jié)果。左邊的兩個(gè)面板是離群值去除前后的散點(diǎn)圖,點(diǎn)的顏色表示使用局部離群因子的數(shù)據(jù)點(diǎn)成為離群值的可能性。因此,在進(jìn)行混合回歸之前,我們對(duì)離群值進(jìn)行了一步去除。我們最近開發(fā)了一種用于穩(wěn)健混合回歸分析的算法(RMR),基本上,我們采用了一種快速似然調(diào)整的方法,通過迭代刪除那些殘差較大且可能是離群值的數(shù)據(jù)點(diǎn)。繪制COAD數(shù)據(jù)的散點(diǎn)分布圖,可以發(fā)現(xiàn)左側(cè)兩圖表示有無離散值成為一個(gè)聚類的可能性,右側(cè)兩圖表示有無離散值影響線性分布。圖3-1COAD數(shù)據(jù)散點(diǎn)分布圖但是我們的主要目標(biāo)是尋找在DNA甲基化和基因表達(dá)之間的調(diào)控關(guān)系,不僅去掉離散值是我們的目標(biāo),能夠找到在哪些數(shù)據(jù)對(duì)之間存在著什么樣子的相關(guān)關(guān)系,這些相關(guān)關(guān)系有著什么特性和關(guān)聯(lián)更是本文研究的重點(diǎn)。因此為了解決這種問題,本文設(shè)計(jì)了RMR算法(RobustMixtureRegression),以下是該算法的具體流程:2dXi

【參考文獻(xiàn)】:
期刊論文
[1]稀疏子空間聚類綜述[J]. 王衛(wèi)衛(wèi),李小平,馮象初,王斯琪.  自動(dòng)化學(xué)報(bào). 2015(08)
[2]聚類分析研究中的若干問題[J]. 王駿,王士同,鄧趙紅.  控制與決策. 2012(03)
[3]DNA甲基轉(zhuǎn)移酶的表達(dá)調(diào)控及主要生物學(xué)功能[J]. 蘇玉,王溪,朱衛(wèi)國(guó).  遺傳. 2009(11)
[4]DNA甲基化與植物抗逆性研究進(jìn)展[J]. 趙云雷,葉武威,王俊娟,樊保香,宋麗艷.  西北植物學(xué)報(bào). 2009(07)
[5]DNA甲基化與基因表達(dá)調(diào)控[J]. 鄭志紅.  國(guó)外醫(yī)學(xué).遺傳學(xué)分冊(cè). 2002(01)
[6]DNA甲基化對(duì)基因表達(dá)的影響及其在衰老過程中的表現(xiàn)[J]. 陳培利,童坦君,張宗玉.  國(guó)外醫(yī)學(xué)(分子生物學(xué)分冊(cè)). 2000(03)
[7]DNA甲基化、基因表達(dá)與腫瘤[J]. 李士諤.  基礎(chǔ)醫(yī)學(xué)與臨床. 1996(05)



本文編號(hào):3448793

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/benkebiyelunwen/3448793.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶f31c8***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com