天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 醫(yī)學(xué)論文 > 腫瘤論文 >

基于腫瘤單細(xì)胞三組學(xué)數(shù)據(jù)的統(tǒng)計(jì)推斷

發(fā)布時(shí)間:2021-06-10 18:27
  隨著單細(xì)胞多組學(xué)平行測(cè)序技術(shù)的發(fā)展,在單細(xì)胞分辨率下多組學(xué)信息可以被同時(shí)測(cè)量到,結(jié)合這些信息能更仔細(xì)地觀察細(xì)胞可變性和異質(zhì)性。分析同一細(xì)胞中DNA和RNA測(cè)序數(shù)據(jù)能夠觀測(cè)到基因組變異,更加精確地檢測(cè)DNA突變。對(duì)表觀組學(xué)和轉(zhuǎn)錄組學(xué)聯(lián)合分析可以揭示甲基化和染色質(zhì)可接近性對(duì)基因表達(dá)的調(diào)控作用,單細(xì)胞三組學(xué)聯(lián)合分析能夠更清楚地識(shí)別特定細(xì)胞及其功能,真正解開(kāi)細(xì)胞異質(zhì)性的含義。腫瘤發(fā)生是一個(gè)復(fù)雜的生物過(guò)程,細(xì)胞異質(zhì)性同時(shí)存在于基因組、表觀組和轉(zhuǎn)錄組中,相同基因在同一種腫瘤細(xì)胞中可能具有不同的DNA甲基化或基因表達(dá)模式,需要結(jié)合多組學(xué)信息才能明確的將細(xì)胞分類(lèi)為亞群。本文提出了一種基于單細(xì)胞三組學(xué)數(shù)據(jù)的聯(lián)合聚類(lèi)方法,能夠?qū)ν患?xì)胞中測(cè)量得到的基因組學(xué)、轉(zhuǎn)錄組學(xué)和表觀組學(xué)數(shù)據(jù)進(jìn)行聯(lián)合分析。單細(xì)胞三組學(xué)聯(lián)合聚類(lèi)是對(duì)系統(tǒng)聚類(lèi)改進(jìn)后的多維聚類(lèi)方法,聚類(lèi)過(guò)程中,應(yīng)用矩陣范數(shù)表示兩個(gè)細(xì)胞之間的距離,用離差平方和表示類(lèi)與類(lèi)之間的距離,并且在聚類(lèi)前根據(jù)單細(xì)胞多組學(xué)之間的相關(guān)關(guān)系進(jìn)行特征選擇。針對(duì)實(shí)際數(shù)據(jù)進(jìn)行三組學(xué)聯(lián)合聚類(lèi)分析。三組學(xué)測(cè)序數(shù)據(jù)類(lèi)型各異,存在量綱不統(tǒng)一和數(shù)據(jù)缺失等問(wèn)題,需要進(jìn)行質(zhì)量控制、空缺值填補(bǔ)、數(shù)據(jù)... 

【文章來(lái)源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校

【文章頁(yè)數(shù)】:53 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于腫瘤單細(xì)胞三組學(xué)數(shù)據(jù)的統(tǒng)計(jì)推斷


單細(xì)胞三組學(xué)數(shù)據(jù)處理流程圖

頻數(shù)分布,頻數(shù)分布,位點(diǎn),基因


量實(shí)驗(yàn)表明CpG位點(diǎn)主要富集在基因的轉(zhuǎn)錄起始位點(diǎn)上下游區(qū)域,且與基因的基因體區(qū)域存在一定的差異。因此本文選擇基因啟動(dòng)子上下游區(qū)域和基因體區(qū)域內(nèi)CpG位點(diǎn)平均甲基化值代表DNA甲基化水平。經(jīng)過(guò)查找資料發(fā)現(xiàn)大部分學(xué)者選擇基因的啟動(dòng)子區(qū)域上下游附近幾千個(gè)堿基甲基化的平均值作為代表值。為了使平均甲基化值代替基因的甲基化水平具有合理性,本文在衡量基因的啟動(dòng)子區(qū)域平均甲基化水平時(shí)嘗試啟動(dòng)子上下游多個(gè)區(qū)域,以下展示測(cè)序數(shù)據(jù)中所有基因啟動(dòng)子區(qū)域上下游1kb(區(qū)域Ⅰ),2kb(區(qū)域Ⅱ),3kb(區(qū)域Ⅲ)包含的位點(diǎn)個(gè)數(shù)。圖2-1基因區(qū)域Ⅰ中CpG位點(diǎn)頻數(shù)分布圖Count

頻數(shù)分布,位點(diǎn),頻數(shù)分布,基因


哈爾濱工業(yè)大學(xué)應(yīng)用統(tǒng)計(jì)碩士專(zhuān)業(yè)學(xué)位論文-9-圖2-2基因區(qū)域Ⅱ中CpG位點(diǎn)頻數(shù)分布圖圖2-3基因區(qū)域Ⅲ中CpG位點(diǎn)頻數(shù)分布圖圖2-1,2-2,2-3中分別展示了所有基因啟動(dòng)子上下游1kb,2kb,3kb所包含的位點(diǎn)個(gè)數(shù),圖2-1中顯示出基因啟動(dòng)子區(qū)域Ⅰ包含最多的CpG位點(diǎn)個(gè)數(shù)為300,并且每個(gè)基因包含的位點(diǎn)個(gè)數(shù)不均勻,大部分基因的啟動(dòng)子上下游1kb沒(méi)有檢測(cè)到CpG位點(diǎn),導(dǎo)致了甲基化信息極大的損失。圖2-2和圖2-3中展示數(shù)據(jù)中基因啟動(dòng)子附近檢測(cè)到的位點(diǎn)個(gè)數(shù)最大在400左右,相比較上下游1kb來(lái)說(shuō),包含了大部分的位點(diǎn)信息。上下游2kb的位點(diǎn)個(gè)數(shù)分布不均勻,但是大部分基因啟動(dòng)子區(qū)域的位點(diǎn)甲基化被檢測(cè)到。上下游3kb的區(qū)域是比較理想的情況,位點(diǎn)的甲基化信息得到了充分地利用并且也相對(duì)均勻,但由于選擇的區(qū)間較大,對(duì)于一些較短的基因CountCount

【參考文獻(xiàn)】:
期刊論文
[1]單細(xì)胞分析技術(shù)在人類(lèi)細(xì)胞圖譜計(jì)劃中的應(yīng)用[J]. 劉念,王園園,胡新笑,何濱,曲廣波,史建波,胡立剛,江桂斌.  中國(guó)科學(xué):化學(xué). 2018(10)
[2]單細(xì)胞測(cè)序:技術(shù),應(yīng)用和未來(lái)發(fā)展(英文)[J]. 薛瑞棟,李若巖,白凡.  Science Bulletin. 2015(01)

博士論文
[1]利用轉(zhuǎn)錄組測(cè)序和蛋白質(zhì)組學(xué)分析篩選綿羊多羔候選基因的研究[D]. 湯繼順.中國(guó)農(nóng)業(yè)科學(xué)院 2019

碩士論文
[1]針對(duì)高維稀疏單細(xì)胞RNA測(cè)序數(shù)據(jù)的聚類(lèi)研究[D]. 金開(kāi)秀.浙江大學(xué) 2018



本文編號(hào):3222897

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/yixuelunwen/zlx/3222897.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)ccb02***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com