基于腫瘤單細(xì)胞三組學(xué)數(shù)據(jù)的統(tǒng)計推斷
發(fā)布時間:2021-06-10 18:27
隨著單細(xì)胞多組學(xué)平行測序技術(shù)的發(fā)展,在單細(xì)胞分辨率下多組學(xué)信息可以被同時測量到,結(jié)合這些信息能更仔細(xì)地觀察細(xì)胞可變性和異質(zhì)性。分析同一細(xì)胞中DNA和RNA測序數(shù)據(jù)能夠觀測到基因組變異,更加精確地檢測DNA突變。對表觀組學(xué)和轉(zhuǎn)錄組學(xué)聯(lián)合分析可以揭示甲基化和染色質(zhì)可接近性對基因表達(dá)的調(diào)控作用,單細(xì)胞三組學(xué)聯(lián)合分析能夠更清楚地識別特定細(xì)胞及其功能,真正解開細(xì)胞異質(zhì)性的含義。腫瘤發(fā)生是一個復(fù)雜的生物過程,細(xì)胞異質(zhì)性同時存在于基因組、表觀組和轉(zhuǎn)錄組中,相同基因在同一種腫瘤細(xì)胞中可能具有不同的DNA甲基化或基因表達(dá)模式,需要結(jié)合多組學(xué)信息才能明確的將細(xì)胞分類為亞群。本文提出了一種基于單細(xì)胞三組學(xué)數(shù)據(jù)的聯(lián)合聚類方法,能夠?qū)ν患?xì)胞中測量得到的基因組學(xué)、轉(zhuǎn)錄組學(xué)和表觀組學(xué)數(shù)據(jù)進(jìn)行聯(lián)合分析。單細(xì)胞三組學(xué)聯(lián)合聚類是對系統(tǒng)聚類改進(jìn)后的多維聚類方法,聚類過程中,應(yīng)用矩陣范數(shù)表示兩個細(xì)胞之間的距離,用離差平方和表示類與類之間的距離,并且在聚類前根據(jù)單細(xì)胞多組學(xué)之間的相關(guān)關(guān)系進(jìn)行特征選擇。針對實際數(shù)據(jù)進(jìn)行三組學(xué)聯(lián)合聚類分析。三組學(xué)測序數(shù)據(jù)類型各異,存在量綱不統(tǒng)一和數(shù)據(jù)缺失等問題,需要進(jìn)行質(zhì)量控制、空缺值填補、數(shù)據(jù)...
【文章來源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:53 頁
【學(xué)位級別】:碩士
【部分圖文】:
單細(xì)胞三組學(xué)數(shù)據(jù)處理流程圖
量實驗表明CpG位點主要富集在基因的轉(zhuǎn)錄起始位點上下游區(qū)域,且與基因的基因體區(qū)域存在一定的差異。因此本文選擇基因啟動子上下游區(qū)域和基因體區(qū)域內(nèi)CpG位點平均甲基化值代表DNA甲基化水平。經(jīng)過查找資料發(fā)現(xiàn)大部分學(xué)者選擇基因的啟動子區(qū)域上下游附近幾千個堿基甲基化的平均值作為代表值。為了使平均甲基化值代替基因的甲基化水平具有合理性,本文在衡量基因的啟動子區(qū)域平均甲基化水平時嘗試啟動子上下游多個區(qū)域,以下展示測序數(shù)據(jù)中所有基因啟動子區(qū)域上下游1kb(區(qū)域Ⅰ),2kb(區(qū)域Ⅱ),3kb(區(qū)域Ⅲ)包含的位點個數(shù)。圖2-1基因區(qū)域Ⅰ中CpG位點頻數(shù)分布圖Count
哈爾濱工業(yè)大學(xué)應(yīng)用統(tǒng)計碩士專業(yè)學(xué)位論文-9-圖2-2基因區(qū)域Ⅱ中CpG位點頻數(shù)分布圖圖2-3基因區(qū)域Ⅲ中CpG位點頻數(shù)分布圖圖2-1,2-2,2-3中分別展示了所有基因啟動子上下游1kb,2kb,3kb所包含的位點個數(shù),圖2-1中顯示出基因啟動子區(qū)域Ⅰ包含最多的CpG位點個數(shù)為300,并且每個基因包含的位點個數(shù)不均勻,大部分基因的啟動子上下游1kb沒有檢測到CpG位點,導(dǎo)致了甲基化信息極大的損失。圖2-2和圖2-3中展示數(shù)據(jù)中基因啟動子附近檢測到的位點個數(shù)最大在400左右,相比較上下游1kb來說,包含了大部分的位點信息。上下游2kb的位點個數(shù)分布不均勻,但是大部分基因啟動子區(qū)域的位點甲基化被檢測到。上下游3kb的區(qū)域是比較理想的情況,位點的甲基化信息得到了充分地利用并且也相對均勻,但由于選擇的區(qū)間較大,對于一些較短的基因CountCount
【參考文獻(xiàn)】:
期刊論文
[1]單細(xì)胞分析技術(shù)在人類細(xì)胞圖譜計劃中的應(yīng)用[J]. 劉念,王園園,胡新笑,何濱,曲廣波,史建波,胡立剛,江桂斌. 中國科學(xué):化學(xué). 2018(10)
[2]單細(xì)胞測序:技術(shù),應(yīng)用和未來發(fā)展(英文)[J]. 薛瑞棟,李若巖,白凡. Science Bulletin. 2015(01)
博士論文
[1]利用轉(zhuǎn)錄組測序和蛋白質(zhì)組學(xué)分析篩選綿羊多羔候選基因的研究[D]. 湯繼順.中國農(nóng)業(yè)科學(xué)院 2019
碩士論文
[1]針對高維稀疏單細(xì)胞RNA測序數(shù)據(jù)的聚類研究[D]. 金開秀.浙江大學(xué) 2018
本文編號:3222897
【文章來源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:53 頁
【學(xué)位級別】:碩士
【部分圖文】:
單細(xì)胞三組學(xué)數(shù)據(jù)處理流程圖
量實驗表明CpG位點主要富集在基因的轉(zhuǎn)錄起始位點上下游區(qū)域,且與基因的基因體區(qū)域存在一定的差異。因此本文選擇基因啟動子上下游區(qū)域和基因體區(qū)域內(nèi)CpG位點平均甲基化值代表DNA甲基化水平。經(jīng)過查找資料發(fā)現(xiàn)大部分學(xué)者選擇基因的啟動子區(qū)域上下游附近幾千個堿基甲基化的平均值作為代表值。為了使平均甲基化值代替基因的甲基化水平具有合理性,本文在衡量基因的啟動子區(qū)域平均甲基化水平時嘗試啟動子上下游多個區(qū)域,以下展示測序數(shù)據(jù)中所有基因啟動子區(qū)域上下游1kb(區(qū)域Ⅰ),2kb(區(qū)域Ⅱ),3kb(區(qū)域Ⅲ)包含的位點個數(shù)。圖2-1基因區(qū)域Ⅰ中CpG位點頻數(shù)分布圖Count
哈爾濱工業(yè)大學(xué)應(yīng)用統(tǒng)計碩士專業(yè)學(xué)位論文-9-圖2-2基因區(qū)域Ⅱ中CpG位點頻數(shù)分布圖圖2-3基因區(qū)域Ⅲ中CpG位點頻數(shù)分布圖圖2-1,2-2,2-3中分別展示了所有基因啟動子上下游1kb,2kb,3kb所包含的位點個數(shù),圖2-1中顯示出基因啟動子區(qū)域Ⅰ包含最多的CpG位點個數(shù)為300,并且每個基因包含的位點個數(shù)不均勻,大部分基因的啟動子上下游1kb沒有檢測到CpG位點,導(dǎo)致了甲基化信息極大的損失。圖2-2和圖2-3中展示數(shù)據(jù)中基因啟動子附近檢測到的位點個數(shù)最大在400左右,相比較上下游1kb來說,包含了大部分的位點信息。上下游2kb的位點個數(shù)分布不均勻,但是大部分基因啟動子區(qū)域的位點甲基化被檢測到。上下游3kb的區(qū)域是比較理想的情況,位點的甲基化信息得到了充分地利用并且也相對均勻,但由于選擇的區(qū)間較大,對于一些較短的基因CountCount
【參考文獻(xiàn)】:
期刊論文
[1]單細(xì)胞分析技術(shù)在人類細(xì)胞圖譜計劃中的應(yīng)用[J]. 劉念,王園園,胡新笑,何濱,曲廣波,史建波,胡立剛,江桂斌. 中國科學(xué):化學(xué). 2018(10)
[2]單細(xì)胞測序:技術(shù),應(yīng)用和未來發(fā)展(英文)[J]. 薛瑞棟,李若巖,白凡. Science Bulletin. 2015(01)
博士論文
[1]利用轉(zhuǎn)錄組測序和蛋白質(zhì)組學(xué)分析篩選綿羊多羔候選基因的研究[D]. 湯繼順.中國農(nóng)業(yè)科學(xué)院 2019
碩士論文
[1]針對高維稀疏單細(xì)胞RNA測序數(shù)據(jù)的聚類研究[D]. 金開秀.浙江大學(xué) 2018
本文編號:3222897
本文鏈接:http://sikaile.net/yixuelunwen/zlx/3222897.html
最近更新
教材專著