天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 理工論文 > 生物學(xué)論文 >

基于細(xì)胞關(guān)系矩陣自我更新開發(fā)的單細(xì)胞RNA-seq聚類新方法

發(fā)布時(shí)間:2021-03-18 13:05
  單細(xì)胞轉(zhuǎn)錄組測(cè)序技術(shù)是一種能在單細(xì)胞水平檢測(cè)出基因表達(dá)的測(cè)序技術(shù),該技術(shù)廣泛應(yīng)用在發(fā)育生物學(xué)、腫瘤生物學(xué)、免疫學(xué)、神經(jīng)生物學(xué)等多個(gè)生物學(xué)分支領(lǐng)域。隨著技術(shù)的發(fā)展,單細(xì)胞轉(zhuǎn)錄組測(cè)序技術(shù)的檢測(cè)細(xì)胞數(shù)量和測(cè)序覆蓋率越來越大,為人類細(xì)胞圖譜計(jì)劃提供重要的技術(shù)支持。由于分離細(xì)胞時(shí)沒有相關(guān)的細(xì)胞類型標(biāo)簽,需要用無監(jiān)督聚類方法先將細(xì)胞分為幾個(gè)細(xì)胞類群才能進(jìn)行后續(xù)分析。無監(jiān)督聚類算法沒有訓(xùn)練樣本集,所以大多數(shù)算法的分析結(jié)果很容易受到初始參數(shù)值設(shè)定而改變。因此開發(fā)出更加穩(wěn)定的聚類算法對(duì)于單細(xì)胞測(cè)序數(shù)據(jù)的分析非常關(guān)鍵。本研究基于對(duì)細(xì)胞-細(xì)胞相似度矩陣的分析,通過對(duì)相似度矩陣行向量求夾角余弦重新定義細(xì)胞之間的相似度來更新細(xì)胞-細(xì)胞相似度矩陣。借助統(tǒng)計(jì)學(xué)大數(shù)定律證明了這種操作將會(huì)建立起穩(wěn)定而且有序的統(tǒng)計(jì)量來描述細(xì)胞之間的相似度關(guān)系,并且基于這種關(guān)系的有序性與對(duì)應(yīng)的兩個(gè)細(xì)胞是否處于同一類別的關(guān)系開發(fā)了一種新的聚類算法,命名為切比雪夫大數(shù)聚類算法。接下來在模擬數(shù)據(jù)集中做仿真測(cè)試實(shí)驗(yàn)來驗(yàn)證該聚類算法的每一步都能達(dá)到預(yù)期的理想效果,最終完成聚類分析。本研究開發(fā)的算法用在真實(shí)數(shù)據(jù)集中進(jìn)行測(cè)試,結(jié)果顯示該聚類算法能夠正確... 

【文章來源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校

【文章頁數(shù)】:46 頁

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于細(xì)胞關(guān)系矩陣自我更新開發(fā)的單細(xì)胞RNA-seq聚類新方法


最近10年內(nèi)開發(fā)出的單細(xì)胞轉(zhuǎn)錄組測(cè)序技術(shù)以及它們分別能檢測(cè)的細(xì)胞數(shù)在技術(shù)層面上,單細(xì)胞轉(zhuǎn)錄組的發(fā)展取決于解決了三方面問題,即如何非特

t分布,細(xì)胞,數(shù)據(jù),圖譜


哈爾濱工業(yè)大學(xué)理學(xué)碩士學(xué)位論文-3-高精度發(fā)育圖譜[28],小鼠器官發(fā)生圖譜(MouseOrganogenesisCellAtlas,MOCA)[29]。后者利用其首創(chuàng)的超高通量單細(xì)胞測(cè)序技術(shù):sci-RNA-seq3,同時(shí)檢測(cè)了兩百萬個(gè)單細(xì)胞轉(zhuǎn)錄圖譜,并對(duì)小鼠發(fā)育階段(受精后9.5天至13.5天)的主要器官進(jìn)行了高精度單細(xì)胞水平的系統(tǒng)性研究,系統(tǒng)性地繪制了形成各種器官的細(xì)胞動(dòng)態(tài)分化路徑以及在每個(gè)路徑中中基因表達(dá)發(fā)生了哪些變化。圖1-2從小鼠細(xì)胞圖集數(shù)據(jù)中采樣的60,000個(gè)單細(xì)胞的t分布隨機(jī)鄰居嵌入(t-SNE)分析。在t-SNE圖中標(biāo)記了98個(gè)主要細(xì)胞類型簇(每個(gè)數(shù)字序號(hào)代表一種細(xì)胞類型)[26]。除了細(xì)胞圖譜的繪制之外,單細(xì)胞轉(zhuǎn)錄組測(cè)序技術(shù)的另一重要應(yīng)用方向是模擬推測(cè)生物體發(fā)育過程或者疾病發(fā)生過程。2018年,《Science》同一期接連三篇文章[30-32]報(bào)道了利用單細(xì)胞RNA-seq結(jié)合其他技術(shù)構(gòu)建了斑馬魚和蛙早期胚胎發(fā)育過程中的基因表達(dá)動(dòng)態(tài)圖譜,利用分析方法把來自不同時(shí)間點(diǎn)采樣的,揭示了單個(gè)細(xì)胞構(gòu)建整個(gè)生物體的完整過程。其中一篇文章報(bào)道了挑戰(zhàn)發(fā)育生物學(xué)過去認(rèn)知的新發(fā)現(xiàn):在斑馬魚的細(xì)胞分化過程中,有同一種細(xì)胞類型卻來自不同的細(xì)胞譜系,出現(xiàn)了“譜系遷移”的現(xiàn)象。另外,單細(xì)胞轉(zhuǎn)錄組測(cè)序技術(shù)能夠?yàn)闃?gòu)建準(zhǔn)確且完整的發(fā)育過程機(jī)制提供大量有效數(shù)據(jù)支持。如圖1-3所示,研究者們發(fā)現(xiàn)在小鼠著床前胚胎發(fā)育過程中,位置和信號(hào)事件似乎在轉(zhuǎn)錄程序成熟之前,并起到了調(diào)控細(xì)胞命運(yùn)的作用[33]。

模型圖,囊胚,譜系,基因表達(dá)


哈爾濱工業(yè)大學(xué)理學(xué)碩士學(xué)位論文-4-圖1-3三種囊胚譜系發(fā)育中基因表達(dá)變化的示意圖模型1.3單細(xì)胞轉(zhuǎn)錄組測(cè)序分析方法概述單細(xì)胞轉(zhuǎn)錄組測(cè)序的特點(diǎn)主要有:樣本量大,維數(shù)高,數(shù)據(jù)稀疏,沒有訓(xùn)練集進(jìn)行有監(jiān)督機(jī)器學(xué)習(xí)或統(tǒng)計(jì)分析等。為了克服上述困難,我們需要借助無監(jiān)督學(xué)習(xí)算法如流形學(xué)習(xí)和聚類分析來對(duì)數(shù)據(jù)進(jìn)行分析,最終得出有生物學(xué)意義的結(jié)論。圖1-4展示了處理scRNA-seq數(shù)據(jù)以鑒定和表征細(xì)胞群體的核心計(jì)算方法[11]。圖1-4單細(xì)胞測(cè)序分析方法概述。顏色表示在每個(gè)步驟之后都要調(diào)整表達(dá)式矩陣的哪些部分,例如,特征選擇僅從表達(dá)式矩陣中刪除行,而降維則計(jì)算由元特征組成的新矩陣。本審查中未詳細(xì)介紹的預(yù)處理步驟包括質(zhì)量控制和標(biāo)準(zhǔn)化。與傳統(tǒng)的轉(zhuǎn)錄組測(cè)序數(shù)據(jù)分析策略不同,單細(xì)胞轉(zhuǎn)錄組測(cè)序數(shù)據(jù)分析并不是基于每個(gè)單細(xì)胞的基因表達(dá)情況直接判定細(xì)胞模式,而是用高斯核等方式先將單細(xì)胞轉(zhuǎn)錄組表達(dá)矩陣先轉(zhuǎn)化為細(xì)胞-細(xì)胞相似度關(guān)系矩陣或者距離關(guān)系矩陣。在細(xì)胞-細(xì)胞相似度矩陣的基礎(chǔ)上用k-近鄰的方法選擇與每個(gè)細(xì)胞最近鄰的k個(gè)鄰居細(xì)


本文編號(hào):3088373

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/projectlw/swxlw/3088373.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶4c77b***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com