天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 理工論文 > 生物學(xué)論文 >

面向單細(xì)胞RNA-seq數(shù)據(jù)的聚類方法研究

發(fā)布時(shí)間:2020-05-09 07:01
【摘要】:單細(xì)胞RNA測序(scRNA-seq)允許生物學(xué)家收集大量詳細(xì)描述單個(gè)細(xì)胞轉(zhuǎn)錄組的RNA-seq數(shù)據(jù),無監(jiān)督聚類對于這些數(shù)據(jù)的分析非常重要,因?yàn)樗捎糜谧R(shí)別出未知的細(xì)胞類型。通過基于轉(zhuǎn)錄組相似性的無監(jiān)督聚類來定義細(xì)胞類型已經(jīng)成為單細(xì)胞RNAseq最強(qiáng)有力的應(yīng)用之一。廣義的來看,無監(jiān)督聚類的目的是發(fā)現(xiàn)一組對象的自然分組。在轉(zhuǎn)錄組的基礎(chǔ)上定義細(xì)胞類型是有吸引力的,因?yàn)闊o監(jiān)督聚類提供了一組數(shù)據(jù)驅(qū)動(dòng)的,一致性并且無偏倚的方法。基于此思想,一些基因測序項(xiàng)目應(yīng)運(yùn)而生,這些測序項(xiàng)目旨在為生物體或組織在不同發(fā)育階段存在的所有細(xì)胞類型建立全面的參考資料。許多scRNA-seq數(shù)據(jù)集非常大,可以達(dá)到數(shù)十萬個(gè)細(xì)胞,這帶來了挑戰(zhàn)和機(jī)遇。單細(xì)胞RNA-seq表達(dá)數(shù)據(jù)集是基因組學(xué)中遇到的較為復(fù)雜的數(shù)據(jù)集。即使是最小的單細(xì)胞RNA-seq實(shí)驗(yàn),也會(huì)取樣數(shù)百個(gè)細(xì)胞,測量每個(gè)細(xì)胞中超過10000個(gè)基因的表達(dá)水平。大數(shù)據(jù)集確保分析具有高準(zhǔn)確率的同時(shí)也提高了檢測罕見細(xì)胞類型的能力。聚類的效率和準(zhǔn)確性成為了數(shù)據(jù)分析的一大挑戰(zhàn)。為了使細(xì)胞圖譜具有實(shí)際的應(yīng)用價(jià)值,細(xì)胞聚類將是計(jì)算的關(guān)鍵挑戰(zhàn)之一。為了能夠在scRNA-seq數(shù)據(jù)集上得到較為準(zhǔn)確的聚類結(jié)果,便于研究學(xué)者進(jìn)一步的分析生物數(shù)據(jù),我們對單細(xì)胞RNA-seq數(shù)據(jù)的聚類方法進(jìn)行了研究。由于降維可以減少噪聲,還原低維流形,加快數(shù)據(jù)處理速度,我們嘗試在聚類之前對數(shù)據(jù)進(jìn)行降維。我們研究了一些可以應(yīng)用在scRNA-seq數(shù)據(jù)上的降維和聚類的算法。降維算法主要包括主成分分析(PCA),獨(dú)立成分分析(ICA)和非負(fù)矩陣分解(NMF),聚類算法則包括Kmeans,層次聚類(Hierarchical Clustering)和Louvain。Louvain算法是用來研究圖數(shù)據(jù)的一種社區(qū)發(fā)現(xiàn)算法,其被認(rèn)為是性能最好的社區(qū)發(fā)現(xiàn)算法;趕cRNA-seq數(shù)據(jù)的特征,我們將KNN的近鄰思想與Louvain相結(jié)合使其更好的應(yīng)用于scRNA-seq數(shù)據(jù)。我們在兩個(gè)大型scRNA-seq數(shù)據(jù)集上共進(jìn)行了四次實(shí)驗(yàn)并分別對聚類結(jié)果進(jìn)行了定量分析,同時(shí)使用t-SNE方法進(jìn)行了可視化分析。結(jié)果顯示Louvain算法在聚類的準(zhǔn)確性上表現(xiàn)非常優(yōu)秀。我們對其它兩種聚類方法也進(jìn)行了分析,并且發(fā)現(xiàn)層次聚類在區(qū)分大規(guī)模樣本時(shí)表現(xiàn)很好。另外原始數(shù)據(jù)未降維前的聚類結(jié)果與降維之后的聚類結(jié)果存在很大的差距,以此也驗(yàn)證了降維在scRNA-seq數(shù)據(jù)聚類過程中的必要性。
【圖文】:

社區(qū),遍歷,結(jié)點(diǎn)


圖 2.3 Louvain 社區(qū)算法圖解[40]Louvain 算法的實(shí)現(xiàn)流程主要包括兩個(gè)步驟。開始的時(shí)候,每個(gè)節(jié)點(diǎn)都為一個(gè)社區(qū)。第一步:不斷遍歷網(wǎng)絡(luò)中的結(jié)點(diǎn),對每個(gè)結(jié)點(diǎn)遍歷其所有鄰居,,計(jì)算如果該結(jié)

工作流程圖,數(shù)據(jù)獲取,工作流程,小鼠


P 轉(zhuǎn)基因小鼠中通過流式細(xì)胞術(shù)獲得了 116 個(gè)細(xì)胞以外,其他細(xì)胞都是由選擇。研究人員共進(jìn)行了 76 次 Fluidigm C1 實(shí)驗(yàn),每一次實(shí)驗(yàn)都試圖捕最終得到了 3005 個(gè)高質(zhì)量的包含獨(dú)特分子標(biāo)識(shí)符的單細(xì)胞,這種分子保 擴(kuò)增后也可以計(jì)算 mRNA 分子。
【學(xué)位授予單位】:吉林大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2019
【分類號(hào)】:TP311.13;Q811.4

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 曾廣周;一個(gè)基于Gabrial圖的聚類方法[J];信息與控制;1988年03期

2 李然;史坤鵬;李健;;基于聚類樹方法的同調(diào)機(jī)組分群研究[J];中國農(nóng)村水利水電;2007年10期

3 陳鋼,馮志勇,金輝;基于GT編碼的零件聚類樹的建立[J];中國制造業(yè)信息化;2003年06期

4 李建伏;吳鳳珍;趙玉成;;一種基于啟發(fā)式的分層聚類[J];計(jì)算機(jī)應(yīng)用與軟件;2014年05期

5 耿增民;萬玉釵;劉峽壁;蘭麗;陳迪;;一種基于GMM-聚類樹的面向大規(guī)模服裝圖像檢索的索引結(jié)構(gòu)[J];北京服裝學(xué)院學(xué)報(bào)(自然科學(xué)版);2016年03期

6 溫濟(jì)川;;基于自尋優(yōu)層次聚類的孤立點(diǎn)分析[J];計(jì)算機(jī)系統(tǒng)應(yīng)用;2008年04期

7 王家騰;殷宏;解文彬;殷超;;基于頂點(diǎn)重要度和層次聚類樹的地形網(wǎng)格簡化[J];計(jì)算機(jī)工程與設(shè)計(jì);2016年06期

8 賀德化,彭英偉,朱鋒峰;聚類結(jié)果的比較研究[J];應(yīng)用數(shù)學(xué)與計(jì)算數(shù)學(xué)學(xué)報(bào);1999年01期

9 梁斌梅;韋琳娜;宋慶禎;;一種基于層次聚類的全局孤立點(diǎn)識(shí)別方法[J];計(jì)算機(jī)應(yīng)用研究;2011年05期

10 張巍;沈富可;;網(wǎng)絡(luò)拓?fù)渑卸ǖ难芯縖J];電腦知識(shí)與技術(shù)(學(xué)術(shù)交流);2007年01期

相關(guān)會(huì)議論文 前5條

1 錢衛(wèi)寧;錢海蕾;周傲英;;構(gòu)造準(zhǔn)確的多粒度聚類樹:一種交互式的方法[A];第十七屆全國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2000年

2 錢衛(wèi)寧;錢海蕾;周傲英;;聚類樹合并——聚類超大規(guī)模數(shù)據(jù)庫[A];第十八屆全國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2001年

3 鄭君君;李新光;祝一薇;劉建軍;夏勝平;譚立球;;海量圖像集中K近鄰求解的高效算法[A];第十五屆全國圖象圖形學(xué)學(xué)術(shù)會(huì)議論文集[C];2010年

4 錢海蕾;錢衛(wèi)寧;周傲英;;對于聚合聚類終止條件的研究[A];第十八屆全國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2001年

5 周秀娟;史賢明;;沙門氏菌特異的分子檢測靶點(diǎn)的篩選與評(píng)價(jià)[A];中國食品科學(xué)技術(shù)學(xué)會(huì)第十一屆年會(huì)論文摘要集[C];2014年

相關(guān)博士學(xué)位論文 前4條

1 徐麗;基于粒度計(jì)算的聚類集成算法研究[D];中國礦業(yè)大學(xué);2018年

2 邱敏;基于天然氣水合物勘探的多功能CPTU數(shù)據(jù)解釋與聚類算法研究[D];中國地質(zhì)大學(xué);2018年

3 羅會(huì)蘭;聚類集成關(guān)鍵技術(shù)研究[D];浙江大學(xué);2007年

4 郝立麗;漢語文本數(shù)據(jù)挖掘[D];吉林大學(xué);2009年

相關(guān)碩士學(xué)位論文 前10條

1 楊其躍;面向單細(xì)胞RNA-seq數(shù)據(jù)的聚類方法研究[D];吉林大學(xué);2019年

2 李志鵬;基于連續(xù)框架的腦纖維聚類可視化研究[D];浙江工業(yè)大學(xué);2018年

3 柳鑫;基于勢能場模型的層次優(yōu)化聚類算法研究[D];武漢理工大學(xué);2018年

4 韓默;基于元路徑的異質(zhì)網(wǎng)協(xié)同聚類算法的設(shè)計(jì)與實(shí)現(xiàn)[D];吉林大學(xué);2018年

5 王懷志;MeRIP-Seq高通測序數(shù)據(jù)的關(guān)鍵生物信息學(xué)方法研究[D];中國礦業(yè)大學(xué);2018年

6 鐘俊坤;幾種新聚類算法的研究[D];西安電子科技大學(xué);2018年

7 馮冰滔;基于聚類方法的腦區(qū)基因共表達(dá)模式研究與分析[D];湖南大學(xué);2014年

8 陳潔彥;基于特征子空間的混合聚類集成學(xué)習(xí)方法研究[D];華南理工大學(xué);2018年

9 袁慎溪;基于隨機(jī)森林和預(yù)測聚類樹的多類標(biāo)分類算法研究[D];華南理工大學(xué);2017年

10 于悅;基于多視角社區(qū)發(fā)現(xiàn)的實(shí)體聚類算法[D];北京化工大學(xué);2017年



本文編號(hào):2655769

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/projectlw/swxlw/2655769.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶5b614***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com