天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 管理論文 > 統(tǒng)計學(xué)論文 >

一種單細(xì)胞測序數(shù)據(jù)流程化分析方法

發(fā)布時間:2021-08-24 23:24
  目前最新的一代測序技術(shù)是單細(xì)胞測序,scRNA-seq(single cell RNA sequencing:單細(xì)胞RNA測序)是其中一項代表性技術(shù)。該技術(shù)可以解決細(xì)胞群體異質(zhì)性的問題,有助于發(fā)現(xiàn)和定義新的細(xì)胞亞型。通常采取的方法首先對數(shù)據(jù)進行質(zhì)量檢查、填補缺失數(shù)據(jù)及標(biāo)準(zhǔn)化等預(yù)處理,接著進行聚類分析,并從聚類結(jié)果中篩選出差異表達基因,最后進行細(xì)胞類型富集分析和轉(zhuǎn)錄動力學(xué)分析或其他進一步的生物學(xué)分析。在整個分析過程中,對經(jīng)過預(yù)處理的數(shù)據(jù)進行準(zhǔn)確的聚類分析是關(guān)鍵且具有挑戰(zhàn)性的任務(wù)。本文提出了一種流程化分析方法:LAK(Lasso And K-means based single cell RNA sequencing data analysis pipeline:基于Lasso和K-means的單細(xì)胞RNA測序數(shù)據(jù)流程化分析方法),將數(shù)據(jù)預(yù)處理、標(biāo)準(zhǔn)化、特征提取及聚類、差異表達分析及細(xì)胞類型識別等單細(xì)胞聚類分析流程整合為一個集成工具。本文重點聚焦于聚類環(huán)節(jié),改進完善現(xiàn)有方法,以提高聚類結(jié)果及后續(xù)細(xì)胞類型識別的準(zhǔn)確性。對其他環(huán)節(jié),本課題對現(xiàn)有成熟方法進行分析、比較、篩選,采用準(zhǔn)確度高、穩(wěn)定性... 

【文章來源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校

【文章頁數(shù)】:46 頁

【學(xué)位級別】:碩士

【部分圖文】:

一種單細(xì)胞測序數(shù)據(jù)流程化分析方法


單細(xì)胞RNA測序數(shù)據(jù)聚類分析流程圖

示意圖,限制區(qū)域,示意圖,應(yīng)用統(tǒng)計


哈爾濱工業(yè)大學(xué)應(yīng)用統(tǒng)計碩士專業(yè)學(xué)位論文 pjjjjDwfX1;max(,)ws.t. 122w , s1w , 0jw j 一個 p 維向量,jw 是第 j 個維度的權(quán)重, s 是控制懲罰這是為了讓 L1和 L2同時起作用,見圖 3-1。當(dāng) s 1時,2; 當(dāng) s p時,限制區(qū)域退化為只有 L1.

示意圖,限制區(qū)域,示意圖


下面對式(3-14)作簡要的說明:(1)如果pw w ... w12, 則(3-14)退化成(3-13)。(2)L1 正則項將起到對維數(shù)進行約減的作用,參數(shù) s 越小,懲罰力度越大,將導(dǎo)致更多的權(quán)數(shù)變?yōu)?0。(3)jw 可以被理解為每個維度對聚類的貢獻度,大 的值意味著該特征對聚類的影響較大, =0 則意味著該特征沒有參與聚類。(4)為了簡化模型,要求 , 0jjf X.接下來,將 K-means 算法按上述框架修改為稀疏聚類算法。在歐式距離下,K-means 算法等同于最小化 WCSS(within-cluster sum of squares:組內(nèi)平方和),也就是說,尋找將 n個樣本劃分成 K 類的最優(yōu)分劃,使得 WCSS 最小。Kp1a) s=1.05 時,共同限制區(qū)域b) s=1.35 時,共同限制區(qū)域圖 3-2 s 取不同值時,限制區(qū)域示意圖


本文編號:3360922

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/tongjijuecelunwen/3360922.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶6a625***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com