天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 軟件論文 >

基于平滑LDA的RNA-Seq數(shù)據(jù)分析研究

發(fā)布時間:2017-12-01 15:37

  本文關鍵詞:基于平滑LDA的RNA-Seq數(shù)據(jù)分析研究


  更多相關文章: RNA-Seq 基因異構體表達水平 平滑LDA 結合區(qū) 多源映射 非均勻性 KL散度 差異異構體比例


【摘要】:隨著下一代高通量DNA測序技術的快速發(fā)展,RNA-seq技術逐漸成為了轉錄組學研究的基本實驗手段。相比傳統(tǒng)的基因芯片技術,RNA-seq技術具有高信噪比,高靈敏度,所需樣本少等特點。但是利用RNA-seq技術進行表達水平估計時仍然存在很多挑戰(zhàn),比如讀段的多源映射和非均勻分布等問題。本文針對上述問題,提出了一個轉錄組表達水平估計方法sLDASeq。該模型根據(jù)基因中轉錄本注釋信息對模型參數(shù)進行約束,對跨結合區(qū)的讀段按長度分配處理,解決了讀段跨結合區(qū)問題,并在模型中考慮了外顯子的稀疏問題。另外sLDASeq模型引入代表異構體表達水平的隱含變量,對讀段在異構體和外顯子上分布進行建模,從而解決讀段在參考序列分布非均勻問題。通過模擬數(shù)據(jù)集和多個真實數(shù)據(jù)集的驗證,相比與其它主流方法,s LDASeq方法能獲得較為準確的基因和異構體表達水平。在RNA-seq數(shù)據(jù)分析中,最基本的研究目的是尋找樣本中差異表達的基因和異構體。但目前大多數(shù)方法都是識別單個異構體的差異表達,無法同時檢測同一個基因中所包含異構體表達比例的差異。因此本文提出了一個差異異構體比例檢測方法。該方法基于我們設計的sLDASeq模型,運用該模型中隱含變量的概率分布,采用KL散度進行差異異構體比例的分析。通過模擬和真實數(shù)據(jù)集的驗證,sLDASeq方法能準確的估計基因中異構體的比例。此外在模擬數(shù)據(jù)集上,sLDASeq方法通過KL散度能準確檢測出差異異構體比例。
【學位授予單位】:南京航空航天大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:Q811.4;TP311.13
,

本文編號:1241623

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1241623.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶42943***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com