天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 理工論文 > 生物學(xué)論文 >

基于孤立森林和全變分的拷貝數(shù)變異檢測(cè)方法

發(fā)布時(shí)間:2020-08-25 00:13
【摘要】:在第二代測(cè)序技術(shù)廣泛應(yīng)用之后,人類基因組測(cè)序數(shù)據(jù)以爆炸式的速度飛速增長(zhǎng)。雖然第二代測(cè)序技術(shù)的廣泛使用為相關(guān)研究累積了大量的測(cè)序數(shù)據(jù),但是得到這些測(cè)序數(shù)據(jù)只是獲取基因組中有效信息的基礎(chǔ),研究的最終目的是要發(fā)現(xiàn)這些堿基對(duì)的排列組合與個(gè)體表型和癌癥疾病的相關(guān)關(guān)系。通過分析和研究基因組數(shù)據(jù)有助于人們了解人類基因的工作原理。第二代測(cè)序數(shù)據(jù)具有片段短,復(fù)雜度高等特點(diǎn),這對(duì)基因組數(shù)據(jù)分析工作提出了更高的挑戰(zhàn)。人類基因組的變異形態(tài)多種多樣,變異的長(zhǎng)度從單個(gè)堿基的水平到染色體水平不等,如何準(zhǔn)確檢測(cè)出變異類型以及相應(yīng)的變異區(qū)域是基因組數(shù)據(jù)分析中的重點(diǎn)和難點(diǎn)。目前,針對(duì)不同的變異類型,需要利用基因組數(shù)據(jù)中的不同信息來進(jìn)行檢測(cè),至今已有各種各樣的檢測(cè)算法被研究出來。在人類基因組的各種變異形態(tài)中,拷貝數(shù)變異被相關(guān)研究證實(shí)與癌癥疾病具有密切的相關(guān)性。因此,本文則主要聚焦于拷貝數(shù)變異檢測(cè)的相關(guān)研究中。在現(xiàn)有的針對(duì)單樣本的拷貝數(shù)變異檢測(cè)算法中,如果樣本是高覆蓋度和高腫瘤純度的,這些算法已經(jīng)能夠取得不錯(cuò)的檢測(cè)結(jié)果。然而,在低覆蓋度和低腫瘤純度下,這些算法在檢測(cè)精確率,召回率和_1F分?jǐn)?shù)等度量指標(biāo)上表現(xiàn)較差,檢測(cè)結(jié)果并不理想。本文主要針對(duì)單樣本、低覆蓋度和低腫瘤純度的測(cè)序數(shù)據(jù),設(shè)計(jì)相關(guān)拷貝數(shù)變異檢測(cè)算法,研究如何在這些數(shù)據(jù)上給出較高的檢測(cè)精確率和召回率,同時(shí)保證算法的計(jì)算效率。本文首先提出了一種基于孤立森林的拷貝數(shù)變異檢測(cè)方法CNV_IF,該方法利用樹模型的非線性映射關(guān)系以及集成學(xué)習(xí)算法的優(yōu)點(diǎn),有效地刻畫了每個(gè)滑動(dòng)窗中RD信息的異常性。該算法在訓(xùn)練的過程中,每個(gè)區(qū)域異常值的大小與RD值在樣本中的含量和排序有關(guān),與其絕對(duì)差值無關(guān),有效地解決了拷貝數(shù)變異檢測(cè)中的數(shù)據(jù)不平衡問題。由于CNV_IF在訓(xùn)練過程中未曾考慮相鄰位置的相關(guān)性問題,本文進(jìn)一步提出了一種結(jié)合了孤立森林算法和全變分模型的拷貝數(shù)變異檢測(cè)方法CNV_IFTV,該方法結(jié)合了兩者的優(yōu)點(diǎn),將滑動(dòng)窗相鄰位置的相關(guān)關(guān)系加入到模型中,同時(shí)去除掉了區(qū)間內(nèi)部的噪聲信號(hào),使得異常分?jǐn)?shù)作為RD值異常性的度量指標(biāo)更加可靠。對(duì)于原始的孤立森林算法而言,閾值是提前設(shè)定好的,沒有針對(duì)特定數(shù)據(jù)集進(jìn)行優(yōu)化。對(duì)于拷貝數(shù)變異檢測(cè)問題,本文通過改進(jìn)的最大類間方差模型來自動(dòng)選取異常分?jǐn)?shù)閾值。最后,本文還對(duì)各個(gè)變異區(qū)域的拷貝數(shù)值進(jìn)行了估計(jì)。
【學(xué)位授予單位】:西安電子科技大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2019
【分類號(hào)】:Q811.4;TP309.3
【圖文】:

測(cè)序技術(shù),測(cè)序,單分子,第二代


西安電子科技大學(xué)碩士學(xué)位論文2圖1.1 第二代測(cè)序平臺(tái)隨著測(cè)序技術(shù)的不斷改進(jìn),第三代測(cè)序技術(shù),即單分子測(cè)序技術(shù),也逐漸開始崛起[6]。目前常用的測(cè)序平臺(tái)有:Naropore 的單納米孔測(cè)序平臺(tái),和 Pacific Biosciences的單分子實(shí)時(shí)測(cè)序平臺(tái)。第三代測(cè)序技術(shù)在測(cè)序的過程中不需要采用 PCR 擴(kuò)增技術(shù)即可完成對(duì)整條 DNA 鏈的測(cè)序工作,因此不存在 GC 偏差,這為后續(xù)變異檢測(cè)提供了更加可靠的數(shù)據(jù)來源。第三代測(cè)序技術(shù)具有 reads 長(zhǎng)和能直接檢測(cè)堿基修飾等優(yōu)點(diǎn)。但由于測(cè)序錯(cuò)誤率高以及設(shè)備成本高等缺點(diǎn),目前還未被大規(guī)模使用。常見測(cè)序平臺(tái)性能對(duì)比如表 1.1[13]所示。表1.1三代測(cè)序平臺(tái)比較方法名稱 讀段長(zhǎng)度 精度每次運(yùn)行產(chǎn)生 reads 數(shù)成本/百萬堿基優(yōu)劣Sanger(第一代)400~900bp 99.9% 小時(shí)級(jí) 數(shù)千美元 成本超高Illumina(第二代)50~300bp 99

拷貝數(shù),方法


種基于 RD 信息的拷貝數(shù)變異檢測(cè)算法。下文列出了當(dāng)前最優(yōu)的一批拷貝數(shù)變異檢測(cè)算法和最新的一些研究進(jìn)展。圖1.2 基于不同比對(duì)信息的拷貝數(shù)變異方法最早提出的基于 RD 信息的拷貝數(shù)檢測(cè)方法包括 SegSeq[23],RDXplorer[24]和CNV-seq[25]。SegSeq 使用循環(huán)二進(jìn)制分割算法(CBS)[26]來分割腫瘤-正常樣本對(duì)的RD 值比率,進(jìn)而區(qū)分出正常區(qū)域和變異區(qū)域。為了避免基因組中重復(fù)區(qū)域的多重映射模糊性,SegSeq僅對(duì)樣本中的能比對(duì)到參考序列唯一位置的reads進(jìn)行處理。然而,這種檢測(cè)方法不能檢測(cè)同源區(qū)域中的拷貝數(shù)變異。RDXplorer 分別檢測(cè)多樣本組中每單個(gè)樣本上的拷貝數(shù)缺失和拷貝數(shù)擴(kuò)增,然后,對(duì)多組樣本中的檢測(cè)結(jié)果進(jìn)行比較以推斷最終的拷貝數(shù)變異區(qū)域。CNV-seq 方法的靈感來自于 aCGH 方法,它利用正常樣本和腫瘤樣本之間的 RD 值的比率來建立一個(gè)統(tǒng)計(jì)模型,然后根據(jù)比率的差異推斷出發(fā)生拷貝數(shù)變異的區(qū)域。在接下來的幾年中

拷貝數(shù),檢測(cè)方法,樣本


從輸入樣本的角度來看,目前的拷貝數(shù)變異檢測(cè)方法大致有三種類型:基于單樣本的檢測(cè)方法,基于腫瘤-正常樣本對(duì)的檢測(cè)方法以及基于多樣本的檢測(cè)方法。圖1.3 基于不同樣本的拷貝數(shù)變異檢測(cè)方法對(duì)于常見的拷貝數(shù)變異檢測(cè)方法,某些方法適用于單樣本數(shù)據(jù),某些方法適用于腫瘤-正常樣本對(duì)數(shù)據(jù),而另一些方法則適用于多樣本數(shù)據(jù)。這些方法需要不同的輸入數(shù)據(jù),在實(shí)際應(yīng)用中也有不同的用途。對(duì)于個(gè)人醫(yī)療試驗(yàn)中的基因組分析來講,由于測(cè)序成本壓力較大,通常難以獲得配對(duì)樣本或多個(gè)樣本。在這種情況下,基于單樣品的拷貝數(shù)變異檢測(cè)算法更受大家青睞。目前這種類型的方法包括 CNVnator[28],ReadDepth[45],CLImAT-HET[46],F(xiàn)REEC[47]和 iCopyDAV[48]。理論上

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 王紅娟;侯宏衛(wèi);王安;胡清源;;mtDNA拷貝數(shù)的生物學(xué)意義及其調(diào)控[J];中國(guó)生物化學(xué)與分子生物學(xué)報(bào);2017年06期

2 魏祥勤;;奇妙的6174[J];中學(xué)生數(shù)理化(七年級(jí)數(shù)學(xué))(配合人教社教材);2017年Z2期

3 鄭洞天;;中國(guó)電影如何走向世界現(xiàn)狀和展望[J];電影評(píng)介;1988年06期

4 邱榮國(guó),謝彥博,盧文筠;MT-5細(xì)胞表達(dá)HBsAg的進(jìn)一步研究[J];病毒學(xué)報(bào);1989年01期

5 李玉亮;;基于數(shù)據(jù)庫虛擬化技術(shù)的拷貝數(shù)據(jù)安全與管理[J];保密科學(xué)技術(shù);2018年02期

6 劉譽(yù);馬垎楠;;線粒體DNA拷貝數(shù)與疾病[J];中華老年多器官疾病雜志;2016年06期

7 李霞蓮;苗晉華;;游離線粒體DNA拷貝數(shù)與疾病的研究進(jìn)展[J];實(shí)用醫(yī)技雜志;2016年10期

8 James W.Kijas;晉大鵬;;牛基因組拷貝數(shù)變異分析[J];中國(guó)畜牧獸醫(yī);2011年11期

9 黃世會(huì);冉雪琴;王嘉福;潘華;李蓉蓉;;5個(gè)豬品種3個(gè)拷貝數(shù)變異區(qū)的多態(tài)性分析[J];中國(guó)畜牧獸醫(yī);2016年03期

10 林勇;NGUVE GILEAD NGUVE;;拷貝數(shù)變異檢測(cè)算法優(yōu)化研究[J];軟件;2019年03期

相關(guān)會(huì)議論文 前10條

1 袁田;趙邢力;張麗霞;李慶華;田征;唐克晶;王迎;林冬;李巍;劉兵城;周春林;王敏;王建祥;秘營(yíng)昌;;成人急性淋巴細(xì)胞白血病基因組拷貝數(shù)變異分析[A];第四屆全國(guó)血液腫瘤學(xué)術(shù)大會(huì)暨第七屆全國(guó)淋巴腫瘤診治進(jìn)展研討會(huì)論文匯編[C];2014年

2 王棟;張?jiān)?王明月;夏繼光;程立新;李朋飛;李賓;王晨光;郭政;;基于拷貝數(shù)數(shù)據(jù)揭示基因在癌基因組中廣泛擴(kuò)增[A];中國(guó)的遺傳學(xué)研究——遺傳學(xué)進(jìn)步推動(dòng)中國(guó)西部經(jīng)濟(jì)與社會(huì)發(fā)展——2011年中國(guó)遺傳學(xué)會(huì)大會(huì)論文摘要匯編[C];2011年

3 徐強(qiáng);張學(xué)軍;楊森;;拷貝數(shù)變異(CNVs)的研究進(jìn)展[A];中華醫(yī)學(xué)會(huì)第14次全國(guó)皮膚性病學(xué)術(shù)年會(huì)論文匯編[C];2008年

4 高晶;何璽玉;楊堯;吳虹林;;不明原因智力發(fā)育遲滯的拷貝數(shù)變異研究[A];中華醫(yī)學(xué)會(huì)第十五次全國(guó)醫(yī)學(xué)遺傳學(xué)學(xué)術(shù)會(huì)議暨中國(guó)醫(yī)師協(xié)會(huì)醫(yī)學(xué)遺傳醫(yī)師分會(huì)第一屆全國(guó)學(xué)術(shù)會(huì)議暨2016年浙江省醫(yī)學(xué)遺傳學(xué)年會(huì)論文匯編[C];2016年

5 張耀;李俊平;王瑞元;;AMY1基因拷貝數(shù)變異在青少年BMI中的研究進(jìn)展[A];2018年中國(guó)生理學(xué)會(huì)運(yùn)動(dòng)生理學(xué)專業(yè)委員會(huì)會(huì)議暨“科技創(chuàng)新與運(yùn)動(dòng)生理學(xué)”學(xué)術(shù)研討會(huì)論文集[C];2018年

6 季濤云;吳曄;王靜敏;肖靜;冷雪榮;李潔;趙海娟;楊艷玲;秦炯;吳希如;姜玉武;;不明原因腦發(fā)育遲緩/智力障礙患兒染色體亞端粒區(qū)拷貝數(shù)異常的研究[A];遺傳學(xué)與社會(huì)可持續(xù)發(fā)展——2010中國(guó)青年遺傳學(xué)家論壇論文摘要匯編[C];2010年

7 劉長(zhǎng)陽;;線粒體DNA拷貝數(shù)與口腔惡性腫瘤患者預(yù)后相關(guān)[A];2017全國(guó)口腔頜面——頭頸腫瘤外科學(xué)術(shù)研討會(huì)論文集[C];2017年

8 張彥春;馬yN楠;卜定方;劉輝;夏昌宇;朱賽楠;張英;鄭雪飛;裴佩;王松濤;許玉鳳;潘虹;戚豫;;線粒體DNA 4977bp的缺失及其拷貝數(shù)與線粒體病的臨床表現(xiàn)的關(guān)系[A];第九屆全國(guó)遺傳病診斷與產(chǎn)前診斷學(xué)術(shù)交流會(huì)暨產(chǎn)前診斷和醫(yī)學(xué)遺傳學(xué)新技術(shù)研討會(huì)論文集[C];2014年

9 許沈華;牟瀚舟;葛海鵬;顧琳慧;朱赤紅;劉祥麟;;高轉(zhuǎn)移卵巢癌表達(dá)譜差異基因與染色體拷貝數(shù)變異相關(guān)性研究[A];中國(guó)細(xì)胞生物學(xué)學(xué)會(huì)第九次會(huì)員代表大會(huì)暨青年學(xué)術(shù)大會(huì)論文摘要集[C];2007年

10 劉洋;張博;陳璨;盧杰;司紅起;馬傳喜;;小麥低分子量麥谷蛋白拷貝數(shù)變異分析[A];第十屆全國(guó)小麥基因組學(xué)及分子育種大會(huì)摘要集[C];2019年

相關(guān)重要報(bào)紙文章 前3條

1 記者 胡德榮;首張中國(guó)人群拷貝數(shù)變異圖譜制成[N];健康報(bào);2012年

2 記者 瞿劍;DNA序列拷貝數(shù)變化決定黃瓜性別[N];科技日?qǐng)?bào);2015年

3 本報(bào)見習(xí)記者 辛雨 記者 李晨陽;“兩件事”讓獼猴桃變成“維C大王”[N];中國(guó)科學(xué)報(bào);2018年

相關(guān)博士學(xué)位論文 前10條

1 黃濤;雞蛋用性狀相關(guān)拷貝數(shù)變異位點(diǎn)篩選及作用機(jī)理研究[D];華中農(nóng)業(yè)大學(xué);2019年

2 譚仁杰;基于基因組測(cè)序數(shù)據(jù)的拷貝數(shù)變異檢測(cè)方法研究[D];哈爾濱工業(yè)大學(xué);2017年

3 周志立;魯棒且可區(qū)分的拷貝檢測(cè)技術(shù)研究[D];湖南大學(xué);2014年

4 玉崧成;維生素D代謝通路基因多態(tài)性、拷貝數(shù)及甲基化變異與2型糖尿病的關(guān)系[D];鄭州大學(xué);2018年

5 許敏;微囊藻偽空胞基因叢的研究[D];中國(guó)科學(xué)院研究生院(水生生物研究所);2006年

6 李鑫磊;肺癌全基因組拷貝數(shù)變異分析[D];上海交通大學(xué);2012年

7 徐殊;RAAS、Apelin/APJ及MtDNA拷貝數(shù)與冠狀動(dòng)脈旁路移植術(shù)后新發(fā)房顫的相關(guān)性研究[D];第四軍醫(yī)大學(xué);2017年

8 袁田;成人急性淋巴細(xì)胞白血病基因組拷貝數(shù)變異分析[D];北京協(xié)和醫(yī)學(xué)院;2013年

9 張岱;胃癌基因組DNA拷貝數(shù)改變和miRNA表達(dá)譜研究[D];北京協(xié)和醫(yī)學(xué)院;2008年

10 易國(guó)強(qiáng);利用二代測(cè)序挖掘雞拷貝數(shù)變異及影響飼料效率的候選基因[D];中國(guó)農(nóng)業(yè)大學(xué);2015年

相關(guān)碩士學(xué)位論文 前10條

1 于家傲;基于孤立森林和全變分的拷貝數(shù)變異檢測(cè)方法[D];西安電子科技大學(xué);2019年

2 賈君麟;核糖體DNA拷貝數(shù)變異與六價(jià)鉻暴露的關(guān)系研究[D];浙江省醫(yī)學(xué)科學(xué)院;2019年

3 張驍;牦牛全基因組拷貝數(shù)變異圖譜[D];蘭州大學(xué);2017年

4 孫銘;基于CNA的拷貝數(shù)顯著性檢測(cè)算法的研究與實(shí)現(xiàn)[D];武漢理工大學(xué);2018年

5 王州;基于重測(cè)序研究貴州地方豬種基因組拷貝數(shù)變異[D];貴州大學(xué);2019年

6 陶亦然;基于機(jī)器學(xué)習(xí)的染色體拷貝數(shù)變異致病性預(yù)測(cè)工具[D];華東師范大學(xué);2019年

7 劉文強(qiáng);整合方法顯著性地提高拷貝數(shù)變異鑒定的精確性[D];華東師范大學(xué);2018年

8 鄭紅;16例先天性肺囊性疾病患兒全基因組拷貝數(shù)變異分析[D];重慶醫(yī)科大學(xué);2017年

9 劉魏魏;基于二代測(cè)序數(shù)據(jù)的拷貝數(shù)變異集成檢測(cè)[D];北京化工大學(xué);2018年

10 劉珍;基于PCF的拷貝數(shù)預(yù)處理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];武漢理工大學(xué);2017年



本文編號(hào):2803017

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/projectlw/swxlw/2803017.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶da029***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
成人午夜激情免费在线| 亚洲中文在线观看小视频| 黑人粗大一区二区三区| 日韩一级毛一欧美一级乱| 中文字幕乱码一区二区三区四区| 国产成人高清精品尤物| 亚洲伦片免费偷拍一区| 久久亚洲午夜精品毛片| 国产爆操白丝美女在线观看| 出差被公高潮久久中文字幕| 国产日韩欧美在线亚洲| 欧美激情一区=区三区| 在线观看视频成人午夜| 欧美二区视频在线观看| 中文字幕精品少妇人妻| 欧美日韩国产精品自在自线| 青青操精品视频在线观看| 高清一区二区三区四区五区| 国产精品视频久久一区| 国产一区二区精品丝袜| 日本在线视频播放91| 黄色av尤物白丝在线播放网址| 日韩精品一区二区三区四区| 老司机精品视频免费入口| 久久精品亚洲欧美日韩| 欧美精品中文字幕亚洲| 黄片在线免费观看全集 | 日韩欧美在线看一卡一卡| 欧美日韩精品视频在线| 国产女性精品一区二区三区| 微拍一区二区三区福利| 韩日黄片在线免费观看| 久久亚洲成熟女人毛片| 日韩精品日韩激情日韩综合| av中文字幕一区二区三区在线 | 亚洲一区精品二人人爽久久| 福利新区一区二区人口| 亚洲乱妇熟女爽的高潮片| 国产美女网红精品演绎| 永久福利盒子日韩日韩| 熟妇久久人妻中文字幕|