天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于系統(tǒng)發(fā)育基因組學(xué)分析解決困難進(jìn)化問題的策略研究

發(fā)布時間:2019-09-19 16:32
【摘要】:隨著高通量測序技術(shù)的快速發(fā)展,分子系統(tǒng)發(fā)育學(xué)進(jìn)入了以海量數(shù)據(jù)為特征的系統(tǒng)發(fā)育基因組學(xué)時代(phylogenomics)。組學(xué)大數(shù)據(jù)給分子系統(tǒng)發(fā)育學(xué)帶來了前所未有的機(jī)遇,許多傳統(tǒng)系統(tǒng)發(fā)育學(xué)難以解析的生物類群進(jìn)化關(guān)系通過增加數(shù)據(jù)有了明確的結(jié)果。然而隨著研究的深入,學(xué)者們發(fā)現(xiàn)在海量數(shù)據(jù)中,“信號”與“噪音”是并存的。當(dāng)我們探究少數(shù)十分棘手的系統(tǒng)發(fā)育關(guān)系時(例如經(jīng)歷快速輻射性進(jìn)化類群的親緣關(guān)系),使用現(xiàn)有的分析方法可能出現(xiàn)稀少的真實(shí)“信號”(phylogenetic signal)被系統(tǒng)誤差引起的“噪音”(phylogenetic noise)完全掩蓋的情況,致使我們得出一個解析度高但不能反映真實(shí)進(jìn)化歷史的系統(tǒng)發(fā)育關(guān)系。本論文的工作在于試圖突破現(xiàn)有的數(shù)據(jù)分析瓶頸,從提出新的數(shù)據(jù)分析思路及選擇新的數(shù)據(jù)類型入手,運(yùn)用海量數(shù)據(jù)解決極具爭議的有頜類脊椎動物系統(tǒng)發(fā)育框架及勞亞獸總目各目間親緣關(guān)系問題。Ⅰ.有頜類脊椎動物系統(tǒng)發(fā)育基因組學(xué)研究如何從海量數(shù)據(jù)中篩選出真實(shí)的“信號”,降低數(shù)據(jù)中存在的“噪音”,以得到一個穩(wěn)定且真實(shí)的系統(tǒng)發(fā)育關(guān)系是系統(tǒng)發(fā)育基因組學(xué)研究的重要課題。目前常見的提升數(shù)據(jù)質(zhì)量的方法包括選擇更完整的數(shù)據(jù)集、選擇進(jìn)化歷程與現(xiàn)有模型更匹配的慢速進(jìn)化的基因等等。但缺乏實(shí)例對這些數(shù)據(jù)篩選方法進(jìn)行橫向評估比較。有頜類脊椎動物系統(tǒng)發(fā)育框架上許多節(jié)點(diǎn)即使進(jìn)入大數(shù)據(jù)時代仍頗具爭議,使得其成為檢驗(yàn)現(xiàn)有數(shù)據(jù)篩選方案的絕佳例子。本研究基于新測的10個有頜類脊椎動物物種的轉(zhuǎn)錄組數(shù)據(jù)結(jié)合公共數(shù)據(jù)庫中的基因組及轉(zhuǎn)錄組數(shù)據(jù),構(gòu)建了一個包含58個物種,4682個蛋白質(zhì)編碼基因的氨基酸數(shù)據(jù)集,用于探索有頜類脊椎動物系統(tǒng)發(fā)育框架問題。另外,我們選取了有頜類脊椎動物系統(tǒng)發(fā)育樹上六個具有爭議的節(jié)點(diǎn)作為測試對象,對已有的數(shù)據(jù)篩選方案進(jìn)行分析及評估。結(jié)果顯示,每個測試問題均存在大量的沖突信號,而現(xiàn)有的數(shù)據(jù)篩選方案在解決具有多個困難問題的系統(tǒng)發(fā)育關(guān)系時,提升數(shù)據(jù)信噪比的效果不佳,篩選數(shù)據(jù)建樹結(jié)果不穩(wěn)定且高度不一致,重建的系統(tǒng)發(fā)育關(guān)系會隨著數(shù)據(jù)集大小及建樹方法的不同而發(fā)生改變。基于此現(xiàn)象,我們提出了問題針對型(question-specific)數(shù)據(jù)篩選策略,即針對每個困難問題生成特定的篩選數(shù)據(jù)集。該策略包括兩種不同的方法,方法一為明確表態(tài)法,即將不能明確支持有關(guān)困難問題所有假說中任意一種的基因從數(shù)據(jù)集中刪除。方法二為節(jié)點(diǎn)原則法,是指所選的基因必須能夠支持與研究問題具有相關(guān)性的特定的拓?fù)浣Y(jié)構(gòu)。經(jīng)檢驗(yàn),問題針對型數(shù)據(jù)篩選策略在六個測試對象中均有效地提高了數(shù)據(jù)信噪比,所得結(jié)果具有魯棒性。利用目前最大的有頜類脊椎動物數(shù)據(jù)集,我們提供了一個可靠的有頜類脊椎動物系統(tǒng)框架。除此之外,我們的結(jié)果再次證明了簡單的增加數(shù)據(jù)在解決某些難點(diǎn)問題時是遠(yuǎn)遠(yuǎn)不夠的。我們提出的問題針對型數(shù)據(jù)篩選策略也為今后解決生命之樹上的困難節(jié)點(diǎn)提供了新思路。Ⅱ.勞亞獸總目系統(tǒng)發(fā)育基因組學(xué)研究厘清經(jīng)歷輻射性進(jìn)化(rapid radiation)類群的親緣關(guān)系一直是困擾進(jìn)化生物學(xué)家的難題。各物種在極短的時間完成物種分化及形成意味著僅有很少的能夠反應(yīng)真實(shí)進(jìn)化歷史的“信號”得以在序列中積累。出于數(shù)據(jù)的易得性及易操作性,現(xiàn)有大部分研究都以進(jìn)化速度較慢的蛋白質(zhì)編碼序列作為數(shù)據(jù)源進(jìn)行系統(tǒng)發(fā)育學(xué)分析,而鮮少使用進(jìn)化速度更快的非編碼區(qū)序列推斷快速輻射類群的親緣關(guān)系。勞亞獸是經(jīng)歷快速輻射性進(jìn)化的代表類群,其各目間親緣關(guān)系一直存在很大爭議,且前人研究大多基于蛋白質(zhì)編碼序列。為了解決這一歷史難題,我們利用公共數(shù)據(jù)庫中基因組數(shù)據(jù)構(gòu)建了兩個數(shù)據(jù)集,物種取樣涵蓋了除鱗甲目之外的其他5個目代表物種,形成由3638個基因構(gòu)成的全長為19,055,073 bp的內(nèi)含子數(shù)據(jù)集及由10259個基因構(gòu)成的全長為20,994,285 bp的蛋白質(zhì)編碼序列數(shù)據(jù)集,并分別采用超級矩陣方法及基于溯祖理論的物種樹方法對勞亞獸各目間發(fā)育關(guān)系進(jìn)行推斷。數(shù)據(jù)分析結(jié)果表明,內(nèi)含子數(shù)據(jù)相比于蛋白質(zhì)編碼數(shù)據(jù)在解決勞亞獸問題中有更強(qiáng)且勻質(zhì)的系統(tǒng)發(fā)育信號。對建樹結(jié)果比較發(fā)現(xiàn),內(nèi)含子數(shù)據(jù)使用兩種方法建樹所得拓?fù)浣Y(jié)構(gòu)一致,且所有節(jié)點(diǎn)以支持率100%解析,而蛋白質(zhì)編碼序列得到的拓?fù)浣Y(jié)構(gòu)不一致,且得到的系統(tǒng)發(fā)育關(guān)系解析度低。為了檢驗(yàn)內(nèi)含子的高解析度系統(tǒng)發(fā)育樹不是由于系統(tǒng)誤差造成的錯誤結(jié)果,我們通過不同數(shù)據(jù)篩選條件對內(nèi)含子數(shù)據(jù)進(jìn)行重采樣并建樹,并對蛋白質(zhì)編碼序列數(shù)據(jù)集做同樣處理。同時本研究還探究了不同外類群的組合方式對內(nèi)含子建樹及蛋白質(zhì)編碼序列建樹的影響。研究結(jié)果表明,數(shù)據(jù)重采樣及外類群的選擇對內(nèi)含子數(shù)據(jù)構(gòu)建的系統(tǒng)發(fā)育樹影響極小,而蛋白質(zhì)編碼序列構(gòu)建的系統(tǒng)發(fā)育樹會隨著數(shù)據(jù)篩選條件的不同及外類群的不同組合產(chǎn)生巨大變化。除此之外,通過統(tǒng)計數(shù)據(jù)中單基因樹拓?fù)浣Y(jié)構(gòu)我們發(fā)現(xiàn),無論是內(nèi)含子數(shù)據(jù)集還是蛋白質(zhì)編碼序列數(shù)據(jù)集,出現(xiàn)頻率最高的單基因樹的拓?fù)浣Y(jié)構(gòu)與內(nèi)含子完整數(shù)據(jù)集建樹結(jié)果相同,說明從單基因樹頻率來看,蛋白質(zhì)編碼序列數(shù)據(jù)中“信號”與內(nèi)含子數(shù)據(jù)內(nèi)部是一致的。利用目前最大的非編碼的內(nèi)含子序列數(shù)據(jù)集重建勞亞獸各目間親緣關(guān)系,我們得到了一個穩(wěn)定且完全解析的系統(tǒng)發(fā)育關(guān)系,所得結(jié)果支持真盲缺目位于勞亞獸的基出位置,剩下四個目分為兩支,奇蹄目與翼手目關(guān)系更近,鯨偶蹄目與食肉目為姐妹類群。這一全新的系統(tǒng)發(fā)育關(guān)系假說,向揭示勞亞獸的生命之樹又邁進(jìn)了一步。同時,我們的分析說明了包含有更多“信號”的內(nèi)含子數(shù)據(jù)將是未來解決生命之樹上其他經(jīng)歷快速輻射性進(jìn)化的困難節(jié)點(diǎn)的重要數(shù)據(jù)類型。
【圖文】:

所有物,形式,發(fā)育基因,發(fā)育學(xué)


第一章緒論發(fā)育基因組學(xué)概述發(fā)育學(xué)概念上的生物多種多樣,但無論是原核生物、真核生物、植物、祖先演化而來。這一部共同進(jìn)化的歷史決定了不同類群之關(guān)聯(lián),而這種關(guān)聯(lián)可以用進(jìn)化樹的形式進(jìn)行描繪。系統(tǒng)發(fā)tics)正是追溯物種進(jìn)化歷史,并嘗試用生命之樹形式描述各門學(xué)科(Tree of Life, 圖 1-1)。

兩棲類,魚化石,物種,魚類


解析物種間系統(tǒng)發(fā)育關(guān)系的難點(diǎn)所在。盡管如此,試圖揭開歷史的面紗,對生命進(jìn)化的奧妙一探究竟生物進(jìn)化史最直接的證據(jù)最早被用于系統(tǒng)發(fā)育關(guān)系統(tǒng)發(fā)育關(guān)系推斷具有局限性,因?yàn)?1)化石的數(shù)據(jù)耗費(fèi)大量時間搜尋與收集;2)目前找到的化石記錄牛一毛,大部分物種的化石記錄稀缺;3)找到的部物種,很難將其歸類到某個門類下;4)化石記錄通石記錄間難以找到可供比較的共同特征;谝陨现苯佑糜谙到y(tǒng)發(fā)育框架的推斷,,而是作為已滅絕物物進(jìn)化歷史的認(rèn)識,如處于從魚到兩棲類過渡狀態(tài)實(shí)了從魚類到兩棲類的進(jìn)化(圖 1-2)。
【學(xué)位授予單位】:中山大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2017
【分類號】:Q349

【參考文獻(xiàn)】

相關(guān)期刊論文 前3條

1 王章群;解增言;蔡應(yīng)繁;舒坤賢;黃飛飛;;系統(tǒng)發(fā)育基因組學(xué)研究進(jìn)展[J];遺傳;2014年07期

2 鄒新慧;葛頌;;基因樹沖突與系統(tǒng)發(fā)育基因組學(xué)研究[J];植物分類學(xué)報;2008年06期

3 于黎;張亞平;;系統(tǒng)發(fā)育基因組學(xué)——重建生命之樹的一條迷人途徑[J];遺傳;2006年11期



本文編號:2538244

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/jckxbs/2538244.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶5f3d7***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com