基于三代轉(zhuǎn)錄組測(cè)序的植物全長(zhǎng)轉(zhuǎn)錄本數(shù)據(jù)庫(kù)構(gòu)建及水稻雜種數(shù)據(jù)分型
發(fā)布時(shí)間:2021-10-30 11:55
三代轉(zhuǎn)錄組測(cè)序Iso-Seq(Isoform Sequencing)是近些年來新興的轉(zhuǎn)錄組測(cè)序方式,其相對(duì)于二代測(cè)序技術(shù)最大優(yōu)勢(shì)是讀段長(zhǎng),可以在不組裝的前提下表征整個(gè)轉(zhuǎn)錄組。本研究基于三代轉(zhuǎn)錄組測(cè)序Iso-Seq完成了兩項(xiàng)工作,一項(xiàng)是構(gòu)建一個(gè)植物全長(zhǎng)轉(zhuǎn)錄本數(shù)據(jù)庫(kù),另一項(xiàng)是結(jié)合其他組學(xué)測(cè)序數(shù)據(jù)對(duì)水稻雜種測(cè)序數(shù)據(jù)進(jìn)行分型。主要研究?jī)?nèi)容如下:1.構(gòu)建植物全長(zhǎng)轉(zhuǎn)錄本數(shù)據(jù)庫(kù)PISO(Plant ISOform sequencing database)本課題共收集了19種植物的Iso-Seq數(shù)據(jù),以建立植物全長(zhǎng)轉(zhuǎn)錄本數(shù)據(jù)庫(kù)?紤]到參考基因組和倍性的存在,對(duì)19個(gè)物種使用了三套流程完成了轉(zhuǎn)錄本識(shí)別,新基因發(fā)現(xiàn)、可變剪切(Alternative Splicing,AS)事件識(shí)別和選擇性多聚腺苷化(Alternative Polyadenylation,APA)事件識(shí)別;谔幚砗蟮倪@些數(shù)據(jù),構(gòu)建了植物全長(zhǎng)轉(zhuǎn)錄本數(shù)據(jù)庫(kù)PISO。PISO一共獲得了1,391,165個(gè)轉(zhuǎn)錄本,50,803個(gè)新基因位點(diǎn),878,057個(gè)AS事件和81,416個(gè)APA事件。在此基礎(chǔ)上構(gòu)建了轉(zhuǎn)錄本瀏覽器和可變剪切搜索,可用于對(duì)處...
【文章來源】:華中農(nóng)業(yè)大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:69 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
三種主要的RNA測(cè)序技術(shù)原理(Starketal2019)
基于三代轉(zhuǎn)錄組測(cè)序的植物全長(zhǎng)轉(zhuǎn)錄本數(shù)據(jù)庫(kù)構(gòu)建及水稻雜種數(shù)據(jù)分型133結(jié)果與分析3.1數(shù)據(jù)結(jié)果統(tǒng)計(jì)PISO為用戶提供大量高質(zhì)量的AS事件、APA事件、新基因和全長(zhǎng)轉(zhuǎn)錄本信息,從19種植物中一共獲得了1,391,165個(gè)轉(zhuǎn)錄本,50,803個(gè)新基因位點(diǎn),878,057個(gè)AS和81,416個(gè)APA事件。不同類型的可變剪切比例展示在圖2.1和2.2中,其中13個(gè)有參考基因組物種記錄在圖2.1中,6個(gè)無(wú)參考基因組物種記錄在圖2.2中。13個(gè)有參考基因組物種中的11個(gè)物種可變剪切比例最高的類型為內(nèi)含子保留,6個(gè)無(wú)參考基因組的物種中全部表現(xiàn)為內(nèi)含子保留的比例最高。這些數(shù)據(jù)極大豐富了當(dāng)前的注釋信息,在這里以Amborellatrichopoda為例。Ensembl植物數(shù)據(jù)庫(kù)中Amborellatrichopoda最新的基因組包含27,313個(gè)基因座和27,313個(gè)轉(zhuǎn)錄本,然而在本研究中一共檢測(cè)到的9,060個(gè)表達(dá)基因位點(diǎn)中,獲得了34,733個(gè)轉(zhuǎn)錄本,15,039個(gè)AS事件和3,315個(gè)APA事件,以及729個(gè)新基因。為了記錄這些轉(zhuǎn)錄本的質(zhì)量,研究通過SQANTI(Tardaguilaetal2018),基于參考注釋的剪切情況對(duì)13個(gè)有參考基因組物種的分類,其中FSM和ISM的平均百分比約為24.1%,而NNC的平均百分比為58.7%(表2.5)。圖2.113個(gè)有參考基因組物種可變剪切的統(tǒng)計(jì)Fig.2.1StatisticsofASeventsin13specieswithreferencegenome
華中農(nóng)業(yè)大學(xué)2020屆碩士研究生學(xué)位(畢業(yè))論文14圖2.26個(gè)無(wú)參考基因組物種可變剪切的統(tǒng)計(jì)Fig.2.2StatisticsofASeventsin6specieswithoutreferencegenome表2.419個(gè)物種數(shù)據(jù)總結(jié)Table2.4Summaryof19plantspecies物種SpeciesIso-Seq轉(zhuǎn)錄本TranscriptsofIso-Seq新基因NovelGenesAS事件ASEventsAPA事件APAevents家基因組序列SequencesofFakeGenomeAmborellatrichopoda34,73376915,0393,315Arabidopsisthaliana16,1379316,6841,852Betavulgarissubsp.vulgaris16,6651023,937650Chenopodiumquinoa557,9053,529138,26014,123Coffeaarabica35,15290436,8071,463Fragariavesca34,10751625,9665,122Gossypiumbarbadense63,88417,85868,6096,949Heveabrasiliensis29,88229737,4792,786Panaxginseng65,7797,50158,0653,782Phyllostachysedulis29,7843,89830,4312,799Sorghumbicolor35,78574528,3536,432Triticumaestivum227,52711,586186,01121,493Zeamays78,1443,005212,75910,650Alliumsativum21,7661,11617,331Astragalusmembranaceus56,93714,87724,523Dipteryxoleifera44,2122,82827,790Nepenthesampullaria15,80025613,317Nepenthesrafflesiana20,53728418,614Salviamiltiorrhiza6,4292964,875Total1,391,16550,803878,05781,416
【參考文獻(xiàn)】:
碩士論文
[1]植物選擇性多聚腺苷化分析與可視化平臺(tái)搭建[D]. 張毓民.廈門大學(xué) 2017
本文編號(hào):3466687
【文章來源】:華中農(nóng)業(yè)大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:69 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
三種主要的RNA測(cè)序技術(shù)原理(Starketal2019)
基于三代轉(zhuǎn)錄組測(cè)序的植物全長(zhǎng)轉(zhuǎn)錄本數(shù)據(jù)庫(kù)構(gòu)建及水稻雜種數(shù)據(jù)分型133結(jié)果與分析3.1數(shù)據(jù)結(jié)果統(tǒng)計(jì)PISO為用戶提供大量高質(zhì)量的AS事件、APA事件、新基因和全長(zhǎng)轉(zhuǎn)錄本信息,從19種植物中一共獲得了1,391,165個(gè)轉(zhuǎn)錄本,50,803個(gè)新基因位點(diǎn),878,057個(gè)AS和81,416個(gè)APA事件。不同類型的可變剪切比例展示在圖2.1和2.2中,其中13個(gè)有參考基因組物種記錄在圖2.1中,6個(gè)無(wú)參考基因組物種記錄在圖2.2中。13個(gè)有參考基因組物種中的11個(gè)物種可變剪切比例最高的類型為內(nèi)含子保留,6個(gè)無(wú)參考基因組的物種中全部表現(xiàn)為內(nèi)含子保留的比例最高。這些數(shù)據(jù)極大豐富了當(dāng)前的注釋信息,在這里以Amborellatrichopoda為例。Ensembl植物數(shù)據(jù)庫(kù)中Amborellatrichopoda最新的基因組包含27,313個(gè)基因座和27,313個(gè)轉(zhuǎn)錄本,然而在本研究中一共檢測(cè)到的9,060個(gè)表達(dá)基因位點(diǎn)中,獲得了34,733個(gè)轉(zhuǎn)錄本,15,039個(gè)AS事件和3,315個(gè)APA事件,以及729個(gè)新基因。為了記錄這些轉(zhuǎn)錄本的質(zhì)量,研究通過SQANTI(Tardaguilaetal2018),基于參考注釋的剪切情況對(duì)13個(gè)有參考基因組物種的分類,其中FSM和ISM的平均百分比約為24.1%,而NNC的平均百分比為58.7%(表2.5)。圖2.113個(gè)有參考基因組物種可變剪切的統(tǒng)計(jì)Fig.2.1StatisticsofASeventsin13specieswithreferencegenome
華中農(nóng)業(yè)大學(xué)2020屆碩士研究生學(xué)位(畢業(yè))論文14圖2.26個(gè)無(wú)參考基因組物種可變剪切的統(tǒng)計(jì)Fig.2.2StatisticsofASeventsin6specieswithoutreferencegenome表2.419個(gè)物種數(shù)據(jù)總結(jié)Table2.4Summaryof19plantspecies物種SpeciesIso-Seq轉(zhuǎn)錄本TranscriptsofIso-Seq新基因NovelGenesAS事件ASEventsAPA事件APAevents家基因組序列SequencesofFakeGenomeAmborellatrichopoda34,73376915,0393,315Arabidopsisthaliana16,1379316,6841,852Betavulgarissubsp.vulgaris16,6651023,937650Chenopodiumquinoa557,9053,529138,26014,123Coffeaarabica35,15290436,8071,463Fragariavesca34,10751625,9665,122Gossypiumbarbadense63,88417,85868,6096,949Heveabrasiliensis29,88229737,4792,786Panaxginseng65,7797,50158,0653,782Phyllostachysedulis29,7843,89830,4312,799Sorghumbicolor35,78574528,3536,432Triticumaestivum227,52711,586186,01121,493Zeamays78,1443,005212,75910,650Alliumsativum21,7661,11617,331Astragalusmembranaceus56,93714,87724,523Dipteryxoleifera44,2122,82827,790Nepenthesampullaria15,80025613,317Nepenthesrafflesiana20,53728418,614Salviamiltiorrhiza6,4292964,875Total1,391,16550,803878,05781,416
【參考文獻(xiàn)】:
碩士論文
[1]植物選擇性多聚腺苷化分析與可視化平臺(tái)搭建[D]. 張毓民.廈門大學(xué) 2017
本文編號(hào):3466687
本文鏈接:http://sikaile.net/projectlw/swxlw/3466687.html
最近更新
教材專著