植物G-四鏈體大數(shù)據(jù)比較分析及數(shù)據(jù)庫構(gòu)建
發(fā)布時間:2020-12-16 00:11
G-四鏈體(G-quadruplex,G-Q)是富含G的序列折疊形成的高級DNA或者RNA二級結(jié)構(gòu),其結(jié)構(gòu)單元為G-四分體(G-quartet)。G-四分體是由氫鍵結(jié)合鳥嘌呤堿基形成的環(huán)形平面。G-Q廣泛地存在于植物基因組中,且參與了轉(zhuǎn)錄、翻譯、端粒維持等重要的生理進程。盡管目前有大量預測和研究G-Q的工具及數(shù)據(jù)庫,但是針對植物的研究卻十分匱乏。隨著下一代測序技術(shù)的成熟以及測序成本的不斷降低,大量的植物基因組被組裝和注釋。為了更好地促進植物中G-Q大數(shù)據(jù)的挖掘及分析,本研究采用公共數(shù)據(jù)平臺中獲得的植物基因組及注釋信息,采用生物信息學統(tǒng)計及分析方法,以及利用結(jié)構(gòu)配對的方法對植物基因組中的G-Q進行挖掘和注釋。利用挖掘到的所有G-Q信息,構(gòu)建了一個全面的綜合的界面友好的開放型數(shù)據(jù)庫。本研究主要成果如下:(1)植物基因組信息資源庫的構(gòu)建。通過對植物基因組文章的閱讀與信息采集,獲取了195個植物的基因組及注釋文件。物種的拉丁名、英文名、發(fā)表時間、版本號、參考文獻名稱及獲取地址、基因組獲取地址、基因組大小等詳細信息被提取出來,利用這些信息構(gòu)建了一個植物基因組信息資源庫。(2)G-Q大數(shù)據(jù)的挖掘及...
【文章來源】:山東農(nóng)業(yè)大學山東省
【文章頁數(shù)】:56 頁
【學位級別】:碩士
【部分圖文】:
Plant-GQ數(shù)據(jù)庫的示意圖
圖 2 不同科中 G-Q結(jié)構(gòu)分布圖Fig. 2 G-Q structure distribution in different families3.4 同一科內(nèi)不同類型 G-Q 結(jié)構(gòu)的分布及比對為了觀察 G-Q 結(jié)構(gòu)在同一科中的存在頻率及分布情況,分別對禾本科、十字花科以及茄科中的 G-Q 結(jié)構(gòu)進行了統(tǒng)計及分析。對禾本科的 6 個物種的不同類型的 G-Q 結(jié)構(gòu)在基因組上的分布頻率及基因組等信息進行統(tǒng)計(表 3),結(jié)果表明,每 Kb基因組中兩單元 G-Q 出現(xiàn)的頻率最高,頻率范圍為 2 到 6 之間,其中二穗短柄草出現(xiàn)頻率最高,茭白出現(xiàn)的頻率最低,每 Kb 基因組中兩單元 G-Q 所占的頻率基本上在3 到 4 左右。每 Kb 基因組中三單元 G-Q 出現(xiàn)的頻率占居第二,頻率范圍為 0.04 到0.2 之間,其中二穗短柄草出現(xiàn)頻率最高,而茭白出現(xiàn)頻率最低,整體的頻率在 0.1上下浮動。每 Kb 基因組中三單元 G-Q 出現(xiàn)的頻率最少,頻率范圍為 0.009 到 0.02 之間,其中短花藥野生稻出現(xiàn)頻率最高,茭白出現(xiàn)頻率最低,整體頻率在 0.01 上下浮動。綜上所述,在禾本科植物中,仍具有兩單元 G-Q 結(jié)構(gòu)在基因組出現(xiàn)的頻率最
結(jié)構(gòu)在基因上的數(shù)目與基因間的數(shù)目相差不大(圖 3)。玉米中兩種位置的 G-Q 結(jié)構(gòu)的數(shù)量相差較大。綜上所述,在豆科中,在基因上的 G-Q 結(jié)構(gòu)的數(shù)量要小于基因間的 G-Q結(jié)構(gòu)的數(shù)量,大部分物種中,兩種位置的 G-Q的數(shù)量相差不大。表 3 禾本科中 G-Q結(jié)構(gòu)單元密度統(tǒng)計Table 3 Density statistics of G-Q structural units in Grass family物種Species二聚體數(shù)量/KbNumber of TwoG-tracts/Kb三聚體數(shù)量/KbNumber of ThreeG-tracts/Kb四聚體數(shù)量/KbNumber of FourG-tracts/Kb基因組大小Genomic size(Mb)科familyOryza longistaminata3.268424 0.089231 0.009441 347禾本科Oryza brachyantha3.481874 0.107909 0.01936 253禾本科Brachypodium distachyon5.532685 0.163973 0.016265 260禾本科Oryza glaberrima4.3775 0.133718 0.014038 316禾本科Zea mays5.075372 0.143022 0.013982 2,300禾本科Zizania latifolia2.078647 0.045551 0.001654 590禾本科
本文編號:2919149
【文章來源】:山東農(nóng)業(yè)大學山東省
【文章頁數(shù)】:56 頁
【學位級別】:碩士
【部分圖文】:
Plant-GQ數(shù)據(jù)庫的示意圖
圖 2 不同科中 G-Q結(jié)構(gòu)分布圖Fig. 2 G-Q structure distribution in different families3.4 同一科內(nèi)不同類型 G-Q 結(jié)構(gòu)的分布及比對為了觀察 G-Q 結(jié)構(gòu)在同一科中的存在頻率及分布情況,分別對禾本科、十字花科以及茄科中的 G-Q 結(jié)構(gòu)進行了統(tǒng)計及分析。對禾本科的 6 個物種的不同類型的 G-Q 結(jié)構(gòu)在基因組上的分布頻率及基因組等信息進行統(tǒng)計(表 3),結(jié)果表明,每 Kb基因組中兩單元 G-Q 出現(xiàn)的頻率最高,頻率范圍為 2 到 6 之間,其中二穗短柄草出現(xiàn)頻率最高,茭白出現(xiàn)的頻率最低,每 Kb 基因組中兩單元 G-Q 所占的頻率基本上在3 到 4 左右。每 Kb 基因組中三單元 G-Q 出現(xiàn)的頻率占居第二,頻率范圍為 0.04 到0.2 之間,其中二穗短柄草出現(xiàn)頻率最高,而茭白出現(xiàn)頻率最低,整體的頻率在 0.1上下浮動。每 Kb 基因組中三單元 G-Q 出現(xiàn)的頻率最少,頻率范圍為 0.009 到 0.02 之間,其中短花藥野生稻出現(xiàn)頻率最高,茭白出現(xiàn)頻率最低,整體頻率在 0.01 上下浮動。綜上所述,在禾本科植物中,仍具有兩單元 G-Q 結(jié)構(gòu)在基因組出現(xiàn)的頻率最
結(jié)構(gòu)在基因上的數(shù)目與基因間的數(shù)目相差不大(圖 3)。玉米中兩種位置的 G-Q 結(jié)構(gòu)的數(shù)量相差較大。綜上所述,在豆科中,在基因上的 G-Q 結(jié)構(gòu)的數(shù)量要小于基因間的 G-Q結(jié)構(gòu)的數(shù)量,大部分物種中,兩種位置的 G-Q的數(shù)量相差不大。表 3 禾本科中 G-Q結(jié)構(gòu)單元密度統(tǒng)計Table 3 Density statistics of G-Q structural units in Grass family物種Species二聚體數(shù)量/KbNumber of TwoG-tracts/Kb三聚體數(shù)量/KbNumber of ThreeG-tracts/Kb四聚體數(shù)量/KbNumber of FourG-tracts/Kb基因組大小Genomic size(Mb)科familyOryza longistaminata3.268424 0.089231 0.009441 347禾本科Oryza brachyantha3.481874 0.107909 0.01936 253禾本科Brachypodium distachyon5.532685 0.163973 0.016265 260禾本科Oryza glaberrima4.3775 0.133718 0.014038 316禾本科Zea mays5.075372 0.143022 0.013982 2,300禾本科Zizania latifolia2.078647 0.045551 0.001654 590禾本科
本文編號:2919149
本文鏈接:http://sikaile.net/projectlw/swxlw/2919149.html
最近更新
教材專著