秈稻珍汕97和明恢63基因組的注釋和比較分析
發(fā)布時(shí)間:2021-06-30 11:06
水稻(Oryza sativa)是最重要的三大糧食作物之一,它為世界上二分之一的人口提供食物。世界上大米種植的區(qū)域主要集中在亞洲,其中以我國東南部,日本和東南亞國家最為集中。亞洲栽培稻分為秈稻和粳稻兩個(gè)亞種,秈稻又分為I型和II型兩個(gè)亞型。盡管秈稻產(chǎn)量占世界水稻總產(chǎn)量的70%以上,但仍然缺乏一個(gè)高質(zhì)量的參考基因組。珍汕97(ZS97)和明恢63(MH63)是得到廣泛推廣的雜交水稻汕優(yōu)63(SY63)的母本和父本,并且在秈稻分類中分別屬于秈Ⅰ型和秈Ⅱ型。為了構(gòu)建準(zhǔn)確性高,完整性高,連續(xù)性好的參考基因組,本論文結(jié)合第一代測(cè)序技術(shù)、第二代測(cè)序和第三代測(cè)序技術(shù)對(duì)兩個(gè)基因組進(jìn)行了拼接、延伸和contig定位。得到兩個(gè)高質(zhì)量的參考基因組后,對(duì)兩個(gè)基因組進(jìn)行了全面的注釋和比較分析,并對(duì)基因組的轉(zhuǎn)錄數(shù)據(jù)進(jìn)行了研究。主要研究結(jié)果如下:(1)Contigs去污染,提高基因組連續(xù)性三代測(cè)序以BAC clone為材料,在細(xì)菌載體傳代過程中,細(xì)菌載體中有活性的轉(zhuǎn)座子序列可能會(huì)插入到ZS97和MH63的序列中,從而污染ZS97和MH63的序列。本研究通過比對(duì)分析檢測(cè)到ZS97和MH63的contigs上分別含有1...
【文章來源】:華中農(nóng)業(yè)大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁數(shù)】:114 頁
【學(xué)位級(jí)別】:博士
【部分圖文】:
世界水稻產(chǎn)量在1961-2013的分布(FAOSTAT)
秈稻珍汕 97 和明恢 63 基因組的注釋和比較分析深對(duì)水稻雜種優(yōu)勢(shì)的認(rèn)知,研究雜種優(yōu)勢(shì)的機(jī)理。ZS97 和 MH63 兩個(gè)基因完成對(duì)于秈稻基因組研究具有重要意義。表 1-1 全球水稻每年總產(chǎn)量(FAOSTAT)Table 1-1 total yield of rice from 2005 to 2013(FAOSTAT)年份 區(qū)域 產(chǎn)量(噸) 產(chǎn)量增幅#(%)2005 World 634,279,023 0.002006 World 640,924,286 1.052007 World 656,781,512 3.552008 World 688,035,252 8.482009 World 686,928,072 8.302010 World 701,649,506 10.622011 World 721,445,583 13.742012 World 733,256,464 15.602013 World 738,089,040 16.37
據(jù)放到一個(gè)文件中,然后做數(shù)據(jù)質(zhì)量處理,第一步,將蛋白質(zhì)中非 20 種氨的氨基酸全部轉(zhuǎn)換成 X,用蛋白質(zhì) genbank 編號(hào)來重新命名蛋白質(zhì);第二 ID 和序列重復(fù)的蛋白質(zhì);第三步,去掉含有 X 比例超過 30%的蛋白質(zhì),結(jié)果是線粒體或者葉綠體基因的蛋白質(zhì);第五步,使用 cd-hit 去冗余(L),去冗余參數(shù):-c 0.9, -aS 0.9。 基因組的去污染BAC clone 傳代過程中可能會(huì)與目標(biāo)基因組發(fā)生重組交換導(dǎo)致目標(biāo)基因組本研究中基于三代組裝的 contigs 可能會(huì)受到載體 E.coli DH10B 的污染,本用 MUMmer3.23 進(jìn)行雙向比對(duì)來去除基因組污染(Kurtz et al 2004)。使用 LAST 兩個(gè)軟件來檢驗(yàn)污染是否去除干凈(Kent 2002, Altschul et al 1990)別、鑒定、去污染三個(gè)步驟去除載體污染,最終得到 ZS97 和 MH63 不受ontig 序列(Figure 2-1)。
【參考文獻(xiàn)】:
期刊論文
[1]早秈稻珍汕97B改良新不育系的配合力分析[J]. 李道品,朱世楊,張永鑫,鄭偉,洪德林. 浙江農(nóng)業(yè)學(xué)報(bào). 2014(04)
[2]新一代測(cè)序技術(shù)在植物轉(zhuǎn)錄組研究中的應(yīng)用[J]. 梁燁,陳雙燕,劉公社. 遺傳. 2011(12)
[3]強(qiáng)優(yōu)勢(shì)雜交稻組合汕優(yōu)63雜種優(yōu)勢(shì)遺傳基礎(chǔ)研究進(jìn)展[J]. 張啟發(fā). 中國基礎(chǔ)科學(xué). 2008(03)
[4]水稻第四號(hào)染色體精確測(cè)序完成[J]. 韓斌. 中國科學(xué)院院刊. 2003(01)
本文編號(hào):3257628
【文章來源】:華中農(nóng)業(yè)大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁數(shù)】:114 頁
【學(xué)位級(jí)別】:博士
【部分圖文】:
世界水稻產(chǎn)量在1961-2013的分布(FAOSTAT)
秈稻珍汕 97 和明恢 63 基因組的注釋和比較分析深對(duì)水稻雜種優(yōu)勢(shì)的認(rèn)知,研究雜種優(yōu)勢(shì)的機(jī)理。ZS97 和 MH63 兩個(gè)基因完成對(duì)于秈稻基因組研究具有重要意義。表 1-1 全球水稻每年總產(chǎn)量(FAOSTAT)Table 1-1 total yield of rice from 2005 to 2013(FAOSTAT)年份 區(qū)域 產(chǎn)量(噸) 產(chǎn)量增幅#(%)2005 World 634,279,023 0.002006 World 640,924,286 1.052007 World 656,781,512 3.552008 World 688,035,252 8.482009 World 686,928,072 8.302010 World 701,649,506 10.622011 World 721,445,583 13.742012 World 733,256,464 15.602013 World 738,089,040 16.37
據(jù)放到一個(gè)文件中,然后做數(shù)據(jù)質(zhì)量處理,第一步,將蛋白質(zhì)中非 20 種氨的氨基酸全部轉(zhuǎn)換成 X,用蛋白質(zhì) genbank 編號(hào)來重新命名蛋白質(zhì);第二 ID 和序列重復(fù)的蛋白質(zhì);第三步,去掉含有 X 比例超過 30%的蛋白質(zhì),結(jié)果是線粒體或者葉綠體基因的蛋白質(zhì);第五步,使用 cd-hit 去冗余(L),去冗余參數(shù):-c 0.9, -aS 0.9。 基因組的去污染BAC clone 傳代過程中可能會(huì)與目標(biāo)基因組發(fā)生重組交換導(dǎo)致目標(biāo)基因組本研究中基于三代組裝的 contigs 可能會(huì)受到載體 E.coli DH10B 的污染,本用 MUMmer3.23 進(jìn)行雙向比對(duì)來去除基因組污染(Kurtz et al 2004)。使用 LAST 兩個(gè)軟件來檢驗(yàn)污染是否去除干凈(Kent 2002, Altschul et al 1990)別、鑒定、去污染三個(gè)步驟去除載體污染,最終得到 ZS97 和 MH63 不受ontig 序列(Figure 2-1)。
【參考文獻(xiàn)】:
期刊論文
[1]早秈稻珍汕97B改良新不育系的配合力分析[J]. 李道品,朱世楊,張永鑫,鄭偉,洪德林. 浙江農(nóng)業(yè)學(xué)報(bào). 2014(04)
[2]新一代測(cè)序技術(shù)在植物轉(zhuǎn)錄組研究中的應(yīng)用[J]. 梁燁,陳雙燕,劉公社. 遺傳. 2011(12)
[3]強(qiáng)優(yōu)勢(shì)雜交稻組合汕優(yōu)63雜種優(yōu)勢(shì)遺傳基礎(chǔ)研究進(jìn)展[J]. 張啟發(fā). 中國基礎(chǔ)科學(xué). 2008(03)
[4]水稻第四號(hào)染色體精確測(cè)序完成[J]. 韓斌. 中國科學(xué)院院刊. 2003(01)
本文編號(hào):3257628
本文鏈接:http://sikaile.net/shoufeilunwen/jckxbs/3257628.html
最近更新
教材專著