西瓜與甜瓜細(xì)胞器比較基因組學(xué)研究
發(fā)布時間:2020-06-16 10:10
【摘要】:西瓜(Citrullus lanatus L.)和甜瓜(Cucumis melo L.)均是世界性的園藝作物,具有重要的經(jīng)濟(jì)價值。細(xì)胞器基因組是一個物種全基因組的重要組成部分,研究西瓜、甜瓜細(xì)胞器(葉綠體和線粒體)基因組是繼核基因組計劃之后,解析西瓜、甜瓜全部遺傳信息,進(jìn)而實現(xiàn)西瓜、甜瓜分子設(shè)計育種的必經(jīng)之路。目前有關(guān)西瓜、甜瓜細(xì)胞器基因組的研究較少,在一定程度上阻礙了西瓜、甜瓜基于細(xì)胞器基因組相關(guān)研究的開展。因此,對西瓜、甜瓜細(xì)胞器基因組研究具有重要的意義。本研究首先測序、拼接、組裝并發(fā)表了栽培西瓜葉綠體基因組全序列,以及甜瓜線粒體基因組全序列,然后結(jié)合GenBank數(shù)據(jù)庫中已經(jīng)公布的基因組數(shù)據(jù),對西瓜、甜瓜的細(xì)胞器基因組進(jìn)行了全面的比較基因組學(xué)分析,主要研究內(nèi)容和結(jié)果如下:1.完成并公布了首個栽培西瓜葉綠體基因組。栽培西瓜的葉綠體基因組由一個單環(huán)雙鏈DNA分子構(gòu)成,全長為156,906bp,呈典型的四段式結(jié)構(gòu),其中大單拷貝區(qū)(LSC)長86,844bp,小單拷貝區(qū)(SSC)長17,896bp,兩個反向重復(fù)區(qū)(IRa和IRb)長均為26,083bp。整個基因組編碼131個基因,其中包括86個蛋白編碼基因、37個tRNA基因、8個rRNA基因;其基因組的結(jié)構(gòu)、GC含量、基因排列順序和密碼子偏好性與其它高等植物的葉綠體基因組相似。此外,在西瓜的葉綠體基因組中存在19條串聯(lián)重復(fù)序列(TR)、26對散在重復(fù)序列(DR)和53條簡單重復(fù)序列(SSR),其中SSR類型多為多聚A和多聚T,主要分布于非編碼區(qū)。2.提出了全新的基于高通量測序數(shù)據(jù)高效葉綠體基因組拼接策略。本研究提出了一套基于Illumina Hiseq全基因組測序數(shù)據(jù)從頭組裝葉綠體基因組的全新策略,無須單獨分離純化葉綠體基因組DNA,即可高效經(jīng)濟(jì)地獲取植物葉綠體基因組完整序列,用該方法成功完成并首次公布了栽培西瓜葉綠體基因組,隨后用該方法率先成功組裝完成了藥西瓜(Citrullus colocynthis)、熱迷西瓜(Citrullus rehmii)、阿瑪魯西瓜(Citrullus amarus)等3個野生種西瓜,以及中國南瓜(Cucurbita moschata)、印度南瓜(Cucurbita maxima)、苦瓜(Momordica charantia)和葫蘆(Lagenaria siceraria)等4個葫蘆科植物的葉綠體參考基因組,再次驗證該方法的良好通用性和實用性;15個葫蘆科植物的葉綠體全基因組序列的比較基因組學(xué)分析發(fā)現(xiàn),葫蘆科植物的葉綠體基因組均為單環(huán)雙鏈DNA分子,GC含量與西瓜相似,均在36.7~37.2%,全基因組長度約為155~159kb,平均長度約為157kb,編碼基因數(shù)量為130~133個,平均有131個基因;葉綠體基因組之間整體的共線性比較好,沒有發(fā)生重排現(xiàn)象。此外,我們基于15個葫蘆科植物的葉綠體基因組序列的比對結(jié)果,開發(fā)了適用于葫蘆科內(nèi)物種鑒定、系統(tǒng)進(jìn)化和群體遺傳等相關(guān)研究的7個DNA barcoding和38個SSR標(biāo)記,用葉綠體全基因組序列進(jìn)行系統(tǒng)進(jìn)化關(guān)系分析,可以得到與核基因組分析相似的結(jié)果。3.完成并公布了首個甜瓜線粒體全基因組完整序列。本研究利用具有讀長優(yōu)勢的三代測序技術(shù)PacBio Sequel測序數(shù)據(jù)用于甜瓜線粒體基因組研究,成功完成并公布了葫蘆科植物中序列最長的甜瓜線粒體基因組完整序列,該基因組由3個環(huán)狀的DNA分子組成,主環(huán)長度為2,709,526bp,其余兩個小環(huán),長度分別為149,555bp和47,592bp,基因組總長約為2.9Mb(2,906,673bp),GC含量為44.77%,高于甜瓜細(xì)胞核基因組和葉綠體基因組的GC的含量。該基因組編碼了88個基因,包含40個蛋白編碼基因,8個rRNA基因和40個tRNA基因,其中所有蛋白編碼基因全部分布于主環(huán)上,僅有5個tRNA基因分布于第二個小環(huán)上,第三個小環(huán)上沒有任何編碼基因。非編碼基因序列占甜瓜線粒體基因組的絕大部分,其百分比值為98.32%。甜瓜線粒體基因組序列與葉綠體和細(xì)胞核基因組同源序列分別為2.73%和46.47%。此外,甜瓜線粒體基因組中共有4,861對同向重復(fù)序列,439對反向重復(fù)序列,653條串聯(lián)重復(fù)序列,以及218條SSR序列,重復(fù)序列的總長度約占全基因組的44.2%。對甜瓜、西瓜、黃瓜和西葫蘆的線粒體基因結(jié)構(gòu)特征進(jìn)行深入比較分析后發(fā)現(xiàn),大量的重復(fù)序列和核基因組源序列是甜瓜線粒體基因組規(guī)模不斷增大和變異的主要原因,此發(fā)現(xiàn)為葫蘆科植物線粒體基因組的遺傳變異提供依據(jù)。4.將葉綠體全基因組首次應(yīng)用于西瓜、甜瓜的群體結(jié)構(gòu)及遺傳多樣性的研究。本研究分別在314份西瓜材料的西瓜自然群體和348份甜瓜材料的甜瓜自然群體內(nèi)鑒別了的82個和192個葉綠體基因組SNP位點,主要分布在葉綠體基因組的LSC區(qū)和SSC區(qū)內(nèi),互為反向重復(fù)的IRa和IRb中幾乎不含有SNP位點。然后用這些SNP位點分析了西瓜、甜瓜自然群體的群體結(jié)構(gòu),并對每個群體的果實相關(guān)性狀和群體遺傳多樣性進(jìn)行深入分析,結(jié)果表明82個SNP能有效地將西瓜自然群體分為4個群體:野生毛西瓜群、半野生黏籽西瓜群、美洲生態(tài)型栽培西瓜群和亞洲生態(tài)型栽培西瓜群,其遺傳多樣性(π值)依次下降,分別為6.6×10~(-5),2.4×10~(-5),9.8×10~(-6)和5.41×10~(-6),野生毛西瓜群的單果重、可溶性固形物、果肉顏色和種子千粒重與其它三個群有顯著的差異。192個SNP能有效地將甜瓜自然群體分為3個群體:野生小甜瓜群、厚皮型栽培甜瓜群和薄皮型栽培甜瓜群,其遺傳多樣性也依次下降,分別為1.12×10~(-3)、4.71×10~(-4)和2.85×10~(-4),三個群體之間的果肉厚度有顯著差異。這些研究結(jié)果表明葉綠體全基因組可用于西瓜和甜瓜的群體遺傳學(xué)研究,有助于種內(nèi)亞群之間的分類和核心種質(zhì)資源鑒定等研究。本研究發(fā)表的首個栽培西瓜葉綠體參考基因組及首個甜瓜線粒體參考基因組,所構(gòu)建的葉綠體基因組從頭拼接全新策略及開發(fā)的適用于葫蘆科植物研究的DNA barcoding和SSR分子標(biāo)記,將為今后西瓜、甜瓜系統(tǒng)進(jìn)化、物種鑒定、群體遺傳、核質(zhì)互作、RNA編輯、基因工程等基于葉綠體和線粒體基因組的相關(guān)研究提供理論依據(jù)。
【學(xué)位授予單位】:東北農(nóng)業(yè)大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2018
【分類號】:S651;S652
【圖文】:
注:紫色進(jìn)化樹代表真核細(xì)胞由古細(xì)菌起源的過程,深紅色進(jìn)化樹代表線粒體由古變形菌起源的過程,藍(lán)色進(jìn)化樹代表葉綠體由古藍(lán)藻細(xì)菌起源的過程。圖 1-1 葉綠體和線粒體的內(nèi)共生進(jìn)化起源過程,此圖引自 Timmis 等人[7]Figure 1-1 The endosymbiotic evolution of chloroplast and mitochondria, the figure cited Timmiset al[7]1.1.3 葉綠體基因組結(jié)構(gòu)及特點高等植物葉綠體基因組的大小一般在 115~165kb 之間,且結(jié)構(gòu)非常保守。煙草的葉綠體基因組是高等植物中第一個被測序完成的葉綠體基因組[9],其基因組結(jié)構(gòu)為單環(huán)雙鏈狀 DNA分子,具有典型的四段式結(jié)構(gòu),分別為一個大單拷貝區(qū)(Large single copy,LSC),一個小單拷貝區(qū)(Small single copy,SSC)和兩個互為反向重復(fù)的重復(fù)區(qū)(Inverted repeat region,IRa 和 IRb),大多數(shù)植物葉綠體基因組中的 LSC 區(qū)的長度約為 81~90kb,SSC 區(qū)長度介于18~20kb 之間,IR 區(qū)長度變化最大則介于 5~76kb 之間[10],LSC 和 SSC 被兩個 IR 序列分隔開。在被子植物的進(jìn)化過程中,葉綠體基因組中這四部分的順序幾乎保持不變。葉綠體基因組大小的變異在進(jìn)化過程中主要受到 IR 區(qū)的延展或縮小或丟失及基因間區(qū)長度的影響,如豌豆、日本柳杉的 IR 區(qū)完全消失[11];日本黑松的 IR 區(qū)序列已經(jīng)縮減至 495bp;相比之下,天竺葵的 IR 區(qū)卻急劇增加了 76kb[12]。這些研究表明在葉綠體基因組中 IR 區(qū)可能對于植物的生長發(fā)
表 3-1 不同測序數(shù)據(jù)量的葉綠體基因組從頭組裝結(jié)果Table 3-1 The results of de novo chloroplast genome based on different sequence data size特征Features數(shù)據(jù)量Data size0.1× 0.2× 0.3× 0.4× 0.5× 0.6× 0.7× 0.8× 0.9× 1.0×MSL (bp) 86,852 86,852131,15386,85286,852113,077131,15368,78961,49834,928ASL (bp) 24,998 15,229 16,49622,37625,07629,702 22,70016,56616,8506,738N50L (bp) 86,852 86,852131,15386,85286,852113,077131,15341,65037,06913,846TOL 6 11 12 7 6 5 7 9 15 82CVG 54 54 65 54 54 66 65 54 68 1注:MSL:Max sequence length,最長序列長度;ASL:Average sequence length,平均序列長度,N50L:N50 length,N50 長度;TOS:Total sequences,總序列數(shù),CVG:Coverage,覆蓋度。
本文編號:2715907
【學(xué)位授予單位】:東北農(nóng)業(yè)大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2018
【分類號】:S651;S652
【圖文】:
注:紫色進(jìn)化樹代表真核細(xì)胞由古細(xì)菌起源的過程,深紅色進(jìn)化樹代表線粒體由古變形菌起源的過程,藍(lán)色進(jìn)化樹代表葉綠體由古藍(lán)藻細(xì)菌起源的過程。圖 1-1 葉綠體和線粒體的內(nèi)共生進(jìn)化起源過程,此圖引自 Timmis 等人[7]Figure 1-1 The endosymbiotic evolution of chloroplast and mitochondria, the figure cited Timmiset al[7]1.1.3 葉綠體基因組結(jié)構(gòu)及特點高等植物葉綠體基因組的大小一般在 115~165kb 之間,且結(jié)構(gòu)非常保守。煙草的葉綠體基因組是高等植物中第一個被測序完成的葉綠體基因組[9],其基因組結(jié)構(gòu)為單環(huán)雙鏈狀 DNA分子,具有典型的四段式結(jié)構(gòu),分別為一個大單拷貝區(qū)(Large single copy,LSC),一個小單拷貝區(qū)(Small single copy,SSC)和兩個互為反向重復(fù)的重復(fù)區(qū)(Inverted repeat region,IRa 和 IRb),大多數(shù)植物葉綠體基因組中的 LSC 區(qū)的長度約為 81~90kb,SSC 區(qū)長度介于18~20kb 之間,IR 區(qū)長度變化最大則介于 5~76kb 之間[10],LSC 和 SSC 被兩個 IR 序列分隔開。在被子植物的進(jìn)化過程中,葉綠體基因組中這四部分的順序幾乎保持不變。葉綠體基因組大小的變異在進(jìn)化過程中主要受到 IR 區(qū)的延展或縮小或丟失及基因間區(qū)長度的影響,如豌豆、日本柳杉的 IR 區(qū)完全消失[11];日本黑松的 IR 區(qū)序列已經(jīng)縮減至 495bp;相比之下,天竺葵的 IR 區(qū)卻急劇增加了 76kb[12]。這些研究表明在葉綠體基因組中 IR 區(qū)可能對于植物的生長發(fā)
表 3-1 不同測序數(shù)據(jù)量的葉綠體基因組從頭組裝結(jié)果Table 3-1 The results of de novo chloroplast genome based on different sequence data size特征Features數(shù)據(jù)量Data size0.1× 0.2× 0.3× 0.4× 0.5× 0.6× 0.7× 0.8× 0.9× 1.0×MSL (bp) 86,852 86,852131,15386,85286,852113,077131,15368,78961,49834,928ASL (bp) 24,998 15,229 16,49622,37625,07629,702 22,70016,56616,8506,738N50L (bp) 86,852 86,852131,15386,85286,852113,077131,15341,65037,06913,846TOL 6 11 12 7 6 5 7 9 15 82CVG 54 54 65 54 54 66 65 54 68 1注:MSL:Max sequence length,最長序列長度;ASL:Average sequence length,平均序列長度,N50L:N50 length,N50 長度;TOS:Total sequences,總序列數(shù),CVG:Coverage,覆蓋度。
【參考文獻(xiàn)】
相關(guān)期刊論文 前4條
1 李峰;管敏鑫;;線粒體起源和蛋白含量進(jìn)化[J];科技通報;2015年01期
2 崔柳青;李一帆;潘衛(wèi)東;;葉綠體基因工程研究進(jìn)展[J];生物技術(shù)通報;2012年06期
3 李雙雙;薛龍飛;蘇愛國;雷彬彬;王玉美;華金平;;高等植物線粒體基因組測序和序列分析[J];中國農(nóng)業(yè)大學(xué)學(xué)報;2011年02期
4 王鳴;侯沛;;西瓜的起源、歷史、分類及育種成就[J];當(dāng)代蔬菜;2006年03期
本文編號:2715907
本文鏈接:http://sikaile.net/nykjlw/yylw/2715907.html
最近更新
教材專著