西瓜與甜瓜細(xì)胞器比較基因組學(xué)研究
發(fā)布時(shí)間:2020-06-16 10:10
【摘要】:西瓜(Citrullus lanatus L.)和甜瓜(Cucumis melo L.)均是世界性的園藝作物,具有重要的經(jīng)濟(jì)價(jià)值。細(xì)胞器基因組是一個(gè)物種全基因組的重要組成部分,研究西瓜、甜瓜細(xì)胞器(葉綠體和線粒體)基因組是繼核基因組計(jì)劃之后,解析西瓜、甜瓜全部遺傳信息,進(jìn)而實(shí)現(xiàn)西瓜、甜瓜分子設(shè)計(jì)育種的必經(jīng)之路。目前有關(guān)西瓜、甜瓜細(xì)胞器基因組的研究較少,在一定程度上阻礙了西瓜、甜瓜基于細(xì)胞器基因組相關(guān)研究的開(kāi)展。因此,對(duì)西瓜、甜瓜細(xì)胞器基因組研究具有重要的意義。本研究首先測(cè)序、拼接、組裝并發(fā)表了栽培西瓜葉綠體基因組全序列,以及甜瓜線粒體基因組全序列,然后結(jié)合GenBank數(shù)據(jù)庫(kù)中已經(jīng)公布的基因組數(shù)據(jù),對(duì)西瓜、甜瓜的細(xì)胞器基因組進(jìn)行了全面的比較基因組學(xué)分析,主要研究?jī)?nèi)容和結(jié)果如下:1.完成并公布了首個(gè)栽培西瓜葉綠體基因組。栽培西瓜的葉綠體基因組由一個(gè)單環(huán)雙鏈DNA分子構(gòu)成,全長(zhǎng)為156,906bp,呈典型的四段式結(jié)構(gòu),其中大單拷貝區(qū)(LSC)長(zhǎng)86,844bp,小單拷貝區(qū)(SSC)長(zhǎng)17,896bp,兩個(gè)反向重復(fù)區(qū)(IRa和IRb)長(zhǎng)均為26,083bp。整個(gè)基因組編碼131個(gè)基因,其中包括86個(gè)蛋白編碼基因、37個(gè)tRNA基因、8個(gè)rRNA基因;其基因組的結(jié)構(gòu)、GC含量、基因排列順序和密碼子偏好性與其它高等植物的葉綠體基因組相似。此外,在西瓜的葉綠體基因組中存在19條串聯(lián)重復(fù)序列(TR)、26對(duì)散在重復(fù)序列(DR)和53條簡(jiǎn)單重復(fù)序列(SSR),其中SSR類型多為多聚A和多聚T,主要分布于非編碼區(qū)。2.提出了全新的基于高通量測(cè)序數(shù)據(jù)高效葉綠體基因組拼接策略。本研究提出了一套基于Illumina Hiseq全基因組測(cè)序數(shù)據(jù)從頭組裝葉綠體基因組的全新策略,無(wú)須單獨(dú)分離純化葉綠體基因組DNA,即可高效經(jīng)濟(jì)地獲取植物葉綠體基因組完整序列,用該方法成功完成并首次公布了栽培西瓜葉綠體基因組,隨后用該方法率先成功組裝完成了藥西瓜(Citrullus colocynthis)、熱迷西瓜(Citrullus rehmii)、阿瑪魯西瓜(Citrullus amarus)等3個(gè)野生種西瓜,以及中國(guó)南瓜(Cucurbita moschata)、印度南瓜(Cucurbita maxima)、苦瓜(Momordica charantia)和葫蘆(Lagenaria siceraria)等4個(gè)葫蘆科植物的葉綠體參考基因組,再次驗(yàn)證該方法的良好通用性和實(shí)用性。基于15個(gè)葫蘆科植物的葉綠體全基因組序列的比較基因組學(xué)分析發(fā)現(xiàn),葫蘆科植物的葉綠體基因組均為單環(huán)雙鏈DNA分子,GC含量與西瓜相似,均在36.7~37.2%,全基因組長(zhǎng)度約為155~159kb,平均長(zhǎng)度約為157kb,編碼基因數(shù)量為130~133個(gè),平均有131個(gè)基因;葉綠體基因組之間整體的共線性比較好,沒(méi)有發(fā)生重排現(xiàn)象。此外,我們基于15個(gè)葫蘆科植物的葉綠體基因組序列的比對(duì)結(jié)果,開(kāi)發(fā)了適用于葫蘆科內(nèi)物種鑒定、系統(tǒng)進(jìn)化和群體遺傳等相關(guān)研究的7個(gè)DNA barcoding和38個(gè)SSR標(biāo)記,用葉綠體全基因組序列進(jìn)行系統(tǒng)進(jìn)化關(guān)系分析,可以得到與核基因組分析相似的結(jié)果。3.完成并公布了首個(gè)甜瓜線粒體全基因組完整序列。本研究利用具有讀長(zhǎng)優(yōu)勢(shì)的三代測(cè)序技術(shù)PacBio Sequel測(cè)序數(shù)據(jù)用于甜瓜線粒體基因組研究,成功完成并公布了葫蘆科植物中序列最長(zhǎng)的甜瓜線粒體基因組完整序列,該基因組由3個(gè)環(huán)狀的DNA分子組成,主環(huán)長(zhǎng)度為2,709,526bp,其余兩個(gè)小環(huán),長(zhǎng)度分別為149,555bp和47,592bp,基因組總長(zhǎng)約為2.9Mb(2,906,673bp),GC含量為44.77%,高于甜瓜細(xì)胞核基因組和葉綠體基因組的GC的含量。該基因組編碼了88個(gè)基因,包含40個(gè)蛋白編碼基因,8個(gè)rRNA基因和40個(gè)tRNA基因,其中所有蛋白編碼基因全部分布于主環(huán)上,僅有5個(gè)tRNA基因分布于第二個(gè)小環(huán)上,第三個(gè)小環(huán)上沒(méi)有任何編碼基因。非編碼基因序列占甜瓜線粒體基因組的絕大部分,其百分比值為98.32%。甜瓜線粒體基因組序列與葉綠體和細(xì)胞核基因組同源序列分別為2.73%和46.47%。此外,甜瓜線粒體基因組中共有4,861對(duì)同向重復(fù)序列,439對(duì)反向重復(fù)序列,653條串聯(lián)重復(fù)序列,以及218條SSR序列,重復(fù)序列的總長(zhǎng)度約占全基因組的44.2%。對(duì)甜瓜、西瓜、黃瓜和西葫蘆的線粒體基因結(jié)構(gòu)特征進(jìn)行深入比較分析后發(fā)現(xiàn),大量的重復(fù)序列和核基因組源序列是甜瓜線粒體基因組規(guī)模不斷增大和變異的主要原因,此發(fā)現(xiàn)為葫蘆科植物線粒體基因組的遺傳變異提供依據(jù)。4.將葉綠體全基因組首次應(yīng)用于西瓜、甜瓜的群體結(jié)構(gòu)及遺傳多樣性的研究。本研究分別在314份西瓜材料的西瓜自然群體和348份甜瓜材料的甜瓜自然群體內(nèi)鑒別了的82個(gè)和192個(gè)葉綠體基因組SNP位點(diǎn),主要分布在葉綠體基因組的LSC區(qū)和SSC區(qū)內(nèi),互為反向重復(fù)的IRa和IRb中幾乎不含有SNP位點(diǎn)。然后用這些SNP位點(diǎn)分析了西瓜、甜瓜自然群體的群體結(jié)構(gòu),并對(duì)每個(gè)群體的果實(shí)相關(guān)性狀和群體遺傳多樣性進(jìn)行深入分析,結(jié)果表明82個(gè)SNP能有效地將西瓜自然群體分為4個(gè)群體:野生毛西瓜群、半野生黏籽西瓜群、美洲生態(tài)型栽培西瓜群和亞洲生態(tài)型栽培西瓜群,其遺傳多樣性(π值)依次下降,分別為6.6×10~(-5),2.4×10~(-5),9.8×10~(-6)和5.41×10~(-6),野生毛西瓜群的單果重、可溶性固形物、果肉顏色和種子千粒重與其它三個(gè)群有顯著的差異。192個(gè)SNP能有效地將甜瓜自然群體分為3個(gè)群體:野生小甜瓜群、厚皮型栽培甜瓜群和薄皮型栽培甜瓜群,其遺傳多樣性也依次下降,分別為1.12×10~(-3)、4.71×10~(-4)和2.85×10~(-4),三個(gè)群體之間的果肉厚度有顯著差異。這些研究結(jié)果表明葉綠體全基因組可用于西瓜和甜瓜的群體遺傳學(xué)研究,有助于種內(nèi)亞群之間的分類和核心種質(zhì)資源鑒定等研究。本研究發(fā)表的首個(gè)栽培西瓜葉綠體參考基因組及首個(gè)甜瓜線粒體參考基因組,所構(gòu)建的葉綠體基因組從頭拼接全新策略及開(kāi)發(fā)的適用于葫蘆科植物研究的DNA barcoding和SSR分子標(biāo)記,將為今后西瓜、甜瓜系統(tǒng)進(jìn)化、物種鑒定、群體遺傳、核質(zhì)互作、RNA編輯、基因工程等基于葉綠體和線粒體基因組的相關(guān)研究提供理論依據(jù)。
【學(xué)位授予單位】:東北農(nóng)業(yè)大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2018
【分類號(hào)】:S651;S652
【圖文】:
注:紫色進(jìn)化樹代表真核細(xì)胞由古細(xì)菌起源的過(guò)程,深紅色進(jìn)化樹代表線粒體由古變形菌起源的過(guò)程,藍(lán)色進(jìn)化樹代表葉綠體由古藍(lán)藻細(xì)菌起源的過(guò)程。圖 1-1 葉綠體和線粒體的內(nèi)共生進(jìn)化起源過(guò)程,此圖引自 Timmis 等人[7]Figure 1-1 The endosymbiotic evolution of chloroplast and mitochondria, the figure cited Timmiset al[7]1.1.3 葉綠體基因組結(jié)構(gòu)及特點(diǎn)高等植物葉綠體基因組的大小一般在 115~165kb 之間,且結(jié)構(gòu)非常保守。煙草的葉綠體基因組是高等植物中第一個(gè)被測(cè)序完成的葉綠體基因組[9],其基因組結(jié)構(gòu)為單環(huán)雙鏈狀 DNA分子,具有典型的四段式結(jié)構(gòu),分別為一個(gè)大單拷貝區(qū)(Large single copy,LSC),一個(gè)小單拷貝區(qū)(Small single copy,SSC)和兩個(gè)互為反向重復(fù)的重復(fù)區(qū)(Inverted repeat region,IRa 和 IRb),大多數(shù)植物葉綠體基因組中的 LSC 區(qū)的長(zhǎng)度約為 81~90kb,SSC 區(qū)長(zhǎng)度介于18~20kb 之間,IR 區(qū)長(zhǎng)度變化最大則介于 5~76kb 之間[10],LSC 和 SSC 被兩個(gè) IR 序列分隔開(kāi)。在被子植物的進(jìn)化過(guò)程中,葉綠體基因組中這四部分的順序幾乎保持不變。葉綠體基因組大小的變異在進(jìn)化過(guò)程中主要受到 IR 區(qū)的延展或縮小或丟失及基因間區(qū)長(zhǎng)度的影響,如豌豆、日本柳杉的 IR 區(qū)完全消失[11];日本黑松的 IR 區(qū)序列已經(jīng)縮減至 495bp;相比之下,天竺葵的 IR 區(qū)卻急劇增加了 76kb[12]。這些研究表明在葉綠體基因組中 IR 區(qū)可能對(duì)于植物的生長(zhǎng)發(fā)
表 3-1 不同測(cè)序數(shù)據(jù)量的葉綠體基因組從頭組裝結(jié)果Table 3-1 The results of de novo chloroplast genome based on different sequence data size特征Features數(shù)據(jù)量Data size0.1× 0.2× 0.3× 0.4× 0.5× 0.6× 0.7× 0.8× 0.9× 1.0×MSL (bp) 86,852 86,852131,15386,85286,852113,077131,15368,78961,49834,928ASL (bp) 24,998 15,229 16,49622,37625,07629,702 22,70016,56616,8506,738N50L (bp) 86,852 86,852131,15386,85286,852113,077131,15341,65037,06913,846TOL 6 11 12 7 6 5 7 9 15 82CVG 54 54 65 54 54 66 65 54 68 1注:MSL:Max sequence length,最長(zhǎng)序列長(zhǎng)度;ASL:Average sequence length,平均序列長(zhǎng)度,N50L:N50 length,N50 長(zhǎng)度;TOS:Total sequences,總序列數(shù),CVG:Coverage,覆蓋度。
本文編號(hào):2715907
【學(xué)位授予單位】:東北農(nóng)業(yè)大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2018
【分類號(hào)】:S651;S652
【圖文】:
注:紫色進(jìn)化樹代表真核細(xì)胞由古細(xì)菌起源的過(guò)程,深紅色進(jìn)化樹代表線粒體由古變形菌起源的過(guò)程,藍(lán)色進(jìn)化樹代表葉綠體由古藍(lán)藻細(xì)菌起源的過(guò)程。圖 1-1 葉綠體和線粒體的內(nèi)共生進(jìn)化起源過(guò)程,此圖引自 Timmis 等人[7]Figure 1-1 The endosymbiotic evolution of chloroplast and mitochondria, the figure cited Timmiset al[7]1.1.3 葉綠體基因組結(jié)構(gòu)及特點(diǎn)高等植物葉綠體基因組的大小一般在 115~165kb 之間,且結(jié)構(gòu)非常保守。煙草的葉綠體基因組是高等植物中第一個(gè)被測(cè)序完成的葉綠體基因組[9],其基因組結(jié)構(gòu)為單環(huán)雙鏈狀 DNA分子,具有典型的四段式結(jié)構(gòu),分別為一個(gè)大單拷貝區(qū)(Large single copy,LSC),一個(gè)小單拷貝區(qū)(Small single copy,SSC)和兩個(gè)互為反向重復(fù)的重復(fù)區(qū)(Inverted repeat region,IRa 和 IRb),大多數(shù)植物葉綠體基因組中的 LSC 區(qū)的長(zhǎng)度約為 81~90kb,SSC 區(qū)長(zhǎng)度介于18~20kb 之間,IR 區(qū)長(zhǎng)度變化最大則介于 5~76kb 之間[10],LSC 和 SSC 被兩個(gè) IR 序列分隔開(kāi)。在被子植物的進(jìn)化過(guò)程中,葉綠體基因組中這四部分的順序幾乎保持不變。葉綠體基因組大小的變異在進(jìn)化過(guò)程中主要受到 IR 區(qū)的延展或縮小或丟失及基因間區(qū)長(zhǎng)度的影響,如豌豆、日本柳杉的 IR 區(qū)完全消失[11];日本黑松的 IR 區(qū)序列已經(jīng)縮減至 495bp;相比之下,天竺葵的 IR 區(qū)卻急劇增加了 76kb[12]。這些研究表明在葉綠體基因組中 IR 區(qū)可能對(duì)于植物的生長(zhǎng)發(fā)
表 3-1 不同測(cè)序數(shù)據(jù)量的葉綠體基因組從頭組裝結(jié)果Table 3-1 The results of de novo chloroplast genome based on different sequence data size特征Features數(shù)據(jù)量Data size0.1× 0.2× 0.3× 0.4× 0.5× 0.6× 0.7× 0.8× 0.9× 1.0×MSL (bp) 86,852 86,852131,15386,85286,852113,077131,15368,78961,49834,928ASL (bp) 24,998 15,229 16,49622,37625,07629,702 22,70016,56616,8506,738N50L (bp) 86,852 86,852131,15386,85286,852113,077131,15341,65037,06913,846TOL 6 11 12 7 6 5 7 9 15 82CVG 54 54 65 54 54 66 65 54 68 1注:MSL:Max sequence length,最長(zhǎng)序列長(zhǎng)度;ASL:Average sequence length,平均序列長(zhǎng)度,N50L:N50 length,N50 長(zhǎng)度;TOS:Total sequences,總序列數(shù),CVG:Coverage,覆蓋度。
【參考文獻(xiàn)】
相關(guān)期刊論文 前4條
1 李峰;管敏鑫;;線粒體起源和蛋白含量進(jìn)化[J];科技通報(bào);2015年01期
2 崔柳青;李一帆;潘衛(wèi)東;;葉綠體基因工程研究進(jìn)展[J];生物技術(shù)通報(bào);2012年06期
3 李雙雙;薛龍飛;蘇愛(ài)國(guó);雷彬彬;王玉美;華金平;;高等植物線粒體基因組測(cè)序和序列分析[J];中國(guó)農(nóng)業(yè)大學(xué)學(xué)報(bào);2011年02期
4 王鳴;侯沛;;西瓜的起源、歷史、分類及育種成就[J];當(dāng)代蔬菜;2006年03期
本文編號(hào):2715907
本文鏈接:http://sikaile.net/nykjlw/yylw/2715907.html
最近更新
教材專著