C1SLs小鼠群體遺傳結(jié)構(gòu)解析與血脂QTLs內(nèi)候選基因鑒定
發(fā)布時間:2018-03-07 08:12
本文選題:中國野生小鼠 切入點(diǎn):1號染色體 出處:《東華大學(xué)》2017年博士論文 論文類型:學(xué)位論文
【摘要】:小鼠與人類基因組高度同源,因此作為重要的模式動物之一,在人類復(fù)雜性狀研究中扮演著重要角色。在小鼠群體中,數(shù)量性狀座位(Quantitative trait locus,QTL)定位主要有連鎖分析和關(guān)聯(lián)分析等策略。由于近交系小鼠亞種來源單一、遺傳多樣性匱乏、單倍型大等特點(diǎn),導(dǎo)致定位的QTL較大,很難快速克隆性狀相關(guān)的功能基因。因此,新的小鼠資源亟待開發(fā)來克服上述困難。染色體替換系策略通過降低基因組背景復(fù)雜度,顯著提高了QTL定位的靈敏度。報(bào)道顯示,自然界中的野生小鼠蘊(yùn)含著豐富的遺傳多樣性與表型多樣性。由于大量歷史重組事件的積累,其連鎖不平衡衰減速度與人類群體相似,QTL定位可達(dá)到單基因分辨率,是復(fù)雜性狀研究的理想資源。結(jié)合染色體替換和野生小鼠資源的特點(diǎn),我們提出了利用“特異染色體替換小鼠群體”用于QTL定位與基因克隆的策略,同時構(gòu)建了以中國野生小鼠來源為主的1號染色體替換系(chromosome 1 substitution lines,C1SLs)群體。在該群體中,每個品系的1號染色體來源不同,其余染色體都來源于C57BL/6J品系。截至目前,已順利完成18個品系的構(gòu)建與全基因組重測序工作。為了解析該群體的遺傳結(jié)構(gòu)并應(yīng)用于血脂調(diào)控基因的鑒定,本論文主要開展了以下個四個方面的研究工作。第一,C1SLs小鼠群體遺傳結(jié)構(gòu)解析。與近交系小鼠相比,C1SLs小鼠群體含有豐富的遺傳變異。通過對C1SLs群體測序數(shù)據(jù)的生物信息學(xué)分析,在1號染色體上鑒定了450萬個單核苷酸多態(tài)性(single nucleotide polymorphism,SNP)和小片段的插入/缺失(indel)。其中130萬個為新發(fā)現(xiàn)的遺傳變異,不存在于小鼠基因組項(xiàng)目(Mouse Genome Project,MGP)測序的36個近交系小鼠和db SNP142遺傳變異數(shù)據(jù)集中。統(tǒng)計(jì)結(jié)果表明,C1SLs群體的遺傳變異數(shù)量是近交系小鼠的5倍之多。SNPs和indels功能注釋結(jié)果顯示,0.47%(21335)的突變位于蛋白編碼區(qū),共影響1002個蛋白編碼基因。其中,含有大量首次發(fā)現(xiàn)的遺傳變異,包括可能導(dǎo)致蛋白功能失活的3009個非同義突變、45個終止密碼子增加突變、6個終止密碼子缺失突變和65個移碼突變。此外,通過基因功能富集分析,發(fā)現(xiàn)138個基因參與了60條已知的生物學(xué)通路,包括免疫相關(guān)通路和嗅覺信號轉(zhuǎn)導(dǎo)通路等。對于大片段缺失突變(50 bp),鑒定205個基因含有605個功能性缺失。其中,3個基因與人類疾病相關(guān)(Gigyf2,Ptpn14和Cfh),7個基因參與了11條已知代謝通路,包括補(bǔ)體和凝血級聯(lián)、藥物代謝、嗅覺轉(zhuǎn)導(dǎo)等。C1SLs小鼠遺傳結(jié)構(gòu)與近交系小鼠不同;單倍型大小與人類群體相似。以C1SLs小鼠和MGP測序的36個近交系小鼠1號染色體上的SNP數(shù)據(jù)為基礎(chǔ),通過主成分分析發(fā)現(xiàn),二者在遺傳結(jié)構(gòu)上存在顯著差異。進(jìn)一步的亞種來源于與主成分析表明,C1SLs小鼠的1號染色體為“馬賽克”結(jié)構(gòu),含有三個小鼠亞種序列,但各亞種序列貢獻(xiàn)度不一。對于C57BL/6J-Chr1~(KM)品系,其亞種與近交系小鼠相似,主要來源于M.m.domesticus。對于其它17個品系,亞種主要來源為M.m.musculus和M.m.castaneus。各亞種序列貢獻(xiàn)度與中國野生小鼠亞種地理分布相吻合,即北方以M.m.musculus為主,南方以M.m.castaneus為主;谒呐渥釉瓌t的單倍型分析結(jié)果表明,在C1SLs群體中,1號染色體上最大的單倍型長度為100 kb左右,近57%的單倍型小于1 kb,只有4%(1081個)大于10 kb,說明該群體積累了大量的歷史重組事件,可用于QTL的精細(xì)定位。此外,研究還發(fā)現(xiàn)C1SLs群體核苷酸多樣性整體高于近交系小鼠。第二,近交系小鼠與野生小鼠1號染色體選擇壓力分析。目前認(rèn)為,近交系小鼠或有意或無意的經(jīng)歷了幾十甚至上百代的人工選擇壓力,而野生小鼠可能經(jīng)歷了更多的自然選擇壓力。然而,近交系小鼠和野生小鼠受到選擇壓力的基因組區(qū)段以及相關(guān)基因目前還未有報(bào)到,二者之間是否存不同的選擇模式也需要進(jìn)一步的調(diào)查研究。研究以Tajima's D和Fst兩種統(tǒng)計(jì)學(xué)分析為手段,對C1SLs和MGP兩個小鼠群體的1號染色體進(jìn)行了選擇壓力分析。對于Tajima's D,在C1SLs群體中共鑒定149個受到選擇壓力的區(qū)段,序列總長為7.125 Mb;MGP群體中則發(fā)現(xiàn)243個選擇信號,序列總長為13.27 Mb。比較發(fā)現(xiàn),只有13個蛋白編碼基因同時存在于C1SLs和MGP的鑒定的選擇壓力區(qū)段內(nèi)。其中,9個基因的選擇方向在兩個群體中截然相反。此外,通過對候選基因功能富集分析,發(fā)現(xiàn)部分基因顯著富集于神經(jīng)管形態(tài)發(fā)生、嗅覺信號轉(zhuǎn)導(dǎo)等生物學(xué)通路。對于Fst統(tǒng)計(jì)分析結(jié)果,共發(fā)現(xiàn)110個受到選擇壓力的候選區(qū)段,包含47個蛋白編碼基因。其中,多數(shù)基因參與調(diào)控了行為、生長發(fā)育、體重、體長、免疫或衰老等生物學(xué)過程。這些結(jié)果表明,近交系小鼠與野生小鼠經(jīng)歷了不同的選擇壓力,受到選擇壓力的基因功能與兩個群體間的表型差異相吻合。第三,B6-Chr1~(KM)小鼠遺傳變異與結(jié)構(gòu)解析。作為我國最大的遠(yuǎn)交系小鼠群體,KM小鼠在我國生物醫(yī)學(xué)研究中具有重要的地位,但針對KM小鼠的遺傳背景以及亞種來源時至今日仍然未被解析。在對C1SLs小鼠群體整體遺傳結(jié)構(gòu)解析的基礎(chǔ)上,本部分內(nèi)容主要分析了B6-Chr1~(KM)小鼠的全基因組重測序數(shù)據(jù)。其中,該品系的1號染色體來源于KM小鼠。在B6-Chr1~(KM)小鼠1號染色體上鑒定了48萬個SNPs和96679個indels。其中,6.4%的SNPs和16.3%的indels為新發(fā)現(xiàn)的遺傳突變。功能注釋發(fā)現(xiàn)474個突變對基因功能有潛在的影響。其中,21個基因參與調(diào)控了49個人類疾病相關(guān)的表型,如黃斑變性、乳腺癌以及免疫缺陷等疾病。為了解析KM小鼠的亞種來源,我們比較了B6-Chr1~(KM)小鼠1號染色體與三個小鼠亞種序列的相似度。結(jié)果顯示,B6-Chr1~(KM)小鼠與WSB(M.m.domesticus)存在較高的序列相似性,同時發(fā)現(xiàn)B6-Chr1~(KM)與PWK(M.m.musculus)序列相似性呈現(xiàn)出兩個峰值,表明M.m.musculus亞種序列可能滲入到了KM小鼠的1號染色體內(nèi)。此外,以500 kb為區(qū)段、100 kb步長的序列相似性分析結(jié)果表明B6-Chr1~(KM)小鼠1號染色體上有13.5%和6.4%的序列分別與PWK和CAST(M.m.castaneus)存在較高的序列相似性(99.7%)。為了進(jìn)一步了解B6-Chr1~(KM) 1號染色體系統(tǒng)發(fā)生樹的不一致性,我們對1號染色體進(jìn)行了貝葉斯一致性分析。結(jié)果顯示,87.7%的位點(diǎn)的后驗(yàn)概率支持KM/WSB拓?fù)浣Y(jié)構(gòu);9.7%支持KM/PWK拓?fù)浣Y(jié)構(gòu)。結(jié)合序列相似性分析和貝葉斯一致性分析結(jié)果,最終明確了KM小鼠的基因組序列主要來源于M.m.domesticus亞種,部分序列來源于M.m.musculus亞種。第四,血脂相關(guān)QTLs內(nèi)候選基因的鑒定。選取C1SLs群體中13個品系以及受體品系C57BL/6J,通過飼喂高脂誘導(dǎo)飼料和對照飼料,評估了總膽固醇(cholesterol,CHOL)、高密度脂蛋白膽固醇(high density lipoprotein cholesterol,HDL-C)、低密度脂蛋白膽固醇(low density lipoprotein cholesterol,LDL-C)以及甘油三酯(triglyceride,TG)在該群體中的表型多樣性。結(jié)果顯示,血脂水平在C1SLs小鼠和C57BL/6J之間存在顯著差異。部分小鼠血脂易于誘導(dǎo),而部分則誘導(dǎo)前后未發(fā)生顯著變化,表現(xiàn)出較高的耐受性。通過表達(dá)差異基因分析和關(guān)聯(lián)分析,鑒定部分已知血脂QTLs內(nèi)的候選基因。一方面,選取對照組中3個與受體品系表型存在顯著差異的C1SLs小鼠品系,與C57BL/6J小鼠肝臟轉(zhuǎn)錄組表達(dá)水平進(jìn)行比較,在已知QTLs內(nèi)鑒定42個蛋白編碼基因和24個非編碼RNA存在表達(dá)差異。其中,Spp1、Cd68、Cd74、Csf1r、Acacb、Aldh1a7和Akr1c19基因與已知血脂調(diào)控基因Soat1存在相互作用關(guān)系。在CHOL、HDL-C和LDL-C相關(guān)QTLs內(nèi),Gm70、Gm16432、Lyplal1、Actg-ps1和Aldh1a7在3個C1SLs小鼠品系中表達(dá)趨勢一致。對于TG,一個蛋白編碼基因(Acacb)和兩個非編碼RNA基因同時在B6-Chr1~(KM)和B6-Chr1SJ表達(dá)量降低。此外,基因型-表型關(guān)聯(lián)分析結(jié)果顯示,在替換系和近交系群體中分別鑒定41和69個功能性SNP與血脂性狀顯著相關(guān)。其中,3個基因同時存在于兩個群體中,分別為與CHOL相關(guān)的Cfap126基因、與LDL-C相關(guān)的1700025G04Rik基因以及與TG相關(guān)的Rbm44基因。
[Abstract]:......
【學(xué)位授予單位】:東華大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2017
【分類號】:Q78
,
本文編號:1578610
本文鏈接:http://sikaile.net/kejilunwen/jiyingongcheng/1578610.html
最近更新
教材專著