基于全基因組測序的中緬邊境惡性瘧原蟲種群結(jié)構(gòu)研究
發(fā)布時間:2020-06-13 17:48
【摘要】:瘧疾是一種由瘧原蟲感染所導(dǎo)致的、嚴(yán)重危害世界公共衛(wèi)生安全的蚊媒寄生蟲病。近年來全球瘧疾防治取得了巨大的成效,但是依然面臨著重大的挑戰(zhàn)。世界衛(wèi)生組織自2006年以來,推薦青蒿素類藥物與長效抗瘧藥聯(lián)用,用于治療對多種抗瘧藥物產(chǎn)生抗性的惡性瘧原蟲,但是在東南亞各國及我國云南邊境地區(qū)已經(jīng)報道了惡性瘧原蟲對青蒿素類藥物敏感性降低,更是為瘧疾防治敲響了警鐘。隨著測序技術(shù)的進(jìn)步,國際上已經(jīng)有幾千株非洲、東南亞流行區(qū)域的惡性瘧原蟲全基因組測序數(shù)據(jù),惡性瘧原蟲的各項研究提供了便利,但是,對于我國中緬邊境地區(qū)惡性瘧原蟲,其基因組信息仍未知。因此本課題對中緬邊境地區(qū)惡性瘧原蟲基因組展開深度分析,建立基因組遺傳數(shù)據(jù)庫,并且與其他國家地區(qū)惡性瘧原蟲基因組進(jìn)行比較尋找差異,在此基礎(chǔ)上建立地域判別模型,從而為這些國家地區(qū)惡性瘧原蟲的溯源打下基礎(chǔ)。本課題采集了46株來自我國中緬邊境拉咱地區(qū)的惡性瘧原蟲蟲株,經(jīng)過體外培養(yǎng)、基因組抽提、全基因組測序獲取其基因組數(shù)據(jù)后進(jìn)行數(shù)據(jù)分析,以惡性瘧原蟲3D7株基因組為參考序列進(jìn)行比對,并用ESTMOI程序進(jìn)行多重感染檢測,挑選出34株蟲株(mapping率大于70%,測序深度大于30,且單一感染),之后從國外數(shù)據(jù)庫中下載其他國家地區(qū)的惡性瘧原蟲基因組數(shù)據(jù),同樣方法挑選出來自泰緬(40株)、泰柬(56株)、西非(33株)地區(qū)的129株惡性瘧原蟲。對163株惡性瘧原蟲基因組使用GATK軟件進(jìn)行SNP變異檢測,并設(shè)定一系列條件挑選高質(zhì)量的SNP位點(diǎn),共得到150761個高質(zhì)量SNP,其中中緬、泰緬、泰柬、西非四個種群分別檢測到59720、42264、39196、90669個SNP位點(diǎn),其中4個種群共有的SNP為11849個,中緬地區(qū)特有的SNP為21662個;谏鲜龈哔|(zhì)量SNP,使用PopGenome程序包計算不同種群的核苷酸多樣性(π),其中中緬種群的π值顯著高于泰柬,與泰緬、西非的π值沒有顯著差異。使用PopLDdecay軟件計算所有SNP之間連鎖不平衡(LD)系數(shù)的均值(窗口值為1kb),構(gòu)建基于的LD衰減圖譜,發(fā)現(xiàn)值隨著距離的增大而衰減,不同種群LD衰減速率不同,衰減速率為:西非中緬泰緬泰柬,中緬、泰緬、泰柬、西非四個種群的值衰減至0.2的距離分別為120bp、250bp、350bp、70bp左右。四個種群的LD衰減速率與π值大小順序一致,這說明四個種群的遺傳多樣性大小順序為:西非中緬泰緬泰柬。使用PopGenome程序?qū)χ芯拹盒辕懺x種群進(jìn)行中性檢驗,結(jié)果顯示中緬種群Tajima’s D值(-0.8,P0.05)和FuLi’s D值(-0.84,p0.05)均顯著為負(fù),說明中緬惡性瘧原蟲群體在歷史和近期可能經(jīng)歷過負(fù)向選擇或者種群擴(kuò)張。使用rehh程序包中的整合單倍型得分(integrated haplotypescore,iHS)方法對中緬惡性瘧原蟲種群進(jìn)行選擇信號檢測,取||值前1%的位點(diǎn),在全基因組范圍內(nèi)共篩選到78個受選擇壓力的基因,其中含有2個以上SNP的基因有32個。這32個基因中有15個功能未知,其余17個基因包含有一些疫苗候選基因如ama1、trap、celtos,藥物抗性相關(guān)基因如ubp1,膜基因和表面蛋白基因如clag3.2、surfin家族基因,ARK家族基因如ark3。以中緬種群為參考群體,分別與泰緬、泰柬、西非三個種群進(jìn)行種群間的擴(kuò)展單倍型純合度(XPEHH)檢驗,取||值前1%的位點(diǎn),共篩選到含有2個以上SNP位點(diǎn)的基因90個,與泰緬、泰柬、西非三個種群比較均檢測trap、trep和ark3基因,選擇作用在中緬種群中,與泰緬、泰柬兩個東南亞種群比較均檢測到了ama1等9個基因,與西非種群比較檢測到了cg1等41個基因。之后我們對4個地區(qū)惡性瘧原蟲種群結(jié)構(gòu)進(jìn)行分析,用PopGenome程序計算F_(st)值,結(jié)果顯示西非與中緬、泰柬、泰緬3個種群之間存在較大的遺傳分化,中緬與泰緬之間的遺傳分化程度最小。使用MEGA6.0軟件中的Phylogeny程序構(gòu)建了系統(tǒng)發(fā)育樹-鄰接樹(Neighbor-Joining Tree,NJ樹),結(jié)果顯示163個蟲株分為四個種群,除2株泰緬蟲株位于中緬種群內(nèi),其余均與地域來源保持一致。使用plink和gcta軟件進(jìn)行主成分分析,計算SNP數(shù)據(jù)矩陣的特征向量,結(jié)果顯示163個蟲株同樣分為四個種群,西非與中緬、泰柬、泰緬蟲株距離較遠(yuǎn),泰柬種群較為分散,中緬與泰緬蟲株距離最近。使用ADMIXTURE(version 1.3.0)軟件進(jìn)行惡性瘧原蟲群體結(jié)構(gòu)的分類,K值取2-10進(jìn)行計算,當(dāng)K值為6時,分群效果最佳,西非、中緬、泰緬地區(qū)惡性瘧原蟲種群較為單一,泰柬地區(qū)惡性瘧原蟲內(nèi)部存在亞群;谇懊娴慕Y(jié)果,我們進(jìn)一步尋找能夠區(qū)分4個種群來源蟲株的SNP組合標(biāo)記,采用plink軟件對四個種群的SNP進(jìn)行兩兩比較分析,挑選每兩個種群之間差異顯著的前100個位點(diǎn)組成差異顯著位點(diǎn)集,用SPSS軟件對位點(diǎn)集內(nèi)的132個保守區(qū)域位點(diǎn)(內(nèi)含子,基因間隔,四倍簡并位點(diǎn))進(jìn)行逐步判別分析,最終得到33個SNP位點(diǎn)作為判別指標(biāo)構(gòu)成判別模型,再通過回代檢驗、交叉驗證和新樣本(51株)檢驗三種形式對判別函數(shù)的可靠性進(jìn)行了評價,四個種群蟲株回代檢驗的準(zhǔn)確率為100%,交叉驗證準(zhǔn)確率為96.69%,新樣本預(yù)測總體正確率為88%,因此這33個SNP位點(diǎn)的組合可以很好地應(yīng)用于這4個地區(qū)來源惡性瘧原蟲的溯源。
【圖文】:
SNP 質(zhì)量控制TK 軟件獲得 163 株惡性瘧原蟲蟲株樣本的 SNP 集后,用 VC據(jù)進(jìn)行質(zhì)量控制,剔除不符合質(zhì)量要求的 SNP。高質(zhì)量 SNP種等位基因;SNP 基因型檢出率(Call rate)大于 95%;質(zhì)量值 base quality 大于 30;過濾掉總測序深度大于 2000×或者小于 果測序深度太高可能反映的是拷貝數(shù)變異,,而深度太低可能會去掉亞端粒區(qū)域以及 rifin、var、stevor 等高突變基因[24];對于子,主要基因和次要基因比值大于 60%的用主要基因替換,其基因隨機(jī)替換,在這一步驟中,去掉單個位點(diǎn)測序深度小于 5控后 163 個蟲株樣本共有 150761 個染色體 SNP,從中提取每緬、泰緬、泰柬、西非四個種群分別有 59720、42264、391P,僅在中緬檢測出的 SNP 數(shù)為 21662,占整個中緬 SNP 的 1大部分 SNP 的等位基因頻率位于(0,0.05]區(qū)間內(nèi)(詳見圖 3.2)情況如圖 3.3 所示,14 號染色體上最多,13 號染色體次之。
圖 3.2 四個惡性瘧原蟲種群的 SNP 頻率分布圖圖 3.3 四個惡性瘧原蟲種群的 SNP 在染色體上的分布圖三、遺傳多樣性分布基于中緬、泰緬、泰柬、西非四個種群的高質(zhì)量 SNP 集,我們使用 R 語言的數(shù)據(jù)包分別計算單個種群每條染色體的核苷酸多樣性π值,并繪制四個種群π值分布圖(圖 3.4),π值越大,說明種群的遺傳變異程度越高。研究結(jié)果顯示,中緬惡性瘧原蟲的平均π值為 ,泰緬惡性瘧原蟲的平均π值為 ,泰柬惡性瘧原
【學(xué)位授予單位】:中國人民解放軍海軍軍醫(yī)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:R382.31
本文編號:2711525
【圖文】:
SNP 質(zhì)量控制TK 軟件獲得 163 株惡性瘧原蟲蟲株樣本的 SNP 集后,用 VC據(jù)進(jìn)行質(zhì)量控制,剔除不符合質(zhì)量要求的 SNP。高質(zhì)量 SNP種等位基因;SNP 基因型檢出率(Call rate)大于 95%;質(zhì)量值 base quality 大于 30;過濾掉總測序深度大于 2000×或者小于 果測序深度太高可能反映的是拷貝數(shù)變異,,而深度太低可能會去掉亞端粒區(qū)域以及 rifin、var、stevor 等高突變基因[24];對于子,主要基因和次要基因比值大于 60%的用主要基因替換,其基因隨機(jī)替換,在這一步驟中,去掉單個位點(diǎn)測序深度小于 5控后 163 個蟲株樣本共有 150761 個染色體 SNP,從中提取每緬、泰緬、泰柬、西非四個種群分別有 59720、42264、391P,僅在中緬檢測出的 SNP 數(shù)為 21662,占整個中緬 SNP 的 1大部分 SNP 的等位基因頻率位于(0,0.05]區(qū)間內(nèi)(詳見圖 3.2)情況如圖 3.3 所示,14 號染色體上最多,13 號染色體次之。
圖 3.2 四個惡性瘧原蟲種群的 SNP 頻率分布圖圖 3.3 四個惡性瘧原蟲種群的 SNP 在染色體上的分布圖三、遺傳多樣性分布基于中緬、泰緬、泰柬、西非四個種群的高質(zhì)量 SNP 集,我們使用 R 語言的數(shù)據(jù)包分別計算單個種群每條染色體的核苷酸多樣性π值,并繪制四個種群π值分布圖(圖 3.4),π值越大,說明種群的遺傳變異程度越高。研究結(jié)果顯示,中緬惡性瘧原蟲的平均π值為 ,泰緬惡性瘧原蟲的平均π值為 ,泰柬惡性瘧原
【學(xué)位授予單位】:中國人民解放軍海軍軍醫(yī)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:R382.31
【參考文獻(xiàn)】
相關(guān)期刊論文 前7條
1 張逸龍;潘衛(wèi)慶;;惡性瘧原蟲對青蒿素產(chǎn)生抗性的研究進(jìn)展[J];中國寄生蟲學(xué)與寄生蟲病雜志;2015年06期
2 張麗;周水森;豐俊;房文;夏志貴;;2014年全國瘧疾疫情分析[J];中國寄生蟲學(xué)與寄生蟲病雜志;2015年05期
3 張麗;豐俊;夏志貴;;2013年全國瘧疾疫情分析[J];中國寄生蟲學(xué)與寄生蟲病雜志;2014年06期
4 趙紹敏;王滿元;;惡性瘧原蟲對青蒿素類藥物產(chǎn)生耐藥性的全球現(xiàn)狀和基礎(chǔ)研究[J];中國寄生蟲學(xué)與寄生蟲病雜志;2014年05期
5 夏志貴;豐俊;周水森;;2012年全國瘧疾疫情分析[J];中國寄生蟲學(xué)與寄生蟲病雜志;2013年06期
6 夏志貴;楊曼尼;周水森;;2011年全國瘧疾疫情分析[J];中國寄生蟲學(xué)與寄生蟲病雜志;2012年06期
7 陳佩惠;;瘧原蟲的生活史[J];生物學(xué)通報;1992年08期
本文編號:2711525
本文鏈接:http://sikaile.net/yixuelunwen/jichuyixue/2711525.html
最近更新
教材專著