魚類基因組中MITEs轉(zhuǎn)座子的鑒定與演化分析
發(fā)布時間:2020-10-30 22:05
轉(zhuǎn)座子(Transposable elements,TEs)是一類能夠在基因組中移動的DNA重復(fù)序列,它主要分為兩類,一類是以“復(fù)制和粘貼”的方式進(jìn)行轉(zhuǎn)座的逆轉(zhuǎn)錄轉(zhuǎn)座子(RNA轉(zhuǎn)座子),另一類是以“剪切和粘貼”的方式進(jìn)行轉(zhuǎn)座的DNA轉(zhuǎn)座子。微型反向重復(fù)轉(zhuǎn)座元件(Miniature inverted-repeat transposable elements,MITEs)主要是指DNA轉(zhuǎn)座子中不能自主進(jìn)行轉(zhuǎn)座的一類轉(zhuǎn)座子,長度一般為50到800 bp,其序列兩端有一段典型的末端反向重復(fù)序列(TIR)和靶位點(diǎn)重復(fù)序列(TSD)。MITEs在脊椎動物基因組中拷貝數(shù)很高,通常分布在基因附近。目前對于MITEs的含量、多樣性、分布和轉(zhuǎn)座機(jī)制都有較為深入的認(rèn)識。魚類的物種數(shù)(大于30,000種)占整個脊椎動物物種數(shù)一半以上,它也是海洋和淡水生態(tài)系統(tǒng)重要組成部分,主要包含無頜類、軟骨魚類、肉鰭魚類和輻鰭魚類。在魚類演化歷史中,基因復(fù)制非常頻繁,復(fù)制的基因和基因組對物種進(jìn)化和形成都產(chǎn)生影響。隨著下一代測序技術(shù)的發(fā)展,魚類基因組數(shù)據(jù)被陸續(xù)公布,為我們研究的開展提供了契機(jī)。轉(zhuǎn)座子在魚類基因組的含量很高,比如斑馬魚(Danio rerio)基因組中58%都是轉(zhuǎn)座子,所以轉(zhuǎn)座子是魚類基因組的重要組成部分。MITEs是轉(zhuǎn)座子中特殊的一類,目前,植物、昆蟲、病毒都構(gòu)建了相關(guān)的MITEs轉(zhuǎn)座子庫,但對魚類的MITEs轉(zhuǎn)座子還沒有一個較為系統(tǒng)的預(yù)測。因此完成魚類代表物種基因組MITEs轉(zhuǎn)座子的準(zhǔn)確注釋和相關(guān)基因分析,將有助于對魚類的深入研究。本研究中我們選取了34種具代表性的魚類(無頜類3種、軟骨魚類2種、肉鰭魚類1種、輻鰭魚類28種)和文昌魚(Branchiostoma belcheri)的基因組,運(yùn)用生物信息學(xué)方法對這些物種基因組中的MITEs進(jìn)行鑒定和比較基因組學(xué)分析,主要研究結(jié)果如下:(1)魚類基因組中MITEs的鑒定、分類和含量我們從NCBI中下載了全基因組數(shù)據(jù),通過MITE-Hunter等軟件預(yù)測魚類基因組中的MITEs轉(zhuǎn)座子并構(gòu)建一致序列,然后通過TIR、TSD的序列特征對預(yù)測得到的MITEs轉(zhuǎn)座子進(jìn)行分類。結(jié)果表明,魚類基因組中主要含有的MITEs超家族有:Tc1-Mariner、PHIS、P、Kobolok、PiggyBac、hAT、Ginger、CMC、Merlin、Sola2,其中Tc1-Mariner超家族占比最大。分析MITEs轉(zhuǎn)座子含量與相應(yīng)物種基因組大小的關(guān)系,發(fā)現(xiàn)兩者并無相關(guān)性。(2)MITEs在基因組中的擴(kuò)增模式根據(jù)K2P模型(Kimura 2 parameter distances)計算全長拷貝序列在基因組中的插入時間。發(fā)現(xiàn)在魚類的演化過程中,出現(xiàn)了一到兩次的MITEs轉(zhuǎn)座子爆發(fā)事件,多數(shù)物種的轉(zhuǎn)座子爆發(fā)發(fā)生在2-0.5百萬年前,并且系統(tǒng)發(fā)育關(guān)系較近的物種,MITEs的擴(kuò)增情況類似。無頜類的蒲氏盲鰻(Eptatretus burgeri)、日本七鰓鰻(Lethenteron camtschaticum)、海七鰓鰻(Petromyzon marinus)、軟骨魚類的猬鰩(Leucoraja erinacea)和肉鰭魚類的矛尾魚(Latimeria chalumnae),這五種魚類的MITEs爆發(fā)都發(fā)生在1.5-0.5百萬年前。輻鰭魚類最近一次MITEs轉(zhuǎn)座子爆發(fā)發(fā)生在2.5-1.5百萬年前,墨西哥麗脂鯉(Astyanax mexicanus)、斑馬魚、羅非魚(Oreochromis niloticus)、象鼻魚(Paramormyrops kingsleyae)和犀角金線鲃(Sinocyclocheilus rhinocerous)出現(xiàn)了兩次MITEs爆發(fā)期。由于MITEs需要借助其他轉(zhuǎn)座子的轉(zhuǎn)座酶進(jìn)行轉(zhuǎn)座,我們篩選了相應(yīng)魚類基因組中與MITEs具有一致TIR序列的長拷貝,最終在14種魚類基因組中發(fā)現(xiàn)了72條自主型轉(zhuǎn)座子,包含兩個超家族:Tc1-Mariner和hAT,其中大部分自主型轉(zhuǎn)座子是具有DD34E結(jié)構(gòu)的Tc1-Mariner。(3)魚類基因組中MITEs鄰近基因分析選取的35個物種中,只有25種有注釋信息文件可以進(jìn)行MITEs插入位置和鄰近基因分析。結(jié)果表明完整的MITEs在魚類基因組中主要插入到基因的3'和5'端。同時,發(fā)現(xiàn)MITEs存在插入到基因內(nèi)部的情況,并有多個拷貝插入到基因的外顯子中。另外,不同魚類基因組中的MITEs轉(zhuǎn)座子會插入到相同基因,說明魚類MITEs轉(zhuǎn)座子的靶位點(diǎn)具有一定的相似性。根據(jù)各個物種在AnnotationHub中對應(yīng)的注釋信息數(shù)據(jù)庫,將被MITEs插入的基因進(jìn)行GO富集分析,由于MITEs很多插入到未注釋的新基因中,因此只得到12個物種的GO富集結(jié)果。其中斑馬魚、斑點(diǎn)叉尾鮰(Ictalurus punctatus)、弗氏假鰓鳉(Nothobranchius furzeri)、大西洋鮭(Salmo salar)都富集到與GTP酶活性相關(guān)的多個term中,象鼻魚(Paramormyrops kingsleyae)、日本青鳉(Oryzias latipes)富集到一個與ATP酶活性相關(guān)的term,墨西哥麗脂鯉和弗氏假鰓鳉都富集到基因在蛋白激酶活性的term中。綜上所述,本研究對部分魚類基因組的MITEs進(jìn)行預(yù)測、構(gòu)建一致序列、分類,進(jìn)一步分析基因組大小和MITEs含量的關(guān)系。計算MITEs的插入時間來研究MITEs在魚類基因組的擴(kuò)增情況,確定MITEs的插入位置來探討MITEs相關(guān)基因的功能。研究結(jié)果豐富了脊椎動物MITEs轉(zhuǎn)座子數(shù)據(jù),填補(bǔ)了魚類MITEs轉(zhuǎn)座子演化研究的空白,有助于促進(jìn)魚類基因組中MITEs的功能研究。
【學(xué)位單位】:西南大學(xué)
【學(xué)位級別】:碩士
【學(xué)位年份】:2019
【中圖分類】:Q958.8
【部分圖文】:
圖 1.1 轉(zhuǎn)座子的轉(zhuǎn)座機(jī)制(Lisch, 2012)Figure 1.1 Transposition mechanism of TEs (Lisch, 2012)terminal repeat, LTR)、盤基網(wǎng)菌屬的中等重復(fù)序列(Dictyostelium intermediaterepeatsequence,DIRS)、PLE 轉(zhuǎn)座子(Penelope-likeelement,PLE)、長散在元件(Longinterspersed nuclear elements, LINE)和短散在元件(Short interspersed nuclearelements,SINE)(圖 1.2)。其中 LTR 轉(zhuǎn)座子兩端具有長末端重復(fù)序列,LINE 兩端沒有長末端重復(fù),但這兩種逆轉(zhuǎn)錄轉(zhuǎn)座子內(nèi)部序列含有多種編碼序列的酶,能夠自主進(jìn)行轉(zhuǎn)座。而 SINE 無編碼序列,需要依靠 LINE 提供的反轉(zhuǎn)座酶進(jìn)行轉(zhuǎn)座(Kramerov & Vassetzky, 2011)。Class Ⅱ:DNA 轉(zhuǎn)座子,它通過“剪切和粘貼(Cutandpaste) 的方式進(jìn)行轉(zhuǎn)座,具體過程是轉(zhuǎn)座子先在供體位點(diǎn)被直接切除(Physically excise),然后在轉(zhuǎn)座酶的作用下重新整合到靶位點(diǎn),同時宿主會修復(fù)轉(zhuǎn)座子切除引起的雙鏈斷裂,實(shí)現(xiàn)轉(zhuǎn)座子的有效復(fù)制(Feschotte & Pritham, 2007; Lisch, 2012)(圖 1.1)。它主要包含以下四個類型(圖 1.2):TIR 型轉(zhuǎn)座子(Terminal inverted repeat, TIR)、Helitron、
3圖 1.2 轉(zhuǎn)座子分類體系(Piegu et al., 2015)Figure 1.2 Classification system for transposable elements (TEs) (Piegu et al., 2015)置,頸環(huán)結(jié)構(gòu)解開從而完成轉(zhuǎn)座(Kapitonov & Jurka, 2007; Lisch, 2012)(圖1.1)。對轉(zhuǎn)座子的分類,最初基于 1989 年 Finnegan 提出的分類系統(tǒng),他認(rèn)為可以通過有無轉(zhuǎn)座媒介將轉(zhuǎn)座子分為兩類:RNA 型(I 類或逆轉(zhuǎn)錄轉(zhuǎn)座子)和 DNA 型(II類或 DNA 轉(zhuǎn)座子)(Finnegan,1989)。這種分類方式被大家所認(rèn)可,但這種粗略的分類不能滿足越來越深入的轉(zhuǎn)座子研究需要,2005 年時,Jurka 等人建立 Repbase
圖 1.4 MITEs 的典型結(jié)構(gòu)(Hu et al., 2018)Figure 1.4 Typical structure of MITEs (Hu et al., 2018),憑借 TIR 序列來定位 MITEs,它只能檢測已知的 MITEs 序列(Santia002)。MAK 是基于轉(zhuǎn)座子的特征序列進(jìn)行預(yù)測,它通過確定已知的自主 TIR 序列和轉(zhuǎn)座酶序列將 MITE 和自主轉(zhuǎn)座子聯(lián)系起來(Yang&Hall,200NSPO 和 MAK 兩個軟件則更適用于已知類別的 MITEs 鑒定,對未知的 M檢測不到。MUST 最初的版本(Chen,2009),也是用結(jié)構(gòu)性預(yù)測的方法,Es 有很高的敏感度,但是它和 FINDMITE 很像,會檢測到有 TIR 和 TSDEs 的序列,其假陽性很高。后來開發(fā)團(tuán)隊(duì)使用 C++對它進(jìn)行了優(yōu)化,開Tv2,提高序列匹配閾值,降低了預(yù)測結(jié)果假陽性比例(Geetal.,2017)。Mer 能夠直接對整個基因組數(shù)據(jù)進(jìn)行處理,它的運(yùn)行時間比 MUST 要短,自動生成轉(zhuǎn)座子的一致序列,并分類到已知的家族;同時,MITE-Hunt
【參考文獻(xiàn)】
本文編號:2863057
【學(xué)位單位】:西南大學(xué)
【學(xué)位級別】:碩士
【學(xué)位年份】:2019
【中圖分類】:Q958.8
【部分圖文】:
圖 1.1 轉(zhuǎn)座子的轉(zhuǎn)座機(jī)制(Lisch, 2012)Figure 1.1 Transposition mechanism of TEs (Lisch, 2012)terminal repeat, LTR)、盤基網(wǎng)菌屬的中等重復(fù)序列(Dictyostelium intermediaterepeatsequence,DIRS)、PLE 轉(zhuǎn)座子(Penelope-likeelement,PLE)、長散在元件(Longinterspersed nuclear elements, LINE)和短散在元件(Short interspersed nuclearelements,SINE)(圖 1.2)。其中 LTR 轉(zhuǎn)座子兩端具有長末端重復(fù)序列,LINE 兩端沒有長末端重復(fù),但這兩種逆轉(zhuǎn)錄轉(zhuǎn)座子內(nèi)部序列含有多種編碼序列的酶,能夠自主進(jìn)行轉(zhuǎn)座。而 SINE 無編碼序列,需要依靠 LINE 提供的反轉(zhuǎn)座酶進(jìn)行轉(zhuǎn)座(Kramerov & Vassetzky, 2011)。Class Ⅱ:DNA 轉(zhuǎn)座子,它通過“剪切和粘貼(Cutandpaste) 的方式進(jìn)行轉(zhuǎn)座,具體過程是轉(zhuǎn)座子先在供體位點(diǎn)被直接切除(Physically excise),然后在轉(zhuǎn)座酶的作用下重新整合到靶位點(diǎn),同時宿主會修復(fù)轉(zhuǎn)座子切除引起的雙鏈斷裂,實(shí)現(xiàn)轉(zhuǎn)座子的有效復(fù)制(Feschotte & Pritham, 2007; Lisch, 2012)(圖 1.1)。它主要包含以下四個類型(圖 1.2):TIR 型轉(zhuǎn)座子(Terminal inverted repeat, TIR)、Helitron、
3圖 1.2 轉(zhuǎn)座子分類體系(Piegu et al., 2015)Figure 1.2 Classification system for transposable elements (TEs) (Piegu et al., 2015)置,頸環(huán)結(jié)構(gòu)解開從而完成轉(zhuǎn)座(Kapitonov & Jurka, 2007; Lisch, 2012)(圖1.1)。對轉(zhuǎn)座子的分類,最初基于 1989 年 Finnegan 提出的分類系統(tǒng),他認(rèn)為可以通過有無轉(zhuǎn)座媒介將轉(zhuǎn)座子分為兩類:RNA 型(I 類或逆轉(zhuǎn)錄轉(zhuǎn)座子)和 DNA 型(II類或 DNA 轉(zhuǎn)座子)(Finnegan,1989)。這種分類方式被大家所認(rèn)可,但這種粗略的分類不能滿足越來越深入的轉(zhuǎn)座子研究需要,2005 年時,Jurka 等人建立 Repbase
圖 1.4 MITEs 的典型結(jié)構(gòu)(Hu et al., 2018)Figure 1.4 Typical structure of MITEs (Hu et al., 2018),憑借 TIR 序列來定位 MITEs,它只能檢測已知的 MITEs 序列(Santia002)。MAK 是基于轉(zhuǎn)座子的特征序列進(jìn)行預(yù)測,它通過確定已知的自主 TIR 序列和轉(zhuǎn)座酶序列將 MITE 和自主轉(zhuǎn)座子聯(lián)系起來(Yang&Hall,200NSPO 和 MAK 兩個軟件則更適用于已知類別的 MITEs 鑒定,對未知的 M檢測不到。MUST 最初的版本(Chen,2009),也是用結(jié)構(gòu)性預(yù)測的方法,Es 有很高的敏感度,但是它和 FINDMITE 很像,會檢測到有 TIR 和 TSDEs 的序列,其假陽性很高。后來開發(fā)團(tuán)隊(duì)使用 C++對它進(jìn)行了優(yōu)化,開Tv2,提高序列匹配閾值,降低了預(yù)測結(jié)果假陽性比例(Geetal.,2017)。Mer 能夠直接對整個基因組數(shù)據(jù)進(jìn)行處理,它的運(yùn)行時間比 MUST 要短,自動生成轉(zhuǎn)座子的一致序列,并分類到已知的家族;同時,MITE-Hunt
【參考文獻(xiàn)】
相關(guān)期刊論文 前1條
1 許紅恩;張化浩;韓民錦;沈以紅;黃先智;向仲懷;張澤;;真核生物轉(zhuǎn)座子鑒定和分類計算方法[J];遺傳;2012年08期
本文編號:2863057
本文鏈接:http://sikaile.net/projectlw/swxlw/2863057.html
最近更新
教材專著