豬全基因組變異位點功能注釋程序開發(fā)
發(fā)布時間:2021-04-18 09:31
變異位點的功能注釋是探究突變與表型間關系的重要環(huán)節(jié)。伴隨下一代測序技術的發(fā)展和測序成本的降低,大量變異位點數據被挖掘出來,這些數據是功能注釋的基礎。ENCODE計劃產生大量調控元件的實驗數據,這些數據能夠提高模式生物如人與小鼠變異位點注釋的準確性,但如何利用這些數據在其他非模式生物中預測突變影響仍是一個挑戰(zhàn)。本研究利用Python語言開發(fā)了一個變異位點功能注釋軟件,并且利用該程序對豬全基因組范圍內的變異位點做出功能注釋,主要獲得以下結果:(1)開發(fā)了一個突變位點功能注釋軟件VIP(Variant Integrated Predictor)。該軟件對位于編碼區(qū)突變如同義突變、錯義突變、無義突變、移碼與非移碼突變等能夠提供準確性100%的預測結果,并且能夠對蛋白質結構域作出預測。對位于啟動子區(qū)突變,VIP能基于Jaspar提供的轉錄因子結合序列的位置頻率矩陣提供轉錄因子結合位點變化預測。對位于3’UTR區(qū)突變,VIP能基于mi RBase提供的miRNA序列,利用加權的Smith-Waterman方式計算miRNA與3’UTR靶位點的互補分數,并且能夠利用miRDB的預測結果進一步降低注釋...
【文章來源】:華中農業(yè)大學湖北省 211工程院校 教育部直屬院校
【文章頁數】:70 頁
【學位級別】:碩士
【部分圖文】:
miRNA與靶基因的結合分數計算
體、變異位點起始與結束位置,以及變異位點兩種等位基因序列組成。實驗數據的跨物種利用跨物種基因組位置對應關系的構建chain 文件提供了兩基因組序列的比對結果,如圖 3 所示,人 hg38 版本基因組Hsa2:113,672,158-241,303,448 與豬 SusScr3 版本基因組 Ssc15:22,487,315-155,126,795有比對結果,由于比對產生的空位區(qū)域,比對結果事實上是一些非連續(xù)的片段,表示在圖 3 所示第 2 至第 10 行。根據 chain 文件的比對結果,我們開發(fā)了ConvertChainToP2P 程序用于構建物種間基因組位置對應關系(positions to positions,p2p),如圖 4 第一行所示,hg38 的 Hsa2:113,672,159 與 SusScr3 的 Ssc15:22,487,316基因組位置對應,p2p 文件也記錄了鏈的方向,并且能夠處理同一位置被多次對應的情況,最終 ConvertChainToP2P 程序將構建的結果轉換成二進制文件保存為 p2p格式文件。
hg38 版本基因組-豬 SusScr3 版本基因組位置對應文件(p2第一行顯示的為 Hsa2:113672159 與 Ssc15:22487316 有對應關系。A part content of the p2p file generated from the “hg38-SusScr3ine shows there is the positional relation between Hsa2:113672159 and Ssc1據轉移因組位置對應文件(p2p),我們開發(fā)了 ConvertToCF(convertvertCADD 及 CombineCFs 程序用于轉換、合并多樣化數據。ertToCF 程序用來轉移符合特定格式的實驗數據,包含 ENCODigWig、bedGraph、bed、bigBed 格式數據及 UCSC 提供的固定格式數據,如位點保守性分值數據(PhyloP、phastCons),數據進制形式儲存為轉移后文件(converted file, CF)。利用gdownload.cse.ucsc.edu/admin/exe/linux.x86_64/ ) 如 bigW
本文編號:3145245
【文章來源】:華中農業(yè)大學湖北省 211工程院校 教育部直屬院校
【文章頁數】:70 頁
【學位級別】:碩士
【部分圖文】:
miRNA與靶基因的結合分數計算
體、變異位點起始與結束位置,以及變異位點兩種等位基因序列組成。實驗數據的跨物種利用跨物種基因組位置對應關系的構建chain 文件提供了兩基因組序列的比對結果,如圖 3 所示,人 hg38 版本基因組Hsa2:113,672,158-241,303,448 與豬 SusScr3 版本基因組 Ssc15:22,487,315-155,126,795有比對結果,由于比對產生的空位區(qū)域,比對結果事實上是一些非連續(xù)的片段,表示在圖 3 所示第 2 至第 10 行。根據 chain 文件的比對結果,我們開發(fā)了ConvertChainToP2P 程序用于構建物種間基因組位置對應關系(positions to positions,p2p),如圖 4 第一行所示,hg38 的 Hsa2:113,672,159 與 SusScr3 的 Ssc15:22,487,316基因組位置對應,p2p 文件也記錄了鏈的方向,并且能夠處理同一位置被多次對應的情況,最終 ConvertChainToP2P 程序將構建的結果轉換成二進制文件保存為 p2p格式文件。
hg38 版本基因組-豬 SusScr3 版本基因組位置對應文件(p2第一行顯示的為 Hsa2:113672159 與 Ssc15:22487316 有對應關系。A part content of the p2p file generated from the “hg38-SusScr3ine shows there is the positional relation between Hsa2:113672159 and Ssc1據轉移因組位置對應文件(p2p),我們開發(fā)了 ConvertToCF(convertvertCADD 及 CombineCFs 程序用于轉換、合并多樣化數據。ertToCF 程序用來轉移符合特定格式的實驗數據,包含 ENCODigWig、bedGraph、bed、bigBed 格式數據及 UCSC 提供的固定格式數據,如位點保守性分值數據(PhyloP、phastCons),數據進制形式儲存為轉移后文件(converted file, CF)。利用gdownload.cse.ucsc.edu/admin/exe/linux.x86_64/ ) 如 bigW
本文編號:3145245
本文鏈接:http://sikaile.net/yixuelunwen/dongwuyixue/3145245.html
最近更新
教材專著