MutPrimerDesign:用于人類基因編碼區(qū)域突變位點的引物設計程序
發(fā)布時間:2020-12-10 09:56
位于基因編碼區(qū)的DNA突變與基因的功能密切相關。在已知人類基因編碼區(qū)的突變位點時,如何在基因組上設計引物驗證該突變是一個重要的問題。本文利用Python語言開發(fā)了引物設計程序MutPrimerDesign。MutPrimerDesign通過解析人類基因組序列數(shù)據(jù)庫以及基因注釋信息,轉換基因編碼區(qū)坐標為基因組坐標,并調用Primer3的python程序包接口,可批量自動化完成基因突變位點的引物及探針序列設計。MutPrimerDesign使用簡便,可識別多種數(shù)據(jù)庫的基因名稱,并能夠修改引物常規(guī)參數(shù),實現(xiàn)引物的快速調整。
【文章來源】:生物信息學. 2020年03期 第169-175頁
【文章頁數(shù)】:7 頁
【部分圖文】:
MutPrimerDesign引物設計流程圖及原理
MutPrimerDesign主要由兩部分命令組成,一部分為程序主要參數(shù),包括輸入輸出以及各種依賴數(shù)據(jù)庫的定義;另一部分為引物參數(shù),主要包括引物的Tm值,長度,GC含量等(見圖2)。MutPrimerDesign接收的輸入?yún)?shù)有兩種類型。第一種,是“-i”命令,直接接收基因突變信息。每個基因突變的信息分為三個部分,以冒號分開,內容依次分別為基因名稱、突變在該基因的CDS區(qū)域坐標、突變長度。不同突變信息以逗號隔開,比如“KRAS:24:2,MET:1124:1,EGFR:2573:1”。另一種是“-f”命令,直接接收文本文件。文件中每一行為一個基因突變信息,內容與-i中突變信息格式一致。
MutPrimerDesign在設計引物時消耗內存及計算資源較小,普通的臺式機或者筆記本環(huán)境下均可以運行。為了測試軟件的運行性能和穩(wěn)定性,以Linux操作系統(tǒng)為例(系統(tǒng)版本:Linux Mint 19.3 Cinnamon;CPU:Intel Core i7-9700;內存:24 GB;存儲:1T機械硬盤),采用MutPrimerDesign軟件默認參數(shù)進行了性能測試:系統(tǒng)開機后,首次完成8個突變位點的引物設計耗時為1 m 33 s。而后當系統(tǒng)自動加載了基因組信息緩存后,無論是多基因還是單基因的100個突變位點,設計引物只需要30 s即可完成。表1 對Maki-Nevala 等文章中的9個復發(fā)突變熱點進行引物設計Table 1 Primer design for 9 recurrent hot spot mutations in works of Maki-Nevala et al. Variation ID Left Primer Right Primer Internal Oligo EGFR:2235:1_0 ATATCAGCCTTAGGTGCGGC GGATGTGGAGATGAGCAGGG TTCCCGTCGCTATCAAGGAA EGFR:2573:1_0 CCTGGCATGAACATGACCCT CATCCTCCCCTGCATGTGTT TCACAGATTTTGGGCTGGCC KRAS:34:2_0 AAAGGTACTGGTGGAGTATTTGA GGTCCTGCACCAGTAATATGC TAGTTGGAGCTGGTGGCGTA MET:1124:1_0 GGAGCCAGCCTGAATGATGA AGCACAAAAGAAGCCCTGGa ACGACTTCTTCAACAAGATCGTCA MET:3029:1_0 TCTGTAAACATCTAATGAAATGCTTGT GGGCCCAATCACTACATGCT TCCTTCATCTTACAGATCAGTTTCCT PIK3CA:1624:1_0 TCATCTGTGAATCCAGAGGGg AGGTATGGTAAAAACATGCTGAGA TCTCTGAAATCACTGAGCAGGAGA TP53:469:1_0 tcctacaGTACTCCCCTGCC GCTGCTCACCATCGCTATCT CCGCGCCATGGCCATCTA TP53:820:1_0 AAAGGACAAGGGTGGTTGGG TACCTCGCTTAGTGCTCCCT ACAGCTTTGAGGTGCGTGTT
本文編號:2908499
【文章來源】:生物信息學. 2020年03期 第169-175頁
【文章頁數(shù)】:7 頁
【部分圖文】:
MutPrimerDesign引物設計流程圖及原理
MutPrimerDesign主要由兩部分命令組成,一部分為程序主要參數(shù),包括輸入輸出以及各種依賴數(shù)據(jù)庫的定義;另一部分為引物參數(shù),主要包括引物的Tm值,長度,GC含量等(見圖2)。MutPrimerDesign接收的輸入?yún)?shù)有兩種類型。第一種,是“-i”命令,直接接收基因突變信息。每個基因突變的信息分為三個部分,以冒號分開,內容依次分別為基因名稱、突變在該基因的CDS區(qū)域坐標、突變長度。不同突變信息以逗號隔開,比如“KRAS:24:2,MET:1124:1,EGFR:2573:1”。另一種是“-f”命令,直接接收文本文件。文件中每一行為一個基因突變信息,內容與-i中突變信息格式一致。
MutPrimerDesign在設計引物時消耗內存及計算資源較小,普通的臺式機或者筆記本環(huán)境下均可以運行。為了測試軟件的運行性能和穩(wěn)定性,以Linux操作系統(tǒng)為例(系統(tǒng)版本:Linux Mint 19.3 Cinnamon;CPU:Intel Core i7-9700;內存:24 GB;存儲:1T機械硬盤),采用MutPrimerDesign軟件默認參數(shù)進行了性能測試:系統(tǒng)開機后,首次完成8個突變位點的引物設計耗時為1 m 33 s。而后當系統(tǒng)自動加載了基因組信息緩存后,無論是多基因還是單基因的100個突變位點,設計引物只需要30 s即可完成。表1 對Maki-Nevala 等文章中的9個復發(fā)突變熱點進行引物設計Table 1 Primer design for 9 recurrent hot spot mutations in works of Maki-Nevala et al. Variation ID Left Primer Right Primer Internal Oligo EGFR:2235:1_0 ATATCAGCCTTAGGTGCGGC GGATGTGGAGATGAGCAGGG TTCCCGTCGCTATCAAGGAA EGFR:2573:1_0 CCTGGCATGAACATGACCCT CATCCTCCCCTGCATGTGTT TCACAGATTTTGGGCTGGCC KRAS:34:2_0 AAAGGTACTGGTGGAGTATTTGA GGTCCTGCACCAGTAATATGC TAGTTGGAGCTGGTGGCGTA MET:1124:1_0 GGAGCCAGCCTGAATGATGA AGCACAAAAGAAGCCCTGGa ACGACTTCTTCAACAAGATCGTCA MET:3029:1_0 TCTGTAAACATCTAATGAAATGCTTGT GGGCCCAATCACTACATGCT TCCTTCATCTTACAGATCAGTTTCCT PIK3CA:1624:1_0 TCATCTGTGAATCCAGAGGGg AGGTATGGTAAAAACATGCTGAGA TCTCTGAAATCACTGAGCAGGAGA TP53:469:1_0 tcctacaGTACTCCCCTGCC GCTGCTCACCATCGCTATCT CCGCGCCATGGCCATCTA TP53:820:1_0 AAAGGACAAGGGTGGTTGGG TACCTCGCTTAGTGCTCCCT ACAGCTTTGAGGTGCGTGTT
本文編號:2908499
本文鏈接:http://sikaile.net/yixuelunwen/jichuyixue/2908499.html
最近更新
教材專著