MutPrimerDesign:用于人類基因編碼區(qū)域突變位點(diǎn)的引物設(shè)計(jì)程序
發(fā)布時(shí)間:2020-12-10 09:56
位于基因編碼區(qū)的DNA突變與基因的功能密切相關(guān)。在已知人類基因編碼區(qū)的突變位點(diǎn)時(shí),如何在基因組上設(shè)計(jì)引物驗(yàn)證該突變是一個(gè)重要的問(wèn)題。本文利用Python語(yǔ)言開(kāi)發(fā)了引物設(shè)計(jì)程序MutPrimerDesign。MutPrimerDesign通過(guò)解析人類基因組序列數(shù)據(jù)庫(kù)以及基因注釋信息,轉(zhuǎn)換基因編碼區(qū)坐標(biāo)為基因組坐標(biāo),并調(diào)用Primer3的python程序包接口,可批量自動(dòng)化完成基因突變位點(diǎn)的引物及探針序列設(shè)計(jì)。MutPrimerDesign使用簡(jiǎn)便,可識(shí)別多種數(shù)據(jù)庫(kù)的基因名稱,并能夠修改引物常規(guī)參數(shù),實(shí)現(xiàn)引物的快速調(diào)整。
【文章來(lái)源】:生物信息學(xué). 2020年03期 第169-175頁(yè)
【文章頁(yè)數(shù)】:7 頁(yè)
【部分圖文】:
MutPrimerDesign引物設(shè)計(jì)流程圖及原理
MutPrimerDesign主要由兩部分命令組成,一部分為程序主要參數(shù),包括輸入輸出以及各種依賴數(shù)據(jù)庫(kù)的定義;另一部分為引物參數(shù),主要包括引物的Tm值,長(zhǎng)度,GC含量等(見(jiàn)圖2)。MutPrimerDesign接收的輸入?yún)?shù)有兩種類型。第一種,是“-i”命令,直接接收基因突變信息。每個(gè)基因突變的信息分為三個(gè)部分,以冒號(hào)分開(kāi),內(nèi)容依次分別為基因名稱、突變?cè)谠摶虻腃DS區(qū)域坐標(biāo)、突變長(zhǎng)度。不同突變信息以逗號(hào)隔開(kāi),比如“KRAS:24:2,MET:1124:1,EGFR:2573:1”。另一種是“-f”命令,直接接收文本文件。文件中每一行為一個(gè)基因突變信息,內(nèi)容與-i中突變信息格式一致。
MutPrimerDesign在設(shè)計(jì)引物時(shí)消耗內(nèi)存及計(jì)算資源較小,普通的臺(tái)式機(jī)或者筆記本環(huán)境下均可以運(yùn)行。為了測(cè)試軟件的運(yùn)行性能和穩(wěn)定性,以Linux操作系統(tǒng)為例(系統(tǒng)版本:Linux Mint 19.3 Cinnamon;CPU:Intel Core i7-9700;內(nèi)存:24 GB;存儲(chǔ):1T機(jī)械硬盤),采用MutPrimerDesign軟件默認(rèn)參數(shù)進(jìn)行了性能測(cè)試:系統(tǒng)開(kāi)機(jī)后,首次完成8個(gè)突變位點(diǎn)的引物設(shè)計(jì)耗時(shí)為1 m 33 s。而后當(dāng)系統(tǒng)自動(dòng)加載了基因組信息緩存后,無(wú)論是多基因還是單基因的100個(gè)突變位點(diǎn),設(shè)計(jì)引物只需要30 s即可完成。表1 對(duì)Maki-Nevala 等文章中的9個(gè)復(fù)發(fā)突變熱點(diǎn)進(jìn)行引物設(shè)計(jì)Table 1 Primer design for 9 recurrent hot spot mutations in works of Maki-Nevala et al. Variation ID Left Primer Right Primer Internal Oligo EGFR:2235:1_0 ATATCAGCCTTAGGTGCGGC GGATGTGGAGATGAGCAGGG TTCCCGTCGCTATCAAGGAA EGFR:2573:1_0 CCTGGCATGAACATGACCCT CATCCTCCCCTGCATGTGTT TCACAGATTTTGGGCTGGCC KRAS:34:2_0 AAAGGTACTGGTGGAGTATTTGA GGTCCTGCACCAGTAATATGC TAGTTGGAGCTGGTGGCGTA MET:1124:1_0 GGAGCCAGCCTGAATGATGA AGCACAAAAGAAGCCCTGGa ACGACTTCTTCAACAAGATCGTCA MET:3029:1_0 TCTGTAAACATCTAATGAAATGCTTGT GGGCCCAATCACTACATGCT TCCTTCATCTTACAGATCAGTTTCCT PIK3CA:1624:1_0 TCATCTGTGAATCCAGAGGGg AGGTATGGTAAAAACATGCTGAGA TCTCTGAAATCACTGAGCAGGAGA TP53:469:1_0 tcctacaGTACTCCCCTGCC GCTGCTCACCATCGCTATCT CCGCGCCATGGCCATCTA TP53:820:1_0 AAAGGACAAGGGTGGTTGGG TACCTCGCTTAGTGCTCCCT ACAGCTTTGAGGTGCGTGTT
本文編號(hào):2908499
【文章來(lái)源】:生物信息學(xué). 2020年03期 第169-175頁(yè)
【文章頁(yè)數(shù)】:7 頁(yè)
【部分圖文】:
MutPrimerDesign引物設(shè)計(jì)流程圖及原理
MutPrimerDesign主要由兩部分命令組成,一部分為程序主要參數(shù),包括輸入輸出以及各種依賴數(shù)據(jù)庫(kù)的定義;另一部分為引物參數(shù),主要包括引物的Tm值,長(zhǎng)度,GC含量等(見(jiàn)圖2)。MutPrimerDesign接收的輸入?yún)?shù)有兩種類型。第一種,是“-i”命令,直接接收基因突變信息。每個(gè)基因突變的信息分為三個(gè)部分,以冒號(hào)分開(kāi),內(nèi)容依次分別為基因名稱、突變?cè)谠摶虻腃DS區(qū)域坐標(biāo)、突變長(zhǎng)度。不同突變信息以逗號(hào)隔開(kāi),比如“KRAS:24:2,MET:1124:1,EGFR:2573:1”。另一種是“-f”命令,直接接收文本文件。文件中每一行為一個(gè)基因突變信息,內(nèi)容與-i中突變信息格式一致。
MutPrimerDesign在設(shè)計(jì)引物時(shí)消耗內(nèi)存及計(jì)算資源較小,普通的臺(tái)式機(jī)或者筆記本環(huán)境下均可以運(yùn)行。為了測(cè)試軟件的運(yùn)行性能和穩(wěn)定性,以Linux操作系統(tǒng)為例(系統(tǒng)版本:Linux Mint 19.3 Cinnamon;CPU:Intel Core i7-9700;內(nèi)存:24 GB;存儲(chǔ):1T機(jī)械硬盤),采用MutPrimerDesign軟件默認(rèn)參數(shù)進(jìn)行了性能測(cè)試:系統(tǒng)開(kāi)機(jī)后,首次完成8個(gè)突變位點(diǎn)的引物設(shè)計(jì)耗時(shí)為1 m 33 s。而后當(dāng)系統(tǒng)自動(dòng)加載了基因組信息緩存后,無(wú)論是多基因還是單基因的100個(gè)突變位點(diǎn),設(shè)計(jì)引物只需要30 s即可完成。表1 對(duì)Maki-Nevala 等文章中的9個(gè)復(fù)發(fā)突變熱點(diǎn)進(jìn)行引物設(shè)計(jì)Table 1 Primer design for 9 recurrent hot spot mutations in works of Maki-Nevala et al. Variation ID Left Primer Right Primer Internal Oligo EGFR:2235:1_0 ATATCAGCCTTAGGTGCGGC GGATGTGGAGATGAGCAGGG TTCCCGTCGCTATCAAGGAA EGFR:2573:1_0 CCTGGCATGAACATGACCCT CATCCTCCCCTGCATGTGTT TCACAGATTTTGGGCTGGCC KRAS:34:2_0 AAAGGTACTGGTGGAGTATTTGA GGTCCTGCACCAGTAATATGC TAGTTGGAGCTGGTGGCGTA MET:1124:1_0 GGAGCCAGCCTGAATGATGA AGCACAAAAGAAGCCCTGGa ACGACTTCTTCAACAAGATCGTCA MET:3029:1_0 TCTGTAAACATCTAATGAAATGCTTGT GGGCCCAATCACTACATGCT TCCTTCATCTTACAGATCAGTTTCCT PIK3CA:1624:1_0 TCATCTGTGAATCCAGAGGGg AGGTATGGTAAAAACATGCTGAGA TCTCTGAAATCACTGAGCAGGAGA TP53:469:1_0 tcctacaGTACTCCCCTGCC GCTGCTCACCATCGCTATCT CCGCGCCATGGCCATCTA TP53:820:1_0 AAAGGACAAGGGTGGTTGGG TACCTCGCTTAGTGCTCCCT ACAGCTTTGAGGTGCGTGTT
本文編號(hào):2908499
本文鏈接:http://www.sikaile.net/yixuelunwen/jichuyixue/2908499.html
最近更新
教材專著