BRCA2相關(guān)的乳腺癌基因內(nèi)含子與外顯子探究
發(fā)布時(shí)間:2021-07-22 01:54
乳腺癌作為一種嚴(yán)重威脅女性生命與健康的癌癥,其在世界范圍內(nèi),發(fā)病率與死亡率依然處于逐年上升的趨勢。在研究中發(fā)現(xiàn)乳腺癌的發(fā)病原因主要是由于乳腺基因的突變,并且致病突變是發(fā)生在乳腺基因的外顯子(Exon)上。BRCA2 (breast cancer 2)是乳腺癌的易感基因,有研究表明,BRCA2基因的外顯子序列突變導(dǎo)致了乳腺癌的發(fā)病率提高,死亡率也會(huì)提高。因此,對BRCA2基因外顯子的研究顯得尤為重要。而現(xiàn)有的方法對BRCA2外顯子序列的預(yù)測并非完全準(zhǔn)確,本研究利用了m RNA是DNA外顯子序列轉(zhuǎn)錄結(jié)果的原理,以及內(nèi)含子與外顯子的統(tǒng)計(jì)顯著性,對BLAST比對算法進(jìn)行改進(jìn),用于預(yù)測BRCA2基因的外顯子序列與內(nèi)含子序列,并成功預(yù)測了BRCA2的外顯子序列。預(yù)測結(jié)果與NCBI中的數(shù)據(jù)比較,具有更高的可信度。
【文章來源】:基因組學(xué)與應(yīng)用生物學(xué). 2020,39(08)北大核心CSCD
【文章頁數(shù)】:8 頁
【部分圖文】:
2012年全世界女性新增癌癥患者分布
本研究算法的結(jié)果與NCBI上的數(shù)據(jù)相比較,在第6個(gè)、第7個(gè)、第9個(gè)、第10個(gè)、第11個(gè)、第12個(gè)、第13個(gè)、第16個(gè)、第17個(gè)、第21個(gè)、第22個(gè)、第23個(gè)、第24個(gè)外顯子都有1~4個(gè)核苷酸的差別,在第27個(gè)外顯子,本研究算法預(yù)測的外顯子只有1 049個(gè)核苷酸,而NCBI中的數(shù)據(jù)第27個(gè)外顯子有1 511個(gè)核苷酸,本研究算法的結(jié)果多出了第28個(gè)外顯子,其他預(yù)測外顯子序列與NCBI相同。在最終結(jié)果與m RNA的匹配結(jié)果中,出現(xiàn)了6個(gè)不匹配的核苷酸對。分別在第10個(gè)外顯子序列第17 113位核苷酸匹配為A對C,第17 795位核苷酸匹配為C對T,在第11個(gè)外顯子序列第23 439位核苷酸匹配為A對G,第25 389位核苷酸匹配為G對C,在第11個(gè)外顯子序列第83 659位核苷酸匹配為A對G,第83 663位核苷酸匹配為空位對C。本研究的不匹配核苷酸對在NCBI的數(shù)據(jù)中也有出現(xiàn),這是因?yàn)樵诨驕y序中可能會(huì)出現(xiàn)單個(gè)基因的測序錯(cuò)誤或者在轉(zhuǎn)錄過程中基因突變。NCBI中對BRCA2的預(yù)測,外顯子序列長度之和比BRCA2的m RNA序列的長度高出462,而本研究算法覆蓋了除首位兩個(gè)核苷酸外的所有m RNA上的核苷酸,并且對比m RNA序列,本算法結(jié)果沒有多余的核苷酸序列。本研究算法數(shù)據(jù)在對比BRCA2的NCBI外顯子數(shù)據(jù)和m RNA數(shù)據(jù)后得出,本算法在對BRCA2的外顯子與內(nèi)含子預(yù)測中有較高的準(zhǔn)確率,在對短序列外顯子的預(yù)測中,準(zhǔn)確率高于長序列外顯子的預(yù)測結(jié)果,并且在對27號外顯子預(yù)測結(jié)果對比后發(fā)現(xiàn),本算法能夠避免在對長序列外顯子預(yù)測中,預(yù)測到多余的外顯子核苷酸序列。
通過ORF Finder找到了40個(gè)開放性閱讀框,ORF Finder使用的驗(yàn)證方法是將開放性閱讀框翻譯成氨基酸序列,與現(xiàn)有數(shù)據(jù)庫進(jìn)行BLASTP比對,如果有與翻譯成的氨基酸有一個(gè)或者多個(gè)顯著相似序列,則該開放性閱讀框的可信性比較高。只有ORF1的序列使用BLASTP進(jìn)行序列比對有5個(gè)高度相似的序列,因此ORF1具有高可信性。ORF1從229個(gè)核苷酸開始到10 485個(gè)核苷酸結(jié)束,包含10 257個(gè)核苷酸。ORF4,ORF8,ORF10,ORF23分別有幾個(gè)低相似度的序列,因此不具有可信性。圖4 開放性閱讀框
【參考文獻(xiàn)】:
期刊論文
[1]Cancer incidence and mortality in China, 2014[J]. Wanqing Chen,Kexin Sun,Rongshou Zheng,Hongmei Zeng,Siwei Zhang,Changfa Xia,Zhixun Yang,He Li,Xiaonong Zou,Jie He. Chinese Journal of Cancer Research. 2018(01)
[2]細(xì)胞周期相關(guān)基因CDKN2A、TP53、RB1和BRCA2在惡性腫瘤中的研究進(jìn)展[J]. 賀小威,徐玲. 現(xiàn)代腫瘤醫(yī)學(xué). 2018(01)
本文編號:3296205
【文章來源】:基因組學(xué)與應(yīng)用生物學(xué). 2020,39(08)北大核心CSCD
【文章頁數(shù)】:8 頁
【部分圖文】:
2012年全世界女性新增癌癥患者分布
本研究算法的結(jié)果與NCBI上的數(shù)據(jù)相比較,在第6個(gè)、第7個(gè)、第9個(gè)、第10個(gè)、第11個(gè)、第12個(gè)、第13個(gè)、第16個(gè)、第17個(gè)、第21個(gè)、第22個(gè)、第23個(gè)、第24個(gè)外顯子都有1~4個(gè)核苷酸的差別,在第27個(gè)外顯子,本研究算法預(yù)測的外顯子只有1 049個(gè)核苷酸,而NCBI中的數(shù)據(jù)第27個(gè)外顯子有1 511個(gè)核苷酸,本研究算法的結(jié)果多出了第28個(gè)外顯子,其他預(yù)測外顯子序列與NCBI相同。在最終結(jié)果與m RNA的匹配結(jié)果中,出現(xiàn)了6個(gè)不匹配的核苷酸對。分別在第10個(gè)外顯子序列第17 113位核苷酸匹配為A對C,第17 795位核苷酸匹配為C對T,在第11個(gè)外顯子序列第23 439位核苷酸匹配為A對G,第25 389位核苷酸匹配為G對C,在第11個(gè)外顯子序列第83 659位核苷酸匹配為A對G,第83 663位核苷酸匹配為空位對C。本研究的不匹配核苷酸對在NCBI的數(shù)據(jù)中也有出現(xiàn),這是因?yàn)樵诨驕y序中可能會(huì)出現(xiàn)單個(gè)基因的測序錯(cuò)誤或者在轉(zhuǎn)錄過程中基因突變。NCBI中對BRCA2的預(yù)測,外顯子序列長度之和比BRCA2的m RNA序列的長度高出462,而本研究算法覆蓋了除首位兩個(gè)核苷酸外的所有m RNA上的核苷酸,并且對比m RNA序列,本算法結(jié)果沒有多余的核苷酸序列。本研究算法數(shù)據(jù)在對比BRCA2的NCBI外顯子數(shù)據(jù)和m RNA數(shù)據(jù)后得出,本算法在對BRCA2的外顯子與內(nèi)含子預(yù)測中有較高的準(zhǔn)確率,在對短序列外顯子的預(yù)測中,準(zhǔn)確率高于長序列外顯子的預(yù)測結(jié)果,并且在對27號外顯子預(yù)測結(jié)果對比后發(fā)現(xiàn),本算法能夠避免在對長序列外顯子預(yù)測中,預(yù)測到多余的外顯子核苷酸序列。
通過ORF Finder找到了40個(gè)開放性閱讀框,ORF Finder使用的驗(yàn)證方法是將開放性閱讀框翻譯成氨基酸序列,與現(xiàn)有數(shù)據(jù)庫進(jìn)行BLASTP比對,如果有與翻譯成的氨基酸有一個(gè)或者多個(gè)顯著相似序列,則該開放性閱讀框的可信性比較高。只有ORF1的序列使用BLASTP進(jìn)行序列比對有5個(gè)高度相似的序列,因此ORF1具有高可信性。ORF1從229個(gè)核苷酸開始到10 485個(gè)核苷酸結(jié)束,包含10 257個(gè)核苷酸。ORF4,ORF8,ORF10,ORF23分別有幾個(gè)低相似度的序列,因此不具有可信性。圖4 開放性閱讀框
【參考文獻(xiàn)】:
期刊論文
[1]Cancer incidence and mortality in China, 2014[J]. Wanqing Chen,Kexin Sun,Rongshou Zheng,Hongmei Zeng,Siwei Zhang,Changfa Xia,Zhixun Yang,He Li,Xiaonong Zou,Jie He. Chinese Journal of Cancer Research. 2018(01)
[2]細(xì)胞周期相關(guān)基因CDKN2A、TP53、RB1和BRCA2在惡性腫瘤中的研究進(jìn)展[J]. 賀小威,徐玲. 現(xiàn)代腫瘤醫(yī)學(xué). 2018(01)
本文編號:3296205
本文鏈接:http://www.sikaile.net/kejilunwen/jiyingongcheng/3296205.html
最近更新
教材專著