BRCA2相關(guān)的乳腺癌基因內(nèi)含子與外顯子探究
發(fā)布時(shí)間:2021-07-22 01:54
乳腺癌作為一種嚴(yán)重威脅女性生命與健康的癌癥,其在世界范圍內(nèi),發(fā)病率與死亡率依然處于逐年上升的趨勢(shì)。在研究中發(fā)現(xiàn)乳腺癌的發(fā)病原因主要是由于乳腺基因的突變,并且致病突變是發(fā)生在乳腺基因的外顯子(Exon)上。BRCA2 (breast cancer 2)是乳腺癌的易感基因,有研究表明,BRCA2基因的外顯子序列突變導(dǎo)致了乳腺癌的發(fā)病率提高,死亡率也會(huì)提高。因此,對(duì)BRCA2基因外顯子的研究顯得尤為重要。而現(xiàn)有的方法對(duì)BRCA2外顯子序列的預(yù)測(cè)并非完全準(zhǔn)確,本研究利用了m RNA是DNA外顯子序列轉(zhuǎn)錄結(jié)果的原理,以及內(nèi)含子與外顯子的統(tǒng)計(jì)顯著性,對(duì)BLAST比對(duì)算法進(jìn)行改進(jìn),用于預(yù)測(cè)BRCA2基因的外顯子序列與內(nèi)含子序列,并成功預(yù)測(cè)了BRCA2的外顯子序列。預(yù)測(cè)結(jié)果與NCBI中的數(shù)據(jù)比較,具有更高的可信度。
【文章來(lái)源】:基因組學(xué)與應(yīng)用生物學(xué). 2020,39(08)北大核心CSCD
【文章頁(yè)數(shù)】:8 頁(yè)
【部分圖文】:
2012年全世界女性新增癌癥患者分布
本研究算法的結(jié)果與NCBI上的數(shù)據(jù)相比較,在第6個(gè)、第7個(gè)、第9個(gè)、第10個(gè)、第11個(gè)、第12個(gè)、第13個(gè)、第16個(gè)、第17個(gè)、第21個(gè)、第22個(gè)、第23個(gè)、第24個(gè)外顯子都有1~4個(gè)核苷酸的差別,在第27個(gè)外顯子,本研究算法預(yù)測(cè)的外顯子只有1 049個(gè)核苷酸,而NCBI中的數(shù)據(jù)第27個(gè)外顯子有1 511個(gè)核苷酸,本研究算法的結(jié)果多出了第28個(gè)外顯子,其他預(yù)測(cè)外顯子序列與NCBI相同。在最終結(jié)果與m RNA的匹配結(jié)果中,出現(xiàn)了6個(gè)不匹配的核苷酸對(duì)。分別在第10個(gè)外顯子序列第17 113位核苷酸匹配為A對(duì)C,第17 795位核苷酸匹配為C對(duì)T,在第11個(gè)外顯子序列第23 439位核苷酸匹配為A對(duì)G,第25 389位核苷酸匹配為G對(duì)C,在第11個(gè)外顯子序列第83 659位核苷酸匹配為A對(duì)G,第83 663位核苷酸匹配為空位對(duì)C。本研究的不匹配核苷酸對(duì)在NCBI的數(shù)據(jù)中也有出現(xiàn),這是因?yàn)樵诨驕y(cè)序中可能會(huì)出現(xiàn)單個(gè)基因的測(cè)序錯(cuò)誤或者在轉(zhuǎn)錄過(guò)程中基因突變。NCBI中對(duì)BRCA2的預(yù)測(cè),外顯子序列長(zhǎng)度之和比BRCA2的m RNA序列的長(zhǎng)度高出462,而本研究算法覆蓋了除首位兩個(gè)核苷酸外的所有m RNA上的核苷酸,并且對(duì)比m RNA序列,本算法結(jié)果沒(méi)有多余的核苷酸序列。本研究算法數(shù)據(jù)在對(duì)比BRCA2的NCBI外顯子數(shù)據(jù)和m RNA數(shù)據(jù)后得出,本算法在對(duì)BRCA2的外顯子與內(nèi)含子預(yù)測(cè)中有較高的準(zhǔn)確率,在對(duì)短序列外顯子的預(yù)測(cè)中,準(zhǔn)確率高于長(zhǎng)序列外顯子的預(yù)測(cè)結(jié)果,并且在對(duì)27號(hào)外顯子預(yù)測(cè)結(jié)果對(duì)比后發(fā)現(xiàn),本算法能夠避免在對(duì)長(zhǎng)序列外顯子預(yù)測(cè)中,預(yù)測(cè)到多余的外顯子核苷酸序列。
通過(guò)ORF Finder找到了40個(gè)開(kāi)放性閱讀框,ORF Finder使用的驗(yàn)證方法是將開(kāi)放性閱讀框翻譯成氨基酸序列,與現(xiàn)有數(shù)據(jù)庫(kù)進(jìn)行BLASTP比對(duì),如果有與翻譯成的氨基酸有一個(gè)或者多個(gè)顯著相似序列,則該開(kāi)放性閱讀框的可信性比較高。只有ORF1的序列使用BLASTP進(jìn)行序列比對(duì)有5個(gè)高度相似的序列,因此ORF1具有高可信性。ORF1從229個(gè)核苷酸開(kāi)始到10 485個(gè)核苷酸結(jié)束,包含10 257個(gè)核苷酸。ORF4,ORF8,ORF10,ORF23分別有幾個(gè)低相似度的序列,因此不具有可信性。圖4 開(kāi)放性閱讀框
【參考文獻(xiàn)】:
期刊論文
[1]Cancer incidence and mortality in China, 2014[J]. Wanqing Chen,Kexin Sun,Rongshou Zheng,Hongmei Zeng,Siwei Zhang,Changfa Xia,Zhixun Yang,He Li,Xiaonong Zou,Jie He. Chinese Journal of Cancer Research. 2018(01)
[2]細(xì)胞周期相關(guān)基因CDKN2A、TP53、RB1和BRCA2在惡性腫瘤中的研究進(jìn)展[J]. 賀小威,徐玲. 現(xiàn)代腫瘤醫(yī)學(xué). 2018(01)
本文編號(hào):3296205
【文章來(lái)源】:基因組學(xué)與應(yīng)用生物學(xué). 2020,39(08)北大核心CSCD
【文章頁(yè)數(shù)】:8 頁(yè)
【部分圖文】:
2012年全世界女性新增癌癥患者分布
本研究算法的結(jié)果與NCBI上的數(shù)據(jù)相比較,在第6個(gè)、第7個(gè)、第9個(gè)、第10個(gè)、第11個(gè)、第12個(gè)、第13個(gè)、第16個(gè)、第17個(gè)、第21個(gè)、第22個(gè)、第23個(gè)、第24個(gè)外顯子都有1~4個(gè)核苷酸的差別,在第27個(gè)外顯子,本研究算法預(yù)測(cè)的外顯子只有1 049個(gè)核苷酸,而NCBI中的數(shù)據(jù)第27個(gè)外顯子有1 511個(gè)核苷酸,本研究算法的結(jié)果多出了第28個(gè)外顯子,其他預(yù)測(cè)外顯子序列與NCBI相同。在最終結(jié)果與m RNA的匹配結(jié)果中,出現(xiàn)了6個(gè)不匹配的核苷酸對(duì)。分別在第10個(gè)外顯子序列第17 113位核苷酸匹配為A對(duì)C,第17 795位核苷酸匹配為C對(duì)T,在第11個(gè)外顯子序列第23 439位核苷酸匹配為A對(duì)G,第25 389位核苷酸匹配為G對(duì)C,在第11個(gè)外顯子序列第83 659位核苷酸匹配為A對(duì)G,第83 663位核苷酸匹配為空位對(duì)C。本研究的不匹配核苷酸對(duì)在NCBI的數(shù)據(jù)中也有出現(xiàn),這是因?yàn)樵诨驕y(cè)序中可能會(huì)出現(xiàn)單個(gè)基因的測(cè)序錯(cuò)誤或者在轉(zhuǎn)錄過(guò)程中基因突變。NCBI中對(duì)BRCA2的預(yù)測(cè),外顯子序列長(zhǎng)度之和比BRCA2的m RNA序列的長(zhǎng)度高出462,而本研究算法覆蓋了除首位兩個(gè)核苷酸外的所有m RNA上的核苷酸,并且對(duì)比m RNA序列,本算法結(jié)果沒(méi)有多余的核苷酸序列。本研究算法數(shù)據(jù)在對(duì)比BRCA2的NCBI外顯子數(shù)據(jù)和m RNA數(shù)據(jù)后得出,本算法在對(duì)BRCA2的外顯子與內(nèi)含子預(yù)測(cè)中有較高的準(zhǔn)確率,在對(duì)短序列外顯子的預(yù)測(cè)中,準(zhǔn)確率高于長(zhǎng)序列外顯子的預(yù)測(cè)結(jié)果,并且在對(duì)27號(hào)外顯子預(yù)測(cè)結(jié)果對(duì)比后發(fā)現(xiàn),本算法能夠避免在對(duì)長(zhǎng)序列外顯子預(yù)測(cè)中,預(yù)測(cè)到多余的外顯子核苷酸序列。
通過(guò)ORF Finder找到了40個(gè)開(kāi)放性閱讀框,ORF Finder使用的驗(yàn)證方法是將開(kāi)放性閱讀框翻譯成氨基酸序列,與現(xiàn)有數(shù)據(jù)庫(kù)進(jìn)行BLASTP比對(duì),如果有與翻譯成的氨基酸有一個(gè)或者多個(gè)顯著相似序列,則該開(kāi)放性閱讀框的可信性比較高。只有ORF1的序列使用BLASTP進(jìn)行序列比對(duì)有5個(gè)高度相似的序列,因此ORF1具有高可信性。ORF1從229個(gè)核苷酸開(kāi)始到10 485個(gè)核苷酸結(jié)束,包含10 257個(gè)核苷酸。ORF4,ORF8,ORF10,ORF23分別有幾個(gè)低相似度的序列,因此不具有可信性。圖4 開(kāi)放性閱讀框
【參考文獻(xiàn)】:
期刊論文
[1]Cancer incidence and mortality in China, 2014[J]. Wanqing Chen,Kexin Sun,Rongshou Zheng,Hongmei Zeng,Siwei Zhang,Changfa Xia,Zhixun Yang,He Li,Xiaonong Zou,Jie He. Chinese Journal of Cancer Research. 2018(01)
[2]細(xì)胞周期相關(guān)基因CDKN2A、TP53、RB1和BRCA2在惡性腫瘤中的研究進(jìn)展[J]. 賀小威,徐玲. 現(xiàn)代腫瘤醫(yī)學(xué). 2018(01)
本文編號(hào):3296205
本文鏈接:http://sikaile.net/kejilunwen/jiyingongcheng/3296205.html
最近更新
教材專著