基于特征提取方法的p53家族基因信息表達及分析
本文選題:p53家族基因 + CGR; 參考:《江南大學》2017年碩士論文
【摘要】:p53基因是迄今為止發(fā)現(xiàn)與腫瘤相關性最高的基因,家族成員p63、p73在結(jié)構和功能上與其具有很高的同源性,因此如何使用有效的數(shù)學方法挖掘更準確的p53家族的生物信息,將對腫瘤的預防和控制具有重要意義。本文以p53家族的mRNA完整CDS序列為研究對象,采用特征提取方法對序列的表達信息進行識別,并運用層次聚類分析方法對p53家族基因序列進行分析。具體工作概括如下:(1)基因簽名是一種新興的基于特征提取的基因表達信息識別方法,能夠有效的識別基因的一些生物信息。本文在原基于CGR方法的基因簽名上,引入具有一定物理特性的核苷酸游離電子平均能量(EIIP),建立了一種新的E基因簽名方法。同時,定義兩序列間的E歐氏距離及e均方差公式,并對相關物種進行層次聚類分析。通過對16個物種的p53家族基因mRNA完整CDS序列進行E基因簽名得出,在每種基因中均有物種關系越近,基因簽名相似度越高的結(jié)論。(2)除了根據(jù)CGR圖形構造原理進行基因簽名外,本文還利用CGR方法構造一個12維特征向量對mRNA序列進行數(shù)值刻畫,并定義了歐氏距離為序列間的距離。再依據(jù)此歐氏距離對16個物種的p53家族基因序列進行層次聚類分析,并將聚類結(jié)果與原來僅利用8維特征向量得到的聚類結(jié)果作對比,發(fā)現(xiàn)使用12維特征向量刻畫基因序列的方法更合理。(3)為避免序列有效信息的丟失,綜合序列CGR游走,平均功率譜,EIIP值和堿基實數(shù)化4個特征指標,建立一種多指標物種相似性分析方法,并對多個物種的p53家族基因的mRNA序列作出聚類譜系圖進行層次聚類分析。聚類結(jié)果與實際相符,說明使用四重特征指標方法對基因序列進行刻畫,能夠較全面反映序列的生物信息。
[Abstract]:P53 gene is the gene most closely related to tumor so far. The family member p63 p73 has high homology in structure and function, so how to use effective mathematical method to mine more accurate biological information of p53 family. It will be of great significance to the prevention and control of tumor. In this paper, the mRNA complete CDS sequence of p53 family is taken as the research object, the expression information of the sequence is identified by feature extraction method, and the p53 family gene sequence is analyzed by hierarchical cluster analysis. The specific work is summarized as follows: (1) Gene signature is a new method of gene expression information recognition based on feature extraction, which can effectively recognize some biological information of gene. In this paper, based on the CGR method, a new E gene signature method is established by introducing the nucleotide free electron mean energy (EIIP) with certain physical characteristics. At the same time, the E Euclidean distance and the e mean square error formula between the two sequences are defined, and the related species are analyzed by hierarchical clustering. Based on the E gene signature of mRNA complete CDS sequence of p53 family gene from 16 species, it is concluded that the closer the species relationship is in each gene, the higher the similarity of gene signature is. In this paper, the CGR method is used to construct a 12-dimensional eigenvector to characterize the mRNA sequence, and the Euclidean distance is defined as the distance between the sequences. Based on the Euclidean distance, the p53 family gene sequences of 16 species were analyzed by hierarchical cluster analysis, and the results were compared with those obtained by using only 8-dimensional eigenvector. It is found that it is more reasonable to use 12-dimensional eigenvector to depict gene sequences. In order to avoid the loss of effective information of sequences, we found that the synthetic sequence CGR walks, the average power spectrum of EIIIP values and the real number of bases are converted into four characteristic indexes, so as to avoid the loss of effective information of the sequences. A multi-index species similarity analysis method was established, and the mRNA sequences of p53 family genes of multiple species were analyzed by hierarchical cluster analysis. The clustering results are consistent with the actual results, which shows that the method of quadruple characteristic index can reflect the biological information of the sequence completely.
【學位授予單位】:江南大學
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:Q811.4
【相似文獻】
相關期刊論文 前10條
1 王崇高;陳吉祥;胡升庠;趙新潮;盧明;;RAS相關結(jié)構家族基因1克隆及序列分析[J];醫(yī)學研究生學報;2009年09期
2 王玉紅;徐立華;李軍;;玉米TCP家族基因生物信息學鑒定與分析[J];山東農(nóng)業(yè)科學;2014年04期
3 白英男;馮丹丹;林軍岳;馮娟;任正隆;;GAST家族基因及蛋白研究進展[J];生物技術通報;2011年11期
4 陳宣茂,孫朝輝,應康,謝毅;Rab家族基因的背景資料[J];云南大學學報(自然科學版);1999年S3期
5 ;父母都偏心[J];大科技(百科新說);2014年03期
6 孫洪波;賈貞;韓天富;;PEBP家族基因在植物發(fā)育調(diào)控中的作用[J];植物生理學通訊;2009年08期
7 朱巖;彭振英;張斌;畢玉平;;PEBP家族基因在植物中功能的研究進展[J];山東農(nóng)業(yè)科學;2013年02期
8 王其強;談承杰;晏寒冰;朱平;;基于堿基三周期性研究P53家族基因的特征[J];生物物理學報;2013年04期
9 周蓮潔;張富春;王艷;;GRAS家族基因在植物生長、代謝及逆境脅迫中的功能研究進展[J];植物生理學報;2013年09期
10 段龍飛;慕小倩;李文燕;;茉莉酸信號途徑中轉(zhuǎn)錄抑制因子JAZ蛋白家族的分子進化分析[J];植物學報;2013年06期
相關會議論文 前8條
1 郭靜;韓生成;;煙草JAZ家族基因的克隆及功能分析[A];2009中國植物學會植物細胞生物學學術年會論文摘要集[C];2009年
2 張文正;鄒俊杰;宋蓮芬;馬淑英;李群;武維華;;擬南芥CPK家族基因功能初步研究[A];中國遺傳學會植物遺傳與基因組學專業(yè)委員會2005年學術研討會論文摘要集[C];2005年
3 周曉今;李潔;程偉;劉海;李萌萌;張元;李文博;韓生成;王英典;;水稻ADP核糖基化因子(OsARF)家族基因的預測和表達研究[A];2009中國植物學會植物細胞生物學學術年會論文摘要集[C];2009年
4 黃貝;聶品;齊志濤;徐鎮(zhèn);;脊椎動物干擾素調(diào)節(jié)因子(IRF)家族基因起源進化初探[A];2008年中國水產(chǎn)學會學術年會論文摘要集[C];2008年
5 李文林;楊國宇;李宏基;郭豫杰;魯維飛;;豬Reg家族基因的克隆與原核表達[A];全國動物生理生化第十一次學術交流會論文摘要匯編[C];2010年
6 豐勝求;夏濤;甘莉;陳小冬;雷霆;楊在清;;豬Angptl家族基因的克隆、表達及調(diào)控研究[A];湖北省暨武漢市生物化學與分子生物學學會第八屆第十七次學術年會論文匯編[C];2007年
7 田望;侯聰聰;李樂攻;;OsHKT1;1和OsHKT1;5(SKC1)的電生理特性和調(diào)節(jié)[A];中國植物生理學會第十次會員代表大會暨全國學術年會論文摘要匯編[C];2009年
8 李敏;郭遲鳴;張玉霞;趙婷婷;崔欣欣;王換樂;陳亮;;DUF1644家族基因SIDP364&SIDP361在鹽脅迫應答中的功能研究[A];全國園藝植物生長繁育技術及應用研討會論文集[C];2012年
相關博士學位論文 前2條
1 李秋蘋;OsHAP家族基因的功能研究和粒形基因GL3.2的圖位克隆[D];華中農(nóng)業(yè)大學;2016年
2 金丹;豬Sirtuin家族基因的克隆及脂肪生成中SIRT3的功能研究[D];華中農(nóng)業(yè)大學;2013年
相關碩士學位論文 前10條
1 張超;84K楊HD2亞家族基因的克隆與表達分析[D];東北林業(yè)大學;2015年
2 Nguyen Thi Hung(阮氏興);小麥IQD家族基因的克隆及功能研究[D];西北農(nóng)林科技大學;2015年
3 沈雷定;MiR156家族基因在柑橘階段發(fā)育以及成花調(diào)控中的作用[D];華中農(nóng)業(yè)大學;2015年
4 王燕;飛蝗表皮蛋白Obstructor家族基因的分子特性及功能研究[D];山西大學;2015年
5 顏麗美;GIS家族基因調(diào)控擬南芥開花的分子作用機制的初步研究[D];浙江大學;2014年
6 韓小東;高粱ERECTA家族基因的克隆及其干旱脅迫相對表達水平的分析[D];江西農(nóng)業(yè)大學;2015年
7 姚文;福州若干野生蕉ISSR分析、離體繁殖及APX克隆與表達分析[D];福建農(nóng)林大學;2015年
8 陳蘭平;甘蔗蔗糖磷酸合成酶家族基因演化和功能研究[D];福建師范大學;2015年
9 潘舒;水稻OsTHE1家族基因結(jié)構與功能的研究[D];華中農(nóng)業(yè)大學;2013年
10 田麗梅;番茄IMPα/β和LYK家族基因的鑒定、表達模式分析和功能研究[D];浙江大學;2016年
,本文編號:1881333
本文鏈接:http://sikaile.net/kejilunwen/jiyingongcheng/1881333.html