基于特征提取方法的p53家族基因信息表達(dá)及分析
本文選題:p53家族基因 + CGR; 參考:《江南大學(xué)》2017年碩士論文
【摘要】:p53基因是迄今為止發(fā)現(xiàn)與腫瘤相關(guān)性最高的基因,家族成員p63、p73在結(jié)構(gòu)和功能上與其具有很高的同源性,因此如何使用有效的數(shù)學(xué)方法挖掘更準(zhǔn)確的p53家族的生物信息,將對(duì)腫瘤的預(yù)防和控制具有重要意義。本文以p53家族的mRNA完整CDS序列為研究對(duì)象,采用特征提取方法對(duì)序列的表達(dá)信息進(jìn)行識(shí)別,并運(yùn)用層次聚類分析方法對(duì)p53家族基因序列進(jìn)行分析。具體工作概括如下:(1)基因簽名是一種新興的基于特征提取的基因表達(dá)信息識(shí)別方法,能夠有效的識(shí)別基因的一些生物信息。本文在原基于CGR方法的基因簽名上,引入具有一定物理特性的核苷酸游離電子平均能量(EIIP),建立了一種新的E基因簽名方法。同時(shí),定義兩序列間的E歐氏距離及e均方差公式,并對(duì)相關(guān)物種進(jìn)行層次聚類分析。通過(guò)對(duì)16個(gè)物種的p53家族基因mRNA完整CDS序列進(jìn)行E基因簽名得出,在每種基因中均有物種關(guān)系越近,基因簽名相似度越高的結(jié)論。(2)除了根據(jù)CGR圖形構(gòu)造原理進(jìn)行基因簽名外,本文還利用CGR方法構(gòu)造一個(gè)12維特征向量對(duì)mRNA序列進(jìn)行數(shù)值刻畫,并定義了歐氏距離為序列間的距離。再依據(jù)此歐氏距離對(duì)16個(gè)物種的p53家族基因序列進(jìn)行層次聚類分析,并將聚類結(jié)果與原來(lái)僅利用8維特征向量得到的聚類結(jié)果作對(duì)比,發(fā)現(xiàn)使用12維特征向量刻畫基因序列的方法更合理。(3)為避免序列有效信息的丟失,綜合序列CGR游走,平均功率譜,EIIP值和堿基實(shí)數(shù)化4個(gè)特征指標(biāo),建立一種多指標(biāo)物種相似性分析方法,并對(duì)多個(gè)物種的p53家族基因的mRNA序列作出聚類譜系圖進(jìn)行層次聚類分析。聚類結(jié)果與實(shí)際相符,說(shuō)明使用四重特征指標(biāo)方法對(duì)基因序列進(jìn)行刻畫,能夠較全面反映序列的生物信息。
[Abstract]:P53 gene is the gene most closely related to tumor so far. The family member p63 p73 has high homology in structure and function, so how to use effective mathematical method to mine more accurate biological information of p53 family. It will be of great significance to the prevention and control of tumor. In this paper, the mRNA complete CDS sequence of p53 family is taken as the research object, the expression information of the sequence is identified by feature extraction method, and the p53 family gene sequence is analyzed by hierarchical cluster analysis. The specific work is summarized as follows: (1) Gene signature is a new method of gene expression information recognition based on feature extraction, which can effectively recognize some biological information of gene. In this paper, based on the CGR method, a new E gene signature method is established by introducing the nucleotide free electron mean energy (EIIP) with certain physical characteristics. At the same time, the E Euclidean distance and the e mean square error formula between the two sequences are defined, and the related species are analyzed by hierarchical clustering. Based on the E gene signature of mRNA complete CDS sequence of p53 family gene from 16 species, it is concluded that the closer the species relationship is in each gene, the higher the similarity of gene signature is. In this paper, the CGR method is used to construct a 12-dimensional eigenvector to characterize the mRNA sequence, and the Euclidean distance is defined as the distance between the sequences. Based on the Euclidean distance, the p53 family gene sequences of 16 species were analyzed by hierarchical cluster analysis, and the results were compared with those obtained by using only 8-dimensional eigenvector. It is found that it is more reasonable to use 12-dimensional eigenvector to depict gene sequences. In order to avoid the loss of effective information of sequences, we found that the synthetic sequence CGR walks, the average power spectrum of EIIIP values and the real number of bases are converted into four characteristic indexes, so as to avoid the loss of effective information of the sequences. A multi-index species similarity analysis method was established, and the mRNA sequences of p53 family genes of multiple species were analyzed by hierarchical cluster analysis. The clustering results are consistent with the actual results, which shows that the method of quadruple characteristic index can reflect the biological information of the sequence completely.
【學(xué)位授予單位】:江南大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類號(hào)】:Q811.4
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 王崇高;陳吉祥;胡升庠;趙新潮;盧明;;RAS相關(guān)結(jié)構(gòu)家族基因1克隆及序列分析[J];醫(yī)學(xué)研究生學(xué)報(bào);2009年09期
2 王玉紅;徐立華;李軍;;玉米TCP家族基因生物信息學(xué)鑒定與分析[J];山東農(nóng)業(yè)科學(xué);2014年04期
3 白英男;馮丹丹;林軍岳;馮娟;任正隆;;GAST家族基因及蛋白研究進(jìn)展[J];生物技術(shù)通報(bào);2011年11期
4 陳宣茂,孫朝輝,應(yīng)康,謝毅;Rab家族基因的背景資料[J];云南大學(xué)學(xué)報(bào)(自然科學(xué)版);1999年S3期
5 ;父母都偏心[J];大科技(百科新說(shuō));2014年03期
6 孫洪波;賈貞;韓天富;;PEBP家族基因在植物發(fā)育調(diào)控中的作用[J];植物生理學(xué)通訊;2009年08期
7 朱巖;彭振英;張斌;畢玉平;;PEBP家族基因在植物中功能的研究進(jìn)展[J];山東農(nóng)業(yè)科學(xué);2013年02期
8 王其強(qiáng);談承杰;晏寒冰;朱平;;基于堿基三周期性研究P53家族基因的特征[J];生物物理學(xué)報(bào);2013年04期
9 周蓮潔;張富春;王艷;;GRAS家族基因在植物生長(zhǎng)、代謝及逆境脅迫中的功能研究進(jìn)展[J];植物生理學(xué)報(bào);2013年09期
10 段龍飛;慕小倩;李文燕;;茉莉酸信號(hào)途徑中轉(zhuǎn)錄抑制因子JAZ蛋白家族的分子進(jìn)化分析[J];植物學(xué)報(bào);2013年06期
相關(guān)會(huì)議論文 前8條
1 郭靜;韓生成;;煙草JAZ家族基因的克隆及功能分析[A];2009中國(guó)植物學(xué)會(huì)植物細(xì)胞生物學(xué)學(xué)術(shù)年會(huì)論文摘要集[C];2009年
2 張文正;鄒俊杰;宋蓮芬;馬淑英;李群;武維華;;擬南芥CPK家族基因功能初步研究[A];中國(guó)遺傳學(xué)會(huì)植物遺傳與基因組學(xué)專業(yè)委員會(huì)2005年學(xué)術(shù)研討會(huì)論文摘要集[C];2005年
3 周曉今;李潔;程偉;劉海;李萌萌;張?jiān)?李文博;韓生成;王英典;;水稻ADP核糖基化因子(OsARF)家族基因的預(yù)測(cè)和表達(dá)研究[A];2009中國(guó)植物學(xué)會(huì)植物細(xì)胞生物學(xué)學(xué)術(shù)年會(huì)論文摘要集[C];2009年
4 黃貝;聶品;齊志濤;徐鎮(zhèn);;脊椎動(dòng)物干擾素調(diào)節(jié)因子(IRF)家族基因起源進(jìn)化初探[A];2008年中國(guó)水產(chǎn)學(xué)會(huì)學(xué)術(shù)年會(huì)論文摘要集[C];2008年
5 李文林;楊國(guó)宇;李宏基;郭豫杰;魯維飛;;豬Reg家族基因的克隆與原核表達(dá)[A];全國(guó)動(dòng)物生理生化第十一次學(xué)術(shù)交流會(huì)論文摘要匯編[C];2010年
6 豐勝求;夏濤;甘莉;陳小冬;雷霆;楊在清;;豬Angptl家族基因的克隆、表達(dá)及調(diào)控研究[A];湖北省暨武漢市生物化學(xué)與分子生物學(xué)學(xué)會(huì)第八屆第十七次學(xué)術(shù)年會(huì)論文匯編[C];2007年
7 田望;侯聰聰;李樂(lè)攻;;OsHKT1;1和OsHKT1;5(SKC1)的電生理特性和調(diào)節(jié)[A];中國(guó)植物生理學(xué)會(huì)第十次會(huì)員代表大會(huì)暨全國(guó)學(xué)術(shù)年會(huì)論文摘要匯編[C];2009年
8 李敏;郭遲鳴;張玉霞;趙婷婷;崔欣欣;王換樂(lè);陳亮;;DUF1644家族基因SIDP364&SIDP361在鹽脅迫應(yīng)答中的功能研究[A];全國(guó)園藝植物生長(zhǎng)繁育技術(shù)及應(yīng)用研討會(huì)論文集[C];2012年
相關(guān)博士學(xué)位論文 前2條
1 李秋蘋;OsHAP家族基因的功能研究和粒形基因GL3.2的圖位克隆[D];華中農(nóng)業(yè)大學(xué);2016年
2 金丹;豬Sirtuin家族基因的克隆及脂肪生成中SIRT3的功能研究[D];華中農(nóng)業(yè)大學(xué);2013年
相關(guān)碩士學(xué)位論文 前10條
1 張超;84K楊HD2亞家族基因的克隆與表達(dá)分析[D];東北林業(yè)大學(xué);2015年
2 Nguyen Thi Hung(阮氏興);小麥IQD家族基因的克隆及功能研究[D];西北農(nóng)林科技大學(xué);2015年
3 沈雷定;MiR156家族基因在柑橘階段發(fā)育以及成花調(diào)控中的作用[D];華中農(nóng)業(yè)大學(xué);2015年
4 王燕;飛蝗表皮蛋白Obstructor家族基因的分子特性及功能研究[D];山西大學(xué);2015年
5 顏麗美;GIS家族基因調(diào)控?cái)M南芥開(kāi)花的分子作用機(jī)制的初步研究[D];浙江大學(xué);2014年
6 韓小東;高粱ERECTA家族基因的克隆及其干旱脅迫相對(duì)表達(dá)水平的分析[D];江西農(nóng)業(yè)大學(xué);2015年
7 姚文;福州若干野生蕉ISSR分析、離體繁殖及APX克隆與表達(dá)分析[D];福建農(nóng)林大學(xué);2015年
8 陳蘭平;甘蔗蔗糖磷酸合成酶家族基因演化和功能研究[D];福建師范大學(xué);2015年
9 潘舒;水稻OsTHE1家族基因結(jié)構(gòu)與功能的研究[D];華中農(nóng)業(yè)大學(xué);2013年
10 田麗梅;番茄IMPα/β和LYK家族基因的鑒定、表達(dá)模式分析和功能研究[D];浙江大學(xué);2016年
,本文編號(hào):1881333
本文鏈接:http://sikaile.net/kejilunwen/jiyingongcheng/1881333.html