天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 自動化論文 >

多功能酶分類預測中的特征表達與融合算法研究

發(fā)布時間:2020-03-18 22:03
【摘要】:多功能酶作為一種生物催化劑在生物的各種反應中都起到了非常重要的作用。正確區(qū)分多功能酶在基因工程和細胞工程中能起到關鍵性作用。本文目的是通過多標簽分類器對多功能酶進行功能預測,由于多功能酶的預測受到數(shù)據(jù)集、特征表達、分類器的選擇影響,因此,本文從這些方面展開了研究工作。具體研究工作如下:(1)多功能酶的研究中前人構建的數(shù)據(jù)集同源性太高,在對低同源性多功能酶進行預測時精度不是很高,因此,本文構建出了較低同源性多功能酶數(shù)據(jù)集進行多功能酶的預測。(2)針對特征表達,本文提出了多重進化信息PSSM矩陣。多重進化信息PSSM矩陣相對于傳統(tǒng)的PSSM矩陣能夠表達出多功能酶序列的更多進化信息。本文還結合二維Gabor變換對PSSM矩陣進行局部特征提取。通過Gabor變換可以將PSSM矩陣進行多尺度、多方向的分解,因此,能得到PSSM更多的信息。相對于現(xiàn)有的基于PSSM矩陣的特征提取法(DPC-PSSM)本文的方法在分類效果上有一定的優(yōu)勢。基于氨基酸序列特征表達中,本文提出了二肽局部詞特征提取法,提取到的特征相對于AAC、AmPseAAC有更好的效果。(3)針對實驗中得到的多種特征信息,本文進行了特征融合。首先。運用特征抽取融合方法進行特征的融合,在特征抽取中運用到了遞歸特征消除法(RFE)。其次,將融合后的數(shù)據(jù)進行歸一化和除冗余。經(jīng)過處理后的融合特征數(shù)據(jù)在召回率、精度、F-值和平均精度這四種指標上能達到92.21%、93.73%、91.11%、97.68%。(4)針對多功能酶分類預測問題,本文使用了隨機K標簽集成分類算法,在隨機K標簽分類算法中基分類器的選擇上做了詳細的討論。本文中分別用了支持向量機分類模型(SVM)、K近鄰分類模型(KNN)、貝葉斯分類模型(NB)、隨機森林分類模型(RF)四個分類器進行實驗。通過五折交叉驗證以及四種評估指標對這些基分類器進行分析,發(fā)現(xiàn)隨機森林作為基分類器取得的性能最好。本文構建的模型與其它多標簽分類模型相比,能取得比較良好的分類效果。
【圖文】:

多功能酶


太多的多功能酶被發(fā)現(xiàn),其二、傳統(tǒng)物理化學手段的費用太高。后期技術的迅速逡逑發(fā)展學者們對多功能酶的研究更加方便。從1996年以后每年都有幾篇論文發(fā)表出逡逑來。從1986年到2018年這些年期間發(fā)表的關于多功能酶的論文數(shù)量如圖1.1所逡逑示。從國外的研宄來看(主要是通過外文庫sci檢索),最早能搜索到的論文為逡逑1978年,JK.Stoops在脂肪酸合成酶的研宄中發(fā)現(xiàn)有多功能酶參與反應,并發(fā)表逡逑出兩篇多功能酶的論文[54][55]。其后的每年都有大量的關于多功能酶的論文發(fā)表。逡逑2005年生物學家通過多序列對比分析來區(qū)分多功能酶。逡逑在多功能酶的分類預測上近些年來也有很多人運用機器學習方法來進行研究,逡逑其主要用到的分類算法是多標簽分類學習。2012年Ferrari邋L邋D利用BRKNN多逡逑標簽分類器對多功能酶進行了分類預測,在平均精度上能達到89%[37]。2014年逡逑Zuo等人在利用雙層分類模型進行多功能酶的分類研宄,其中第一層是單標簽分逡逑類器主要是判斷是不是多功能酶,第二層構建了多標簽分類器,對第一層選擇出逡逑的多功能酶進行分類預測。他們的模型得到了非常好的成果,并且預測出了多種逡逑3逡逑

同源性,功能,矩陣,氨基酸置換


邐A逡逑|逡逑圖3.2:邋85%的同源性中各功能酶的條數(shù)圖3.3:邋65%的同源性中各功能酶的條數(shù)逡逑3.邋2多重進化信息PSSM矩陣逡逑本章提到的多重進化信息PSSM矩陣,主要是運用不同的氨基酸置換矩陣來逡逑進行PSSM矩陣的生成。因為不同的氨基酸置換矩陣代表的氨基酸之間的進化信逡逑息是不同的。因此,我們通過加入的氨基酸置換矩陣的不同,就可以得到多種進逡逑化信息PSSM矩陣。得到的多種PSSM矩陣我們將其稱為多重進化信息PSSM矩逡逑陣。逡逑3.2.1多重進化信息PSSM矩陣生成原理逡逑不論是傳統(tǒng)的PSSM矩陣還是本章中提出的多重進化信息PSSM矩陣,都是逡逑要經(jīng)過多重序列對比后得到位置頻率矩陣,位置頻率矩陣表示每個位置中出現(xiàn)的逡逑相應的20種常見的氨基酸概率。位置頻率矩陣在表達序列的位置特異性上往往會逡逑出現(xiàn)很大的偏差。傳統(tǒng)的PSSM矩陣處理這種偏差時是運用概形矩陣(高度保守逡逑區(qū)域的氨基酸的置換)來進行迭代處理,直到誤差小于設定的值為止。本文中多逡逑重進化信息矩陣是往位置頻率矩陣中加入偽計數(shù)使其偏差減少。逡逑在偽計數(shù)添加的多少是一個比較難以把握的點,本章中偽計數(shù)大小的計算是逡逑通過運用氨基酸置換矩陣計算出來。因為,氨基酸置換矩陣表示的是某種進化條逡逑件下的氨基酸之間的突變。所以
【學位授予單位】:云南大學
【學位級別】:碩士
【學位授予年份】:2019
【分類號】:TP181;Q55

【參考文獻】

相關期刊論文 前2條

1 鄢凱舟;陸兵;梁鈺婷;張云開;陳桂光;梁智群;;融合酶構建技術在酶的改性以及多功能酶的構建方面的應用[J];中國生物工程雜志;2014年07期

2 孫晶京;;使用偽氨基酸模型和K近鄰分類器預測酶的分類[J];計算機工程與應用;2013年09期

相關碩士學位論文 前2條

1 魏繼翔;基于特征提取的酶識別問題研究[D];山東經(jīng)濟學院;2011年

2 黃煒娟;多功能酶的預測及結構功能模式分析[D];廈門大學;2009年



本文編號:2589249

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2589249.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶f3419***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
91亚洲精品国产一区| 日韩丝袜诱惑一区二区| 欧美日韩一区二区午夜| 视频一区二区黄色线观看| 尤物久久91欧美人禽亚洲| 国产一区二区三区丝袜不卡| 欧美成人黄色一级视频| 福利新区一区二区人口| 大伊香蕉一区二区三区| 99久久精品免费看国产高清| 国产日韩欧美综合视频| 欧美中文日韩一区久久| 久久精品中文字幕人妻中文| 午夜精品一区二区三区国产| 日本福利写真在线观看| 国产传媒一区二区三区| 中文字幕日韩无套内射| 色一欲一性一乱—区二区三区| 欧美黑人巨大一区二区三区| 麻豆果冻传媒一二三区| 日本丰满大奶熟女一区二区| 欧美午夜国产在线观看| 欧美日韩最近中国黄片| 日韩中文字幕有码午夜美女| 热久久这里只有精品视频| 91欧美日韩国产在线观看| 最新日韩精品一推荐日韩精品| 久久国产成人精品国产成人亚洲| 国产日韩欧美国产欧美日韩 | 国产在线视频好看不卡| 欧美日韩亚洲国产av| 最近日韩在线免费黄片| 婷婷激情四射在线观看视频| 麻豆视传媒短视频免费观看| 久久91精品国产亚洲| 久久经典一区二区三区| 精品老司机视频在线观看| 免费福利午夜在线观看| 国产精品午夜福利免费在线| 欧美综合色婷婷欧美激情| 国产精品免费视频视频|