天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于廣義偽氨基酸組成與圖形表示的蛋白質(zhì)序列比較與DNA結(jié)合蛋白識(shí)別

發(fā)布時(shí)間:2020-12-18 13:43
  隨著生物學(xué)技術(shù)的發(fā)展以及基因組學(xué)和蛋白質(zhì)組學(xué)研究的深入,蛋白質(zhì)序列數(shù)據(jù)的數(shù)量急速增長(zhǎng)。在過(guò)去的幾十年,蛋白質(zhì)結(jié)構(gòu)的實(shí)驗(yàn)確定技術(shù)雖然取得了巨大的進(jìn)展,但它仍然難以跟上序列信息爆炸式增長(zhǎng)的步伐。不過(guò),正如Anfinsen所發(fā)現(xiàn)的,蛋白質(zhì)在其氨基酸序列中包含了用來(lái)確定其天然構(gòu)象的足夠信息。因此,發(fā)展一種有效的理論計(jì)算方法及時(shí)地解碼蛋白質(zhì)序列并挖掘隱藏于其中的有用信息已成為生物信息學(xué)領(lǐng)域的一個(gè)重要研究?jī)?nèi)容。本文借助氨基酸的兩種重要理化性質(zhì),將一條蛋白質(zhì)序列轉(zhuǎn)化為三字母序列,進(jìn)而給出了沒(méi)有環(huán)和多重邊的簡(jiǎn)單圖表示,并提出了幾何直線鄰接矩陣和直線鄰接指標(biāo)概念。在此基礎(chǔ)上,結(jié)合序相關(guān)因子提出了蛋白質(zhì)序列的一種廣義偽氨基酸組成(Generalized PseAAC)模型來(lái)表示蛋白質(zhì)序列。利用所提出的蛋白質(zhì)序列的這一數(shù)學(xué)描述子,對(duì)17個(gè)物種的β-球蛋白和72個(gè)冠狀病毒刺突蛋白分別進(jìn)行了序列相似性比較,并在新冠狀病毒疫情下,對(duì)進(jìn)入二十一世紀(jì)以來(lái)大規(guī)模爆發(fā)的三種冠狀病毒之間的關(guān)系進(jìn)行了初步分析。同時(shí),我們提出了一種基于廣義PseAAC的支持向量機(jī)模型進(jìn)行DNA結(jié)合蛋白識(shí)別。在相同數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果表明,我們的... 

【文章來(lái)源】:渤海大學(xué)遼寧省

【文章頁(yè)數(shù)】:50 頁(yè)

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于廣義偽氨基酸組成與圖形表示的蛋白質(zhì)序列比較與DNA結(jié)合蛋白識(shí)別


圖1.支持向量機(jī)示意圖

示意圖,森林,示意圖,決策樹(shù)


基于廣義偽氨基酸組成與圖形表示的蛋白質(zhì)序列比較與DNA結(jié)合蛋白識(shí)別12部為根節(jié)點(diǎn),所有樣本經(jīng)過(guò)根節(jié)點(diǎn)后可分到各個(gè)子節(jié)點(diǎn)中,子節(jié)點(diǎn)需要用新的特征做決策,直到只包含一類(lèi)樣本的葉節(jié)點(diǎn),停止劃分[36]。最早著名的決策樹(shù)方法是ID3(InteractiveDichotomizer-3),ID3算法后,人們提出了一些改進(jìn)算法,如C4.5等。另一種決策樹(shù)算法CART(ClassificationAndRegressionTree)算法同樣非常著名,它既可以解決一些分類(lèi)問(wèn)題,也可以用構(gòu)造回歸樹(shù)的方式回歸連續(xù)變量。3.3.2隨機(jī)森林基于特定數(shù)據(jù)集隨機(jī)抽樣是具有隨機(jī)性的,這種隨機(jī)性是模式識(shí)別面臨的問(wèn)題,很多方法受到這種隨機(jī)性的影響,使得到的分類(lèi)器也具有偶然性,容易導(dǎo)致決策樹(shù)方法過(guò)學(xué)習(xí)[36]。隨機(jī)森林(如圖2)利用自舉重采樣的方法建立樣本集,用來(lái)構(gòu)造決策樹(shù),并對(duì)這些樹(shù)投票,票數(shù)最多的為最終決策。這種方法保證了構(gòu)建樹(shù)間的獨(dú)立性[39]。圖2.隨機(jī)森林示意圖Figure2.schematicdiagramofrandomforest3.4樸素貝葉斯分類(lèi)法樸素貝葉斯分類(lèi)模型將問(wèn)題分為兩類(lèi):特征向量和決策向量,并假設(shè)特征之間都是相互獨(dú)立。這種模型結(jié)構(gòu)簡(jiǎn)單,易于實(shí)現(xiàn)且分類(lèi)效果穩(wěn)定,可以降低貝葉

圖形,簡(jiǎn)單圖,圖論,碩士學(xué)位


渤海大學(xué)碩士學(xué)位論文19環(huán),也沒(méi)有多重邊,即為圖論中的簡(jiǎn)單圖。表4.三組性質(zhì)的值Table4.Thevaluesforpropertiesofthethreegroups.GroupRepresentative""GIGIIGIIIACH0.32910.28680.66930.14780.41930.08960.91220.56460.99120.40970.82530.132700.20.40.60.8100.10.20.30.40.50.60.70.80.91ACHxy圖3.20種天然氨基酸的2-D映射Fig3.The2-Dmapofthe20standardaminoacid.圖4.2-D圖形表示Fig4.The2-Dgraphicalrepresentation.


本文編號(hào):2924094

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/benkebiyelunwen/2924094.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)bd7ed***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com