天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于稀疏表示分類器的蛋白質(zhì)相互作用預(yù)測研究

發(fā)布時(shí)間:2021-03-27 06:26
  自然界中影響生命現(xiàn)象發(fā)生的因素多種多樣,也必然離不開蛋白質(zhì)的參與。多種蛋白質(zhì)相互作用交織成網(wǎng)絡(luò),調(diào)節(jié)重要的生命活動(dòng)。在承擔(dān)生命活動(dòng)時(shí),蛋白質(zhì)的表現(xiàn)是多樣的、動(dòng)態(tài)的,這就需要對蛋白質(zhì)之間的關(guān)系進(jìn)行研究。蛋白質(zhì)相互作用(PPI)分析研究可以幫助研究癌癥的發(fā)生機(jī)制,設(shè)計(jì)新的藥物標(biāo)靶,并支持新藥物的發(fā)展。隨著蛋白質(zhì)組學(xué)研究進(jìn)入大數(shù)據(jù)時(shí)代,生物分子學(xué)及相關(guān)領(lǐng)域研究人員迅速獲得了許多實(shí)驗(yàn)數(shù)據(jù)。然而,使用生物實(shí)驗(yàn)方法對這些數(shù)據(jù)進(jìn)行研究耗時(shí)長,成本高。鑒于此,本文采用計(jì)算方法進(jìn)行蛋白質(zhì)相互作用預(yù)測,設(shè)計(jì)了一個(gè)基于多變量互信息的蛋白質(zhì)相互作用預(yù)測模型FTCP-WSRC,主要研究工作如下:一、設(shè)計(jì)新的蛋白質(zhì)序列的表示方法FCTP模型,該模型通過F向量,C描述符和T描述符的結(jié)合,將每個(gè)蛋白質(zhì)序列映射到數(shù)字特征向量上,提取了蛋白質(zhì)序列所包含的有效信息。二、采用有效的特征提取方法主成分分析(PCA)來提取最具辨別力的新特征子集。利用PCA處理后的數(shù)據(jù)極大地降低了時(shí)間復(fù)雜度,提高了計(jì)算機(jī)對數(shù)據(jù)的處理能力。三、基于加權(quán)稀疏表示分類器(WSRC)進(jìn)行預(yù)測,得到了很好的預(yù)測結(jié)果。為了驗(yàn)證FCTP-WSRC模型的有效性,... 

【文章來源】:山東大學(xué)山東省 211工程院校 985工程院校 教育部直屬院校

【文章頁數(shù)】:53 頁

【學(xué)位級別】:碩士

【部分圖文】:

基于稀疏表示分類器的蛋白質(zhì)相互作用預(yù)測研究


圖2-2描述符C和描述符T的建立過程??對于子序列‘AATWTFAAACATAPDAADAG’,利用公式(5)二進(jìn)制編碼為??‘11000011101010011010’

過程圖,特征向量,向量,方法


?山東大學(xué)碩士學(xué)位論文???A?B??4?4??-?s??F向量+?C福或符+T指連符|??I ̄ ̄ ̄T ̄??f440堆向量j?f440維■向量j??PCA?PCA??V?v??門〇維向量J?「30維向量J??'?r?1??「60維?向量j??圖2-3?FCTP方法中特征向量的重構(gòu)過程??2.?5本章小結(jié)??本章主要介紹了蛋白質(zhì)相互作用數(shù)據(jù)集的獲取與預(yù)處理方法,給出了一個(gè)新??的蛋白質(zhì)表示方法FTCP,構(gòu)建了蛋白質(zhì)序列的數(shù)字特征向量。F向量、C描述??符和T描述相結(jié)合的方法包含了蛋白質(zhì)序列中的有效信息。為了提高模型的運(yùn)??算效率,對蛋白質(zhì)特征向量采用了有效的特征提取方法PCA,構(gòu)建了最具辨別??力的新特征子集。??15??

最優(yōu)分類面,線性可分,訓(xùn)練樣本集,標(biāo)簽


?山東大學(xué)碩士學(xué)位論文???第三章預(yù)測模型和評價(jià)方法??3.1支持向置機(jī)??目前,機(jī)器學(xué)習(xí)方法已經(jīng)被廣泛應(yīng)用于人像識別、文本分類和生物信息等需??要模式識別的各個(gè)領(lǐng)域。支持向量機(jī)(Support?Vector?Machine,?SVM)進(jìn)行有監(jiān)??督的學(xué)習(xí)[351,最早在1995年由Cortes?C.等人首次提出。這種方法本質(zhì)上基于統(tǒng)計(jì)??學(xué)中的VC維理論以及機(jī)構(gòu)風(fēng)險(xiǎn)最小化原則。支持向量機(jī)最早是一種二分類模型,??經(jīng)過演進(jìn),引入了核函數(shù),現(xiàn)在既能處理多元線性問題,也能處理非線性和回歸??問題。其優(yōu)勢表現(xiàn)在小樣本、非線性、高維數(shù)模式識別和局部極小點(diǎn)等課題。它??的思想是尋找一個(gè)最優(yōu)的超平面對樣本進(jìn)行分割,使得樣本間隔最大化,最終轉(zhuǎn)??化為一個(gè)凸二次規(guī)劃問題來求解。在線性可分情況下最優(yōu)分類面的構(gòu)造如下圖:??t??圖3-1?SVM最優(yōu)分類面的構(gòu)造??設(shè)訓(xùn)練樣本集包括N個(gè)線性可分的樣本:x?=?且為e??{+1,-1}是類別變量,±1是標(biāo)簽。支持向量機(jī)的目標(biāo)是通過找到唯一的最大化間??隔面使得分類更加精確。在線性可分的情況下,這個(gè)超平面用函數(shù)f(x)?=?o/x?+?b??表不,其中是法向重,b為位移重。+?b?2?+1時(shí),)/j?==?+1;?+?b?S?-1時(shí),??%?-1,距離超平面最近的這幾個(gè)樣本點(diǎn)滿足%(〇/;^?+?b)?=?1,它們被稱為“支??持向量”。訓(xùn)練集中存在一些異常點(diǎn)是不可避免的,這會(huì)導(dǎo)致訓(xùn)練集線性不可分。??16??


本文編號:3103062

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/benkebiyelunwen/3103062.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶5aa79***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com