基于機(jī)器學(xué)習(xí)的蛋白酶裂解位點(diǎn)的預(yù)測(cè)研究
發(fā)布時(shí)間:2023-04-09 21:54
在系統(tǒng)水平控制下,蛋白水解的調(diào)節(jié)在各種重要的細(xì)胞過程(如血液凝固、細(xì)胞增殖和細(xì)胞凋亡等)中起關(guān)鍵作用。確認(rèn)和識(shí)別蛋白酶的真實(shí)底物蛋白是我們更好地理解這一過程的機(jī)制的關(guān)鍵所在。為了解決這個(gè)問題,基于之前開發(fā)的PROSPER工具,我們開發(fā)了PROSPER2.0,用于準(zhǔn)確預(yù)測(cè)蛋白酶底物特異性及其切割位點(diǎn)。PROSPER 2.0旨在為蛋白質(zhì)裂解位點(diǎn)預(yù)測(cè)覆蓋更多的蛋白酶(多達(dá)38種蛋白酶)以及提供更好的預(yù)測(cè)性能。PROSPER 2.0在框架結(jié)構(gòu)上整合了來自多個(gè)級(jí)別的異構(gòu)的序列以及結(jié)構(gòu)的特征,同時(shí)結(jié)合了兩層的特征選擇方法。交叉驗(yàn)證和獨(dú)立測(cè)試的結(jié)果表明,PROSPER 2.0能夠?qū)崿F(xiàn)比現(xiàn)有通用工具更具競(jìng)爭力的性能,并將促進(jìn)假設(shè)驅(qū)動(dòng)的新型底物發(fā)現(xiàn)。針對(duì)基質(zhì)金屬蛋白酶(MMP)的六種蛋白酶數(shù)據(jù)集,我們提出了基于知識(shí)遷移的計(jì)算框架,通過遷移其他MMPs的隱含的有用信息來增強(qiáng)底物裂解位點(diǎn)預(yù)測(cè)的性能。該框架使用支持向量機(jī)結(jié)合遷移學(xué)習(xí)的思想和特征選擇的方法實(shí)現(xiàn)。結(jié)果表明該方法和傳統(tǒng)的特征選擇方法相比,在六個(gè)數(shù)據(jù)集上各有其優(yōu)勢(shì),為MMP底物裂解位點(diǎn)的預(yù)測(cè)提供了有用的新的思路。
【文章頁數(shù)】:97 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 論文的研究背景和意義
1.2 國內(nèi)外研究現(xiàn)狀分析
1.3 研究的主要內(nèi)容和核心問題
1.4 論文結(jié)構(gòu)
第二章 蛋白酶底物裂解位點(diǎn)數(shù)據(jù)集的構(gòu)建
2.1 引言
2.2 相關(guān)數(shù)據(jù)庫及工具
2.2.1 MEROPS數(shù)據(jù)庫
2.2.2 Uniprot數(shù)據(jù)庫
2.2.3 DAVID在線平臺(tái)
2.2.4 Gene Ontology數(shù)據(jù)庫
2.2.5 KEGG Pathway數(shù)據(jù)庫
2.2.6 CD-HIT
2.3 蛋白酶底物裂解位點(diǎn)數(shù)據(jù)集的構(gòu)建
2.4 本章小節(jié)
第三章 蛋白質(zhì)序列特征編碼及提取
3.1 引言
3.2 蛋白質(zhì)序列特征的預(yù)測(cè)計(jì)算
3.2.1 二級(jí)結(jié)構(gòu)特征的預(yù)測(cè)
3.2.2 蛋白質(zhì)序列的無序蛋白結(jié)構(gòu)信息
3.2.3 蛋白質(zhì)序列的溶劑可及性信息
3.2.4 蛋白質(zhì)序列的位置特異性打分矩陣的計(jì)算
3.3 數(shù)據(jù)集的劃分與樣本采樣
3.3.1 數(shù)據(jù)集的劃分
3.3.2 正樣本的選擇
3.3.3 負(fù)樣本的選擇
3.4 蛋白質(zhì)序列特征編碼方法
3.5 蛋白質(zhì)序列編碼流程
3.6 本章小節(jié)
第四章 特征選擇與知識(shí)遷移
4.1 引言
4.2 基于mRMR特征選擇框架的介紹
4.2.1 特征的重要性分析
4.3 知識(shí)遷移的使用
4.3.1 背景及意義
4.3.2 算法流程及描述
4.4 并行計(jì)算架構(gòu)的使用
4.5 本章小節(jié)
第五章 模型構(gòu)建及性能分析
5.1 引言
5.2 SVM算法介紹
5.3 模型評(píng)價(jià)指標(biāo)介紹
5.4 PROSPER2.0 模型的構(gòu)建和性能分析
5.4.1 數(shù)據(jù)處理及模型構(gòu)建流程圖
5.4.2 不同編碼方法的比較
5.4.3 不同工具間的比較
5.4.4 蛋白質(zhì)組掃描
5.4.5 案例研究
5.5 基于知識(shí)遷移的模型的構(gòu)建和性能分析
5.5.1 模型構(gòu)建概述
5.5.2 公共特征性能評(píng)估
5.5.3 遷移學(xué)習(xí)與特征選擇模型性能的對(duì)比
5.5.4 獨(dú)立測(cè)試
5.6 蛋白酶特異性底物裂解位點(diǎn)預(yù)測(cè)計(jì)算平臺(tái)的開發(fā)及構(gòu)建
5.7 本章小節(jié)
第六章 總結(jié)與展望
6.1 主要工作及貢獻(xiàn)
6.2 未來工作展望
參考文獻(xiàn)
致謝
攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文
本文編號(hào):3787799
【文章頁數(shù)】:97 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 論文的研究背景和意義
1.2 國內(nèi)外研究現(xiàn)狀分析
1.3 研究的主要內(nèi)容和核心問題
1.4 論文結(jié)構(gòu)
第二章 蛋白酶底物裂解位點(diǎn)數(shù)據(jù)集的構(gòu)建
2.1 引言
2.2 相關(guān)數(shù)據(jù)庫及工具
2.2.1 MEROPS數(shù)據(jù)庫
2.2.2 Uniprot數(shù)據(jù)庫
2.2.3 DAVID在線平臺(tái)
2.2.4 Gene Ontology數(shù)據(jù)庫
2.2.5 KEGG Pathway數(shù)據(jù)庫
2.2.6 CD-HIT
2.3 蛋白酶底物裂解位點(diǎn)數(shù)據(jù)集的構(gòu)建
2.4 本章小節(jié)
第三章 蛋白質(zhì)序列特征編碼及提取
3.1 引言
3.2 蛋白質(zhì)序列特征的預(yù)測(cè)計(jì)算
3.2.1 二級(jí)結(jié)構(gòu)特征的預(yù)測(cè)
3.2.2 蛋白質(zhì)序列的無序蛋白結(jié)構(gòu)信息
3.2.3 蛋白質(zhì)序列的溶劑可及性信息
3.2.4 蛋白質(zhì)序列的位置特異性打分矩陣的計(jì)算
3.3 數(shù)據(jù)集的劃分與樣本采樣
3.3.1 數(shù)據(jù)集的劃分
3.3.2 正樣本的選擇
3.3.3 負(fù)樣本的選擇
3.4 蛋白質(zhì)序列特征編碼方法
3.5 蛋白質(zhì)序列編碼流程
3.6 本章小節(jié)
第四章 特征選擇與知識(shí)遷移
4.1 引言
4.2 基于mRMR特征選擇框架的介紹
4.2.1 特征的重要性分析
4.3 知識(shí)遷移的使用
4.3.1 背景及意義
4.3.2 算法流程及描述
4.4 并行計(jì)算架構(gòu)的使用
4.5 本章小節(jié)
第五章 模型構(gòu)建及性能分析
5.1 引言
5.2 SVM算法介紹
5.3 模型評(píng)價(jià)指標(biāo)介紹
5.4 PROSPER2.0 模型的構(gòu)建和性能分析
5.4.1 數(shù)據(jù)處理及模型構(gòu)建流程圖
5.4.2 不同編碼方法的比較
5.4.3 不同工具間的比較
5.4.4 蛋白質(zhì)組掃描
5.4.5 案例研究
5.5 基于知識(shí)遷移的模型的構(gòu)建和性能分析
5.5.1 模型構(gòu)建概述
5.5.2 公共特征性能評(píng)估
5.5.3 遷移學(xué)習(xí)與特征選擇模型性能的對(duì)比
5.5.4 獨(dú)立測(cè)試
5.6 蛋白酶特異性底物裂解位點(diǎn)預(yù)測(cè)計(jì)算平臺(tái)的開發(fā)及構(gòu)建
5.7 本章小節(jié)
第六章 總結(jié)與展望
6.1 主要工作及貢獻(xiàn)
6.2 未來工作展望
參考文獻(xiàn)
致謝
攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文
本文編號(hào):3787799
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3787799.html
最近更新
教材專著