面向蛋白互作預測的序列數(shù)據(jù)特征識別研究
發(fā)布時間:2023-04-29 04:49
蛋白質(zhì)是所有生物體的基石,除少數(shù)以單體的形式發(fā)揮作用外,大部分都與其他蛋白質(zhì)協(xié)同發(fā)揮作用;跈C器學習的蛋白互作預測結(jié)合蛋白序列特征提取方法和機器學習算法,采用大規(guī)模數(shù)據(jù)統(tǒng)計方式,從整體水平上揭示蛋白質(zhì)功能、了解蛋白間相互作用機制以及發(fā)現(xiàn)新的蛋白結(jié)合規(guī)律,對“破譯分子機制”、“構(gòu)建蛋白相互作用網(wǎng)絡(luò)”、“開發(fā)藥物”和“治療優(yōu)化”等蛋白質(zhì)研究領(lǐng)域具有非常重要的指導意義。蛋白序列特征提取是蛋白互作預測首要解決問題之一,其性能的優(yōu)劣直接影響機器學習算法處理蛋白序列數(shù)據(jù)的性能。因此,如何改進特征提取方法和如何優(yōu)化機器學習算法是目前機器學習在生物信息領(lǐng)域研究中亟待解決的問題。目前,人們在采用蛋白序列特征提取與機器學習模型訓練分步開展的方式研究蛋白互作預測方面取得一系列的進展。但是,這種割裂蛋白序列特征提取與機器學習模型訓練關(guān)系的方式,未能有效提取蛋白序列的全序信息及長距效應(yīng),導致難以提高蛋白互作預測性能。本文從改進蛋白序列特征提取方法、引進機器學習模型優(yōu)化技術(shù)以及端對端蛋白互作預測等方面開展研究,以有效提高蛋白互作預測性能,促進蛋白互作預測技術(shù)在蛋白相互作用相關(guān)研究領(lǐng)域的應(yīng)用推廣。主要工作概括如下...
【文章頁數(shù)】:154 頁
【學位級別】:博士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 研究背景和意義
1.1.1 研究背景
1.1.2 研究意義
1.2 研究內(nèi)容
1.3 論文組織結(jié)構(gòu)
第2章 蛋白互作預測概述
2.1 引言
2.2 技術(shù)挑戰(zhàn)和未決問題
2.3 蛋白互作預測方法分類
2.4 基于統(tǒng)計的蛋白互作預測方法
2.4.1 基于序列的統(tǒng)計方法
2.4.2 基于結(jié)構(gòu)的統(tǒng)計方法
2.5 基于模板的蛋白互作預測方法
2.6 基于機器學習的蛋白互作預測方法
2.6.1 機器學習概述
2.6.2 基于傳統(tǒng)機器學習的蛋白互作預測
2.6.3 基于深度學習的蛋白互作預測
2.7 本章小結(jié)
第3章 序列數(shù)據(jù)特征提取方法
3.1 引言
3.2 生物序列數(shù)據(jù)及數(shù)據(jù)庫
3.2.1 生物序列數(shù)據(jù)
3.2.2 生物序列數(shù)據(jù)庫
3.3 生物序列數(shù)據(jù)特征提取及編碼
3.3.1 生物序列數(shù)據(jù)特征提取
3.3.2 生物序列數(shù)據(jù)編碼方法
3.4 基于序列矩陣的序列數(shù)據(jù)特征提取方法
3.4.1 序列矩陣編碼原理
3.4.2 相關(guān)定義及性質(zhì)
3.4.3 序列矩陣算法
3.4.4 序列矩陣編碼過程
3.5 實驗
3.5.1 蛋白質(zhì)序列數(shù)據(jù)集
3.5.2 蛋白質(zhì)序列編碼實驗流程
3.5.3 蛋白質(zhì)序列編碼實驗結(jié)果
3.6 本章小結(jié)
第4章 基于機器學習的蛋白互作預測性能研究
4.1 引言
4.2 蛋白互作預測模型構(gòu)建方法
4.2.1 數(shù)據(jù)集構(gòu)造
4.2.2 超參數(shù)選擇
4.2.3 性能評價指標
4.3 基于傳統(tǒng)機器學習的蛋白互作預測
4.3.1 基于K-最近鄰的蛋白互作預測
4.3.2 基于決策樹的蛋白互作預測
4.3.3 基于隨機森林的蛋白互作預測
4.4 基于深度學習的蛋白互作預測
4.4.1 基于聯(lián)合三聯(lián)體的DNN蛋白互作預測
4.4.2 基于自協(xié)方差的DNN蛋白互作預測
4.4.3 基于局部描述符的DNN蛋白互作預測
4.4.4 基于序列矩陣的DNN蛋白互作預測
4.5 結(jié)果及討論
4.5.1 模型性能比較
4.5.2 外部數(shù)據(jù)集上的性能
4.5.3 與現(xiàn)有方法比較
4.6 本章小結(jié)
第5章 端對端蛋白互作預測
5.1 引言
5.2 端到端學習
5.3 端對端蛋白互作預測方法
5.3.1 模型設(shè)計
5.3.2 數(shù)據(jù)預處理
5.3.3 數(shù)據(jù)集劃分
5.3.4 超參數(shù)選擇
5.3.5 模型結(jié)構(gòu)
5.4 結(jié)果及討論
5.4.1 模型性能比較
5.4.2 低相似性數(shù)據(jù)集上性能
5.4.3 與現(xiàn)有方法比較
5.5 本章小結(jié)
第6章 總結(jié)與展望
6.1 研究工作總結(jié)
6.2 未來工作展望
參考文獻
致謝
在讀期間發(fā)表的學術(shù)論文與取得的研究成果
本文編號:3805199
【文章頁數(shù)】:154 頁
【學位級別】:博士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 研究背景和意義
1.1.1 研究背景
1.1.2 研究意義
1.2 研究內(nèi)容
1.3 論文組織結(jié)構(gòu)
第2章 蛋白互作預測概述
2.1 引言
2.2 技術(shù)挑戰(zhàn)和未決問題
2.3 蛋白互作預測方法分類
2.4 基于統(tǒng)計的蛋白互作預測方法
2.4.1 基于序列的統(tǒng)計方法
2.4.2 基于結(jié)構(gòu)的統(tǒng)計方法
2.5 基于模板的蛋白互作預測方法
2.6 基于機器學習的蛋白互作預測方法
2.6.1 機器學習概述
2.6.2 基于傳統(tǒng)機器學習的蛋白互作預測
2.6.3 基于深度學習的蛋白互作預測
2.7 本章小結(jié)
第3章 序列數(shù)據(jù)特征提取方法
3.1 引言
3.2 生物序列數(shù)據(jù)及數(shù)據(jù)庫
3.2.1 生物序列數(shù)據(jù)
3.2.2 生物序列數(shù)據(jù)庫
3.3 生物序列數(shù)據(jù)特征提取及編碼
3.3.1 生物序列數(shù)據(jù)特征提取
3.3.2 生物序列數(shù)據(jù)編碼方法
3.4 基于序列矩陣的序列數(shù)據(jù)特征提取方法
3.4.1 序列矩陣編碼原理
3.4.2 相關(guān)定義及性質(zhì)
3.4.3 序列矩陣算法
3.4.4 序列矩陣編碼過程
3.5 實驗
3.5.1 蛋白質(zhì)序列數(shù)據(jù)集
3.5.2 蛋白質(zhì)序列編碼實驗流程
3.5.3 蛋白質(zhì)序列編碼實驗結(jié)果
3.6 本章小結(jié)
第4章 基于機器學習的蛋白互作預測性能研究
4.1 引言
4.2 蛋白互作預測模型構(gòu)建方法
4.2.1 數(shù)據(jù)集構(gòu)造
4.2.2 超參數(shù)選擇
4.2.3 性能評價指標
4.3 基于傳統(tǒng)機器學習的蛋白互作預測
4.3.1 基于K-最近鄰的蛋白互作預測
4.3.2 基于決策樹的蛋白互作預測
4.3.3 基于隨機森林的蛋白互作預測
4.4 基于深度學習的蛋白互作預測
4.4.1 基于聯(lián)合三聯(lián)體的DNN蛋白互作預測
4.4.2 基于自協(xié)方差的DNN蛋白互作預測
4.4.3 基于局部描述符的DNN蛋白互作預測
4.4.4 基于序列矩陣的DNN蛋白互作預測
4.5 結(jié)果及討論
4.5.1 模型性能比較
4.5.2 外部數(shù)據(jù)集上的性能
4.5.3 與現(xiàn)有方法比較
4.6 本章小結(jié)
第5章 端對端蛋白互作預測
5.1 引言
5.2 端到端學習
5.3 端對端蛋白互作預測方法
5.3.1 模型設(shè)計
5.3.2 數(shù)據(jù)預處理
5.3.3 數(shù)據(jù)集劃分
5.3.4 超參數(shù)選擇
5.3.5 模型結(jié)構(gòu)
5.4 結(jié)果及討論
5.4.1 模型性能比較
5.4.2 低相似性數(shù)據(jù)集上性能
5.4.3 與現(xiàn)有方法比較
5.5 本章小結(jié)
第6章 總結(jié)與展望
6.1 研究工作總結(jié)
6.2 未來工作展望
參考文獻
致謝
在讀期間發(fā)表的學術(shù)論文與取得的研究成果
本文編號:3805199
本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/3805199.html
最近更新
教材專著