基于深度學(xué)習(xí)的串聯(lián)質(zhì)譜蛋白質(zhì)鑒定方法研究
發(fā)布時間:2023-05-20 05:28
基于串聯(lián)質(zhì)譜的肽鑒定是蛋白質(zhì)組學(xué)的關(guān)鍵算法之一,而蛋白質(zhì)序列數(shù)據(jù)庫搜索是目前常用的肽鑒定方法。在傳統(tǒng)的蛋白質(zhì)序列數(shù)據(jù)庫搜索中,通常需要先對每個肽段進(jìn)行理論譜的構(gòu)建,只考慮了質(zhì)荷比的信息,但是與同位素峰值強(qiáng)度相關(guān)的信息被忽略了。近年來,隨著人工智能技術(shù)的飛速發(fā)展,基于深度學(xué)習(xí)的MS/MS譜預(yù)測工具顯示出了很高的準(zhǔn)確性,在提高蛋白質(zhì)序列數(shù)據(jù)庫搜索的靈敏度和準(zhǔn)確性方面具有很大的潛力。本文針對傳統(tǒng)的蛋白質(zhì)序列數(shù)據(jù)庫搜索方法,通過考慮同位素峰強(qiáng)度相關(guān)信息對搜索流程進(jìn)行優(yōu)化,主要研究內(nèi)容包括以下兩個方面:(1)評估常用基于機(jī)器學(xué)習(xí)、深度學(xué)習(xí)的譜預(yù)測工具。利用機(jī)器學(xué)習(xí)或深度學(xué)習(xí)模型進(jìn)行譜圖預(yù)測是計算蛋白質(zhì)組學(xué)的一種新興方法;谏疃葘W(xué)習(xí)的MS/MS譜預(yù)測工具在提高data-dependent acquisition(DDA)搜索引擎的靈敏度和準(zhǔn)確性,以及建立data-independent acquisition(DIA)分析的譜庫方面具有巨大的潛力。不同的工具有其獨(dú)特的算法和實現(xiàn),可能會導(dǎo)致不同的性能。因此,有必要對這些工具進(jìn)行系統(tǒng)的評估,以找出它們的偏好和內(nèi)在差異。在本研究中,我們使用具有不同碰...
【文章頁數(shù)】:73 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
注釋表
第1章 引言
1.1 基于質(zhì)譜的蛋白質(zhì)鑒定
1.2 串聯(lián)質(zhì)譜數(shù)據(jù)的生成
1.3 基于串聯(lián)質(zhì)譜數(shù)據(jù)的肽鑒定方法
1.4 研究內(nèi)容與創(chuàng)新點(diǎn)
1.5 論文的行文結(jié)構(gòu)
第2章 蛋白質(zhì)序列數(shù)據(jù)庫搜索鑒定及深度學(xué)習(xí)知識
2.1 蛋白質(zhì)序列數(shù)據(jù)庫搜索鑒定流程
2.1.1 肽鑒定流程
2.1.2 譜圖匹配打分
2.1.3 數(shù)據(jù)庫搜索參數(shù)
2.1.4 蛋白質(zhì)序列數(shù)據(jù)庫
2.1.5 蛋白質(zhì)序列數(shù)據(jù)庫搜索鑒定結(jié)果
2.2 深度學(xué)習(xí)相關(guān)知識
2.2.1 卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)
2.2.2 循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)
2.3 本章小結(jié)
第3章 MS/MS譜預(yù)測工具的綜合評估
3.1 研究背景
3.2 MS/MS譜預(yù)測方法評估方法及數(shù)據(jù)
3.2.1 用于評估的MS/MS譜預(yù)測工具
3.2.2 用于評估的公共數(shù)據(jù)集
3.2.3 公共數(shù)據(jù)集的質(zhì)譜數(shù)據(jù)重分析
3.2.4 MS/MS譜預(yù)測工具的評估策略
3.2.5 MS/MS譜預(yù)測工具在CPU和 GPU上的時間比較
3.3 MS/MS譜預(yù)測工具的評估結(jié)果及討論
3.3.1 每個數(shù)據(jù)集中MS/MS譜預(yù)測工具之間的相關(guān)性分析
3.3.2 在肽水平上MS/MS譜預(yù)測工具和真實值之間的性能評估
3.3.3 MS/MS譜預(yù)測工具在不同長度和不同電荷的肽段下與真實值之間的性能評估
3.3.4 運(yùn)行時間評估
3.4 本章小結(jié)
第4章 基于深度學(xué)習(xí)的肽鑒定方法研究
4.1 工具介紹
4.1.1 pDeep2
4.1.2 DeepNovo
4.2 肽鑒定方法及數(shù)據(jù)
4.2.1 公共數(shù)據(jù)集
4.2.2 公共數(shù)據(jù)集的質(zhì)譜數(shù)據(jù)重分析
4.2.3 數(shù)據(jù)處理流程
4.2.4 蛋白質(zhì)序列數(shù)據(jù)庫搜索鑒定流程構(gòu)建
4.3 鑒定結(jié)果及討論
4.3.1 模型訓(xùn)練結(jié)果
4.3.2 測試集鑒定結(jié)果
4.4 本章小結(jié)
第5章 總結(jié)與展望
5.1 主要工作、貢獻(xiàn)與創(chuàng)新點(diǎn)
5.1.1 主要工作
5.1.2 主要貢獻(xiàn)
5.1.3 創(chuàng)新性
5.2 后續(xù)研究工作
參考文獻(xiàn)
致謝
攻讀碩士學(xué)位期間從事的科研工作及取得的成果
本文編號:3820628
【文章頁數(shù)】:73 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
注釋表
第1章 引言
1.1 基于質(zhì)譜的蛋白質(zhì)鑒定
1.2 串聯(lián)質(zhì)譜數(shù)據(jù)的生成
1.3 基于串聯(lián)質(zhì)譜數(shù)據(jù)的肽鑒定方法
1.4 研究內(nèi)容與創(chuàng)新點(diǎn)
1.5 論文的行文結(jié)構(gòu)
第2章 蛋白質(zhì)序列數(shù)據(jù)庫搜索鑒定及深度學(xué)習(xí)知識
2.1 蛋白質(zhì)序列數(shù)據(jù)庫搜索鑒定流程
2.1.1 肽鑒定流程
2.1.2 譜圖匹配打分
2.1.3 數(shù)據(jù)庫搜索參數(shù)
2.1.4 蛋白質(zhì)序列數(shù)據(jù)庫
2.1.5 蛋白質(zhì)序列數(shù)據(jù)庫搜索鑒定結(jié)果
2.2 深度學(xué)習(xí)相關(guān)知識
2.2.1 卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)
2.2.2 循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)
2.3 本章小結(jié)
第3章 MS/MS譜預(yù)測工具的綜合評估
3.1 研究背景
3.2 MS/MS譜預(yù)測方法評估方法及數(shù)據(jù)
3.2.1 用于評估的MS/MS譜預(yù)測工具
3.2.2 用于評估的公共數(shù)據(jù)集
3.2.3 公共數(shù)據(jù)集的質(zhì)譜數(shù)據(jù)重分析
3.2.4 MS/MS譜預(yù)測工具的評估策略
3.2.5 MS/MS譜預(yù)測工具在CPU和 GPU上的時間比較
3.3 MS/MS譜預(yù)測工具的評估結(jié)果及討論
3.3.1 每個數(shù)據(jù)集中MS/MS譜預(yù)測工具之間的相關(guān)性分析
3.3.2 在肽水平上MS/MS譜預(yù)測工具和真實值之間的性能評估
3.3.3 MS/MS譜預(yù)測工具在不同長度和不同電荷的肽段下與真實值之間的性能評估
3.3.4 運(yùn)行時間評估
3.4 本章小結(jié)
第4章 基于深度學(xué)習(xí)的肽鑒定方法研究
4.1 工具介紹
4.1.1 pDeep2
4.1.2 DeepNovo
4.2 肽鑒定方法及數(shù)據(jù)
4.2.1 公共數(shù)據(jù)集
4.2.2 公共數(shù)據(jù)集的質(zhì)譜數(shù)據(jù)重分析
4.2.3 數(shù)據(jù)處理流程
4.2.4 蛋白質(zhì)序列數(shù)據(jù)庫搜索鑒定流程構(gòu)建
4.3 鑒定結(jié)果及討論
4.3.1 模型訓(xùn)練結(jié)果
4.3.2 測試集鑒定結(jié)果
4.4 本章小結(jié)
第5章 總結(jié)與展望
5.1 主要工作、貢獻(xiàn)與創(chuàng)新點(diǎn)
5.1.1 主要工作
5.1.2 主要貢獻(xiàn)
5.1.3 創(chuàng)新性
5.2 后續(xù)研究工作
參考文獻(xiàn)
致謝
攻讀碩士學(xué)位期間從事的科研工作及取得的成果
本文編號:3820628
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3820628.html
最近更新
教材專著