基于集成學(xué)習(xí)和遷移學(xué)習(xí)的蛋白質(zhì)泛素化和類泛素化位點預(yù)測研究

發(fā)布時間：2023-08-26 04:41

　　蛋白質(zhì)泛素化是一類典型的翻譯后修飾(PTM),它承擔(dān)著調(diào)節(jié)生命活動的重要作用,研究發(fā)現(xiàn)泛素化影響著細(xì)胞凋亡、細(xì)胞增殖和信號轉(zhuǎn)導(dǎo);蛋白質(zhì)SUMO化是一類與泛素化非常相似的翻譯后修飾,研究發(fā)現(xiàn)SUMO化與基因定位、基因表達(dá)和基因組復(fù)制有關(guān)。在過去的二十年里,機(jī)器學(xué)習(xí)相關(guān)算法已被廣泛地認(rèn)為是預(yù)測蛋白質(zhì)泛素化與SUMO化位點的有效計算方法。依據(jù)機(jī)器學(xué)習(xí)算法開發(fā)計算工具需要特征工程,現(xiàn)存工具一般依靠先驗知識人工選擇符合特定問題的特征,這些特征不具備一般性,導(dǎo)致其模型可解釋性弱。并且現(xiàn)存工具不能適應(yīng)時下日益增長的數(shù)據(jù)規(guī)模。上述因素促使本文提出了一個基于深度學(xué)習(xí)算法、有能力處理大規(guī)模數(shù)據(jù)量的蛋白質(zhì)泛素化位點預(yù)測工具,其模型集成了七個包含卷積層與全連接層的有監(jiān)督學(xué)習(xí)子模型,這些子模型可以從蛋白質(zhì)序列特征和理化屬性特征中提取深度表示。在本文中,402個理化屬性特征被分為6個聚類簇,每一個簇中的高相關(guān)性特征都被相應(yīng)地定制了子模型的深層網(wǎng)絡(luò)架構(gòu)來處理。然后,使用一個Stacking集成學(xué)習(xí)策略來綜合每一個子網(wǎng)的深度表示以完成預(yù)測蛋白質(zhì)泛素化位點的工作。此外,遷移學(xué)習(xí)技術(shù)的引入使本文提出的深度學(xué)習(xí)模型在微調(diào)后...

【文章頁數(shù)】：41 頁

【學(xué)位級別】：碩士

【文章目錄】：
摘要
Abstract
第一章緒論
    1.1 研究背景與意義
        1.1.1 翻譯后修飾
        1.1.2 泛素化與SUMO化
    1.2 研究現(xiàn)狀
    1.3 主要研究工作及行文結(jié)構(gòu)
        1.3.1 主要工作
        1.3.2 本文結(jié)構(gòu)
第二章數(shù)據(jù)集構(gòu)建與特征編碼
    2.1 數(shù)據(jù)收集
        2.1.1 Uniprot/Swiss-Prot數(shù)據(jù)庫
        2.1.2 檢索數(shù)據(jù)
    2.2 數(shù)據(jù)處理
    2.3 編碼蛋白質(zhì)序列片段
        2.3.1 One-hot編碼
        2.3.2 理化屬性編碼
第三章模型與方法
    3.1 深度學(xué)習(xí)
        3.1.1 深度學(xué)習(xí)概述
        3.1.2 模型架構(gòu)
    3.2 集成學(xué)習(xí)
        3.2.1 集成學(xué)習(xí)概述
        3.2.2 模型訓(xùn)練與集成
    3.3 Bootstrapping策略
    3.4 遷移學(xué)習(xí)
        3.4.1 遷移學(xué)習(xí)概述
        3.4.2 遷移策略
    3.5 實驗整體流程
第四章實驗結(jié)果分析與討論
    4.1 評價指標(biāo)
    4.2 模型整體性能
    4.3 理化屬性網(wǎng)絡(luò)的效果
        4.3.1 理化屬性在不同網(wǎng)絡(luò)架構(gòu)中的效果
        4.3.2 使用PCA降維理化屬性的結(jié)果
    4.4 遷移學(xué)習(xí)帶來的性能提升
        4.4.1 引入遷移學(xué)習(xí)技術(shù)的性能提升
        4.4.2 兩種遷移策略的提升對比
    4.5 與其它預(yù)測工具對比結(jié)果
第五章總結(jié)與展望
參考文獻(xiàn)
致謝
在學(xué)期間公開發(fā)表論文及著作情況

本文編號：3843974

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://sikaile.net/projectlw/swxlw/3843974.html

上一篇：分子生物學(xué)課程雙語教學(xué)改革研究
下一篇：人胚胎干細(xì)胞源神經(jīng)干細(xì)胞微囊泡對巨噬細(xì)胞極化的影響

論文發(fā)表

·知網(wǎng)|萬方|維普|龍源|省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于集成學(xué)習(xí)和遷移學(xué)習(xí)的蛋白質(zhì)泛素化和類泛素化位點預(yù)測研究