基于集成深度神經(jīng)網(wǎng)絡(luò)的蛋白質(zhì)棕櫚�；稽c(diǎn)預(yù)測(cè)研究

發(fā)布時(shí)間：2021-02-28 14:13

　　蛋白質(zhì)棕櫚�；堑鞍踪|(zhì)翻譯后脂質(zhì)共價(jià)修飾的一種重要形式,是調(diào)控蛋白質(zhì)的轉(zhuǎn)運(yùn)、穩(wěn)定、定位和功能的重要機(jī)制。同時(shí),棕櫚酰化位點(diǎn)修飾還參與多種細(xì)胞生物學(xué)進(jìn)程,與許多疾病的發(fā)生發(fā)展密切相關(guān)。蛋白質(zhì)棕櫚�；稽c(diǎn)預(yù)測(cè)的目標(biāo)是從蛋白質(zhì)的氨基酸序列組成信息及其理化性質(zhì)出發(fā),利用計(jì)算的方法來(lái)預(yù)測(cè)某蛋白質(zhì)是否會(huì)發(fā)生棕櫚�；�,進(jìn)而預(yù)測(cè)發(fā)生棕櫚酰化的氨基酸殘基位點(diǎn)。棕櫚�；稽c(diǎn)預(yù)測(cè)能幫助生物學(xué)家從海量的蛋白數(shù)據(jù)中快速準(zhǔn)確地識(shí)別出會(huì)發(fā)生棕櫚酰化的蛋白,發(fā)現(xiàn)在這些位點(diǎn)背后所隱藏的生物機(jī)制和規(guī)律,揭示棕櫚�；稽c(diǎn)修飾如何影響棕櫚�；鞍椎恼郫B、活性以及最終的功能等,并最終為眾多疾病機(jī)理的闡明及攻克某些疾病提供理論依據(jù)和解決途徑。因此,棕櫚�；稽c(diǎn)預(yù)測(cè)已經(jīng)成為近年來(lái)生物信息學(xué)領(lǐng)域中的一個(gè)研究熱點(diǎn)。在以往研究中,利用生物實(shí)驗(yàn)鑒別得到的棕櫚�；稽c(diǎn)較為可靠。因此,目前公開的棕櫚�；鞍讛�(shù)據(jù)普遍是由生物實(shí)驗(yàn)標(biāo)注得到。但是這些方法存在耗時(shí)耗力,成本昂貴,實(shí)驗(yàn)過(guò)程復(fù)雜等問題。近些年來(lái),隨著蛋白質(zhì)數(shù)據(jù)庫(kù)的日益龐大,單純的生物實(shí)驗(yàn)已經(jīng)無(wú)法完成海量蛋白數(shù)據(jù)的檢測(cè),機(jī)器學(xué)習(xí)算法逐漸應(yīng)用在該領(lǐng)域,使得檢測(cè)效率大大提高,但仍存在特征偏好和...

【文章來(lái)源】：東北師范大學(xué)吉林省 211工程院校教育部直屬院校

【文章頁(yè)數(shù)】：41 頁(yè)

【學(xué)位級(jí)別】：碩士

【部分圖文】：

基于集成深度神經(jīng)網(wǎng)絡(luò)的蛋白質(zhì)棕櫚酰化位點(diǎn)預(yù)測(cè)研究

Uniprot/Swiss-prot數(shù)據(jù)庫(kù)棕櫚�；鞍讛�(shù)據(jù)信息

流程圖,流程圖,算法,特征矩陣

10第三章基于集成深度神經(jīng)網(wǎng)絡(luò)的蛋白質(zhì)棕櫚�；稽c(diǎn)預(yù)測(cè)3.1模型預(yù)測(cè)流程本實(shí)驗(yàn)的整體算法流程圖如圖3.1所示，展示了本文預(yù)測(cè)蛋白質(zhì)S-棕櫚�；恼w流程，給予讀者更清晰直觀的了解。圖3.1整體算法流程圖本實(shí)驗(yàn)算法流程大致分為如下步驟：(1)從公開發(fā)表的蛋白質(zhì)數(shù)據(jù)庫(kù)中搜集本實(shí)驗(yàn)中所需棕櫚�；蛄�，并對(duì)搜集的原始數(shù)據(jù)進(jìn)行預(yù)處理。按照策略將處理好的數(shù)據(jù)進(jìn)行訓(xùn)練集測(cè)試集的劃分，同時(shí)，本實(shí)驗(yàn)采用十折交叉驗(yàn)證的方法，訓(xùn)練集中的數(shù)據(jù)隨機(jī)劃分成十份，輪次抽取一份作為驗(yàn)證集，其余九份作為訓(xùn)練集，以減少模型訓(xùn)練過(guò)程中的偏置誤差，增強(qiáng)模型的魯棒性。(2)將劃分之后的訓(xùn)練集，驗(yàn)證集和測(cè)試集進(jìn)行特征向量化轉(zhuǎn)換，原始序列特征矩陣，疏水性特征矩陣，理化屬性特征矩陣以及β信息特征矩陣作為模型的數(shù)據(jù)輸入。(3)使用訓(xùn)練集對(duì)本文整架構(gòu)模型進(jìn)行訓(xùn)練，同時(shí)由對(duì)應(yīng)驗(yàn)證集進(jìn)行訓(xùn)練過(guò)程驗(yàn)證，調(diào)整模型超參數(shù)，優(yōu)化訓(xùn)練過(guò)程，最終得到當(dāng)前數(shù)據(jù)集上表現(xiàn)最優(yōu)模型作為

棕櫚,�；�,位點(diǎn)

11最終預(yù)測(cè)模型。最后將測(cè)試集放入已經(jīng)訓(xùn)練好的模型中，對(duì)測(cè)試集數(shù)據(jù)進(jìn)行預(yù)測(cè)，得到最終預(yù)測(cè)結(jié)果，并使用統(tǒng)一評(píng)價(jià)指標(biāo)對(duì)預(yù)測(cè)結(jié)果進(jìn)行評(píng)估。3.2蛋白質(zhì)棕櫚�；稽c(diǎn)預(yù)測(cè)的形式化描述蛋白質(zhì)的S-棕櫚�；╬roteinS-palmitoylation）是一種可逆的蛋白質(zhì)翻譯后修飾。如圖3.2所示，棕櫚�；揎椀倪^(guò)程是將棕櫚酰基團(tuán)通過(guò)硫酯鍵的形式共價(jià)連接到蛋白質(zhì)側(cè)鏈的Cys殘基上，該過(guò)程需要棕櫚�；D(zhuǎn)移酶的催化，而棕櫚�；D(zhuǎn)移酶是一個(gè)酶家族，這個(gè)酶家族中的各種酶的共同特點(diǎn)是，其活性中心均含有Asp-His-His-Cys（DHHC）基序，因此也統(tǒng)一稱為DHHC家族。發(fā)生棕櫚�；奈稽c(diǎn)，即為棕櫚�；鶊F(tuán)共價(jià)連接的殘基。圖3.2棕櫚�；稽c(diǎn)修飾形式化表示[44]3.3蛋白質(zhì)棕櫚�；稽c(diǎn)數(shù)據(jù)集的構(gòu)建本實(shí)驗(yàn)的數(shù)據(jù)從Uniprot/Swiss-prot蛋白質(zhì)數(shù)據(jù)庫(kù)中獲取，選擇經(jīng)過(guò)人工標(biāo)注的可靠數(shù)據(jù)信息，如同第二章中所說(shuō)，初步篩選共得到2512條蛋白質(zhì)序列，構(gòu)成全部原始數(shù)據(jù)。生物信息學(xué)中，同一性代表的意義是，兩序列之間進(jìn)行比較，在同一位點(diǎn)的

【參考文獻(xiàn)】：
期刊論文
[1]UniProt蛋白質(zhì)數(shù)據(jù)庫(kù)簡(jiǎn)介[J]. 羅靜初.  生物信息學(xué). 2019(03)
[2]棕櫚�；鞍准暗鞍踪|(zhì)的棕櫚�；芯窟M(jìn)展[J]. 丁玉嬌,韓穎穎,周婧雯.  亞熱帶植物科學(xué). 2018(04)
[3]自然語(yǔ)言處理中的深度學(xué)習(xí):方法及應(yīng)用[J]. 林奕歐,雷航,李曉瑜,吳佳.  電子科技大學(xué)學(xué)報(bào). 2017(06)

本文編號(hào)：3055970

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會(huì)員下載

Download by Member

本文鏈接：http://sikaile.net/projectlw/swxlw/3055970.html

上一篇：G蛋白偶聯(lián)雌激素受體（GPER）在腸干細(xì)胞穩(wěn)態(tài)維持中的作用及機(jī)制
下一篇：DLK1-DIO3印記與生長(zhǎng)發(fā)育研究進(jìn)展

論文發(fā)表

·知網(wǎng)|萬(wàn)方|維普|龍?jiān)磡省級(jí)|國(guó)家級(jí)|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于集成深度神經(jīng)網(wǎng)絡(luò)的蛋白質(zhì)棕櫚�；稽c(diǎn)預(yù)測(cè)研究

基于集成深度神經(jīng)網(wǎng)絡(luò)的蛋白質(zhì)棕櫚�；稽c(diǎn)預(yù)測(cè)研究