基于序列模型的肽序列可信度評(píng)估
發(fā)布時(shí)間:2021-03-10 12:30
在肽序列鑒定過(guò)程中對(duì)候選肽序列與實(shí)驗(yàn)串聯(lián)質(zhì)譜匹配對(duì)(肽譜匹配對(duì))進(jìn)行評(píng)估打分是非常關(guān)鍵的一步,準(zhǔn)確有效的可信度評(píng)估算法能提高肽序列鑒定的準(zhǔn)確度。傳統(tǒng)的打分算法通常利用預(yù)測(cè)出的理論質(zhì)譜譜圖與實(shí)驗(yàn)質(zhì)譜譜圖的相似度分?jǐn)?shù)進(jìn)行分?jǐn)?shù)計(jì)算,無(wú)法充分有效地利用肽碎裂規(guī)律。本文針對(duì)這一問(wèn)題提出了一種結(jié)合肽序列信息表征的多分類概率和式可信度評(píng)估算法:deep Score-α。deep Score-α使用一維殘差網(wǎng)絡(luò)對(duì)序列底層信息進(jìn)行抽取,再通過(guò)多頭注意力機(jī)制融合序列不同肽鍵位點(diǎn)對(duì)當(dāng)前肽鍵斷裂位點(diǎn)產(chǎn)生的影響從而生成最終的碎片離子相對(duì)強(qiáng)度分布概率矩陣,結(jié)合肽序列碎片離子的實(shí)際相對(duì)強(qiáng)度計(jì)算出最終的肽譜匹配可信度。該算法從常用開(kāi)源鑒定工具Comet以及MSGF+的鑒定結(jié)果中提取候選肽序列進(jìn)行重新打分并與原有結(jié)果進(jìn)行了比較:deep Score-α在人類蛋白組數(shù)據(jù)集中FDR=0.01時(shí)保留的肽序列數(shù)量相較于Comet和MSGF+提升了約14%,Top1命中率(正確肽序列得分最高的譜圖所占比例)最大提升約5%。使用人類蛋白組數(shù)據(jù)集訓(xùn)練的模型在Proteome Tools2數(shù)據(jù)集上進(jìn)行泛化性能測(cè)試,deep Score...
【文章來(lái)源】:山東理工大學(xué)山東省
【文章頁(yè)數(shù)】:55 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
氨基酸結(jié)構(gòu)通式Fig2.1Thegeneralstructuralformulaforaminoacids
山東理工大學(xué)碩士學(xué)位論文第二章深度學(xué)習(xí)與質(zhì)譜技術(shù)8圖2.2三個(gè)氨基酸通過(guò)脫水縮合作用形成肽鏈Fig2.2Threeaminoacidsformingpeptidechainsbydehydrationandcondensation2.1.2串聯(lián)質(zhì)譜技術(shù)質(zhì)譜分析是一種通過(guò)測(cè)量離子質(zhì)荷比(質(zhì)量-電荷比)進(jìn)而對(duì)試驗(yàn)樣品進(jìn)行分析的方法,在試驗(yàn)樣品經(jīng)過(guò)離子源時(shí),試驗(yàn)樣品中的組分發(fā)生,生成不同荷質(zhì)比的帶電荷的離子,再經(jīng)加速電場(chǎng)形成離子束,最后進(jìn)入分析器得出最終結(jié)果。在使用串聯(lián)質(zhì)譜(MS/MS)進(jìn)行蛋白質(zhì)鑒定的過(guò)程中,樣品蛋白質(zhì)首先被酶解,然后送入質(zhì)譜儀中進(jìn)行離子化,產(chǎn)生母離子并獲得相應(yīng)的一級(jí)質(zhì)譜,再選擇一些母離子通過(guò)一些離子解離方法進(jìn)行碎裂,再次分析,記錄下各個(gè)離子碎片的質(zhì)荷比(m/z)和強(qiáng)度信息,其流程如圖2.3所示。用的離子解離方法包括CID(Collision-inducedDissociation,即通過(guò)撞擊使得肽鍵斷裂從而達(dá)到多肽碎裂目的的方法)和HCD(High-energyC-trapDissociation,即在高能條件下讓肽鍵斷裂進(jìn)而碎裂多肽的方法,該方法碎裂規(guī)律與CID相似,但碎裂能量更高),還有一些如ETD(electrontransferdissociation)、ECD(electroncatchdissociation)等。圖2.3蛋白質(zhì)鑒定中串聯(lián)質(zhì)譜數(shù)據(jù)獲取流程Fig2.3Thedataacquisitionprocessoftandemmassspectrometryinproteinidentification經(jīng)過(guò)質(zhì)譜儀獲得的原始質(zhì)譜圖是碎片離子的峰形圖,為了后續(xù)存儲(chǔ)計(jì)算方便,通常將原始質(zhì)譜圖中的離子峰轉(zhuǎn)換為(m/z,intensity)這樣的形式來(lái)保存,其中,m/z表示離子峰的中心質(zhì)荷比,intensity表示離子峰的強(qiáng)度。在描述離子峰的強(qiáng)度時(shí),一
山東理工大學(xué)碩士學(xué)位論文第二章深度學(xué)習(xí)與質(zhì)譜技術(shù)8圖2.2三個(gè)氨基酸通過(guò)脫水縮合作用形成肽鏈Fig2.2Threeaminoacidsformingpeptidechainsbydehydrationandcondensation2.1.2串聯(lián)質(zhì)譜技術(shù)質(zhì)譜分析是一種通過(guò)測(cè)量離子質(zhì)荷比(質(zhì)量-電荷比)進(jìn)而對(duì)試驗(yàn)樣品進(jìn)行分析的方法,在試驗(yàn)樣品經(jīng)過(guò)離子源時(shí),試驗(yàn)樣品中的組分發(fā)生,生成不同荷質(zhì)比的帶電荷的離子,再經(jīng)加速電場(chǎng)形成離子束,最后進(jìn)入分析器得出最終結(jié)果。在使用串聯(lián)質(zhì)譜(MS/MS)進(jìn)行蛋白質(zhì)鑒定的過(guò)程中,樣品蛋白質(zhì)首先被酶解,然后送入質(zhì)譜儀中進(jìn)行離子化,產(chǎn)生母離子并獲得相應(yīng)的一級(jí)質(zhì)譜,再選擇一些母離子通過(guò)一些離子解離方法進(jìn)行碎裂,再次分析,記錄下各個(gè)離子碎片的質(zhì)荷比(m/z)和強(qiáng)度信息,其流程如圖2.3所示。用的離子解離方法包括CID(Collision-inducedDissociation,即通過(guò)撞擊使得肽鍵斷裂從而達(dá)到多肽碎裂目的的方法)和HCD(High-energyC-trapDissociation,即在高能條件下讓肽鍵斷裂進(jìn)而碎裂多肽的方法,該方法碎裂規(guī)律與CID相似,但碎裂能量更高),還有一些如ETD(electrontransferdissociation)、ECD(electroncatchdissociation)等。圖2.3蛋白質(zhì)鑒定中串聯(lián)質(zhì)譜數(shù)據(jù)獲取流程Fig2.3Thedataacquisitionprocessoftandemmassspectrometryinproteinidentification經(jīng)過(guò)質(zhì)譜儀獲得的原始質(zhì)譜圖是碎片離子的峰形圖,為了后續(xù)存儲(chǔ)計(jì)算方便,通常將原始質(zhì)譜圖中的離子峰轉(zhuǎn)換為(m/z,intensity)這樣的形式來(lái)保存,其中,m/z表示離子峰的中心質(zhì)荷比,intensity表示離子峰的強(qiáng)度。在描述離子峰的強(qiáng)度時(shí),一
【參考文獻(xiàn)】:
期刊論文
[1]肽段的理論串聯(lián)質(zhì)譜圖預(yù)測(cè)方法研究進(jìn)展[J]. 周擷璇,任睿,高婉鈴,黃運(yùn)有,曾文鋒,孔德飛,郝天舒,張知非,詹劍鋒. 生物化學(xué)與生物物理進(jìn)展. 2019(02)
[2]深度學(xué)習(xí)方法在生物質(zhì)譜及蛋白質(zhì)組學(xué)中的應(yīng)用[J]. 趙新元,秦偉捷,錢小紅. 生物化學(xué)與生物物理進(jìn)展. 2018(12)
本文編號(hào):3074665
【文章來(lái)源】:山東理工大學(xué)山東省
【文章頁(yè)數(shù)】:55 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
氨基酸結(jié)構(gòu)通式Fig2.1Thegeneralstructuralformulaforaminoacids
山東理工大學(xué)碩士學(xué)位論文第二章深度學(xué)習(xí)與質(zhì)譜技術(shù)8圖2.2三個(gè)氨基酸通過(guò)脫水縮合作用形成肽鏈Fig2.2Threeaminoacidsformingpeptidechainsbydehydrationandcondensation2.1.2串聯(lián)質(zhì)譜技術(shù)質(zhì)譜分析是一種通過(guò)測(cè)量離子質(zhì)荷比(質(zhì)量-電荷比)進(jìn)而對(duì)試驗(yàn)樣品進(jìn)行分析的方法,在試驗(yàn)樣品經(jīng)過(guò)離子源時(shí),試驗(yàn)樣品中的組分發(fā)生,生成不同荷質(zhì)比的帶電荷的離子,再經(jīng)加速電場(chǎng)形成離子束,最后進(jìn)入分析器得出最終結(jié)果。在使用串聯(lián)質(zhì)譜(MS/MS)進(jìn)行蛋白質(zhì)鑒定的過(guò)程中,樣品蛋白質(zhì)首先被酶解,然后送入質(zhì)譜儀中進(jìn)行離子化,產(chǎn)生母離子并獲得相應(yīng)的一級(jí)質(zhì)譜,再選擇一些母離子通過(guò)一些離子解離方法進(jìn)行碎裂,再次分析,記錄下各個(gè)離子碎片的質(zhì)荷比(m/z)和強(qiáng)度信息,其流程如圖2.3所示。用的離子解離方法包括CID(Collision-inducedDissociation,即通過(guò)撞擊使得肽鍵斷裂從而達(dá)到多肽碎裂目的的方法)和HCD(High-energyC-trapDissociation,即在高能條件下讓肽鍵斷裂進(jìn)而碎裂多肽的方法,該方法碎裂規(guī)律與CID相似,但碎裂能量更高),還有一些如ETD(electrontransferdissociation)、ECD(electroncatchdissociation)等。圖2.3蛋白質(zhì)鑒定中串聯(lián)質(zhì)譜數(shù)據(jù)獲取流程Fig2.3Thedataacquisitionprocessoftandemmassspectrometryinproteinidentification經(jīng)過(guò)質(zhì)譜儀獲得的原始質(zhì)譜圖是碎片離子的峰形圖,為了后續(xù)存儲(chǔ)計(jì)算方便,通常將原始質(zhì)譜圖中的離子峰轉(zhuǎn)換為(m/z,intensity)這樣的形式來(lái)保存,其中,m/z表示離子峰的中心質(zhì)荷比,intensity表示離子峰的強(qiáng)度。在描述離子峰的強(qiáng)度時(shí),一
山東理工大學(xué)碩士學(xué)位論文第二章深度學(xué)習(xí)與質(zhì)譜技術(shù)8圖2.2三個(gè)氨基酸通過(guò)脫水縮合作用形成肽鏈Fig2.2Threeaminoacidsformingpeptidechainsbydehydrationandcondensation2.1.2串聯(lián)質(zhì)譜技術(shù)質(zhì)譜分析是一種通過(guò)測(cè)量離子質(zhì)荷比(質(zhì)量-電荷比)進(jìn)而對(duì)試驗(yàn)樣品進(jìn)行分析的方法,在試驗(yàn)樣品經(jīng)過(guò)離子源時(shí),試驗(yàn)樣品中的組分發(fā)生,生成不同荷質(zhì)比的帶電荷的離子,再經(jīng)加速電場(chǎng)形成離子束,最后進(jìn)入分析器得出最終結(jié)果。在使用串聯(lián)質(zhì)譜(MS/MS)進(jìn)行蛋白質(zhì)鑒定的過(guò)程中,樣品蛋白質(zhì)首先被酶解,然后送入質(zhì)譜儀中進(jìn)行離子化,產(chǎn)生母離子并獲得相應(yīng)的一級(jí)質(zhì)譜,再選擇一些母離子通過(guò)一些離子解離方法進(jìn)行碎裂,再次分析,記錄下各個(gè)離子碎片的質(zhì)荷比(m/z)和強(qiáng)度信息,其流程如圖2.3所示。用的離子解離方法包括CID(Collision-inducedDissociation,即通過(guò)撞擊使得肽鍵斷裂從而達(dá)到多肽碎裂目的的方法)和HCD(High-energyC-trapDissociation,即在高能條件下讓肽鍵斷裂進(jìn)而碎裂多肽的方法,該方法碎裂規(guī)律與CID相似,但碎裂能量更高),還有一些如ETD(electrontransferdissociation)、ECD(electroncatchdissociation)等。圖2.3蛋白質(zhì)鑒定中串聯(lián)質(zhì)譜數(shù)據(jù)獲取流程Fig2.3Thedataacquisitionprocessoftandemmassspectrometryinproteinidentification經(jīng)過(guò)質(zhì)譜儀獲得的原始質(zhì)譜圖是碎片離子的峰形圖,為了后續(xù)存儲(chǔ)計(jì)算方便,通常將原始質(zhì)譜圖中的離子峰轉(zhuǎn)換為(m/z,intensity)這樣的形式來(lái)保存,其中,m/z表示離子峰的中心質(zhì)荷比,intensity表示離子峰的強(qiáng)度。在描述離子峰的強(qiáng)度時(shí),一
【參考文獻(xiàn)】:
期刊論文
[1]肽段的理論串聯(lián)質(zhì)譜圖預(yù)測(cè)方法研究進(jìn)展[J]. 周擷璇,任睿,高婉鈴,黃運(yùn)有,曾文鋒,孔德飛,郝天舒,張知非,詹劍鋒. 生物化學(xué)與生物物理進(jìn)展. 2019(02)
[2]深度學(xué)習(xí)方法在生物質(zhì)譜及蛋白質(zhì)組學(xué)中的應(yīng)用[J]. 趙新元,秦偉捷,錢小紅. 生物化學(xué)與生物物理進(jìn)展. 2018(12)
本文編號(hào):3074665
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3074665.html
最近更新
教材專著