一種基于深度神經網絡模型及蛋白相互作用預測癌癥相關蛋白及蛋白組合的新方法
發(fā)布時間:2020-12-29 07:23
如何從大量數據中挖掘出有意義的信息,如何把復雜的研究對象用精確而簡明的模型描述出來一直是數據處理工作中的中心課題。針對這個問題有兩種截然不同的方法:數據挖掘和復雜網絡理論。復雜網絡和數據挖掘方法不僅有著相似的研究目的,而且其分析對象在多數情況下也相同。但在實驗數據分析中將兩者協(xié)同應用解決同一問題的情況比較少,主要原因是兩者在分析對象上有較多重疊,在多數情況下僅用一種方式就可以解決問題。但實際上,將數據挖掘和復雜網絡很好的結合起來解決問題會給數據分析提供新的思路。本研究將復雜網絡和數據挖掘相結合,同時用于分析癌癥相關基因/蛋白,結果表明復雜網絡和數據挖掘技術的協(xié)同應用可以為生物學數據的分析提供新的切入點。對癌癥的研究積累了大量而且類型豐富的數據,利用這些數據發(fā)現(xiàn)癌細胞中關鍵的基因及其作用途徑一直是重要的研究方向。得益于豐富的數據,癌癥領域的數據分析方法也層出不窮,其中結合蛋白質相互作用網絡分析基因及蛋白功能的方法是一個重要的類別。在癌癥相關的信號傳導,細胞定位和表達調控等過程中蛋白質相互作用扮演重要的角色,因此以蛋白質相互作用為基礎整合其它組學數據的生物信息方法對分析參與這些過程的關鍵基...
【文章來源】:華中農業(yè)大學湖北省 211工程院校 教育部直屬院校
【文章頁數】:104 頁
【學位級別】:博士
【部分圖文】:
使用深度神經網絡模型預測癌癥相關蛋白質和蛋白質組合的流程
圖 2-2. KD score 預選的癌癥相關蛋白質韋恩圖(Pro: ProteomicsDB;字表示其中 TTD 的已知藥物靶點數目)。Figure 2-2. The Venn diagram of prioritized cancer-related proteinsBioXpress and ProteomicsDB (Pro: ProteomicsDB; Bio: BioXprenumbers of proteins in TTD).2.3.1.2 預測的癌癥相關蛋白質的功能分析在 TOP 500 個預選癌癥相關蛋白質 ( 細胞系之間平均 質) 中,有 211 個已知的癌癥藥物靶點,再對剩余 289 個蛋(GO)富集分析發(fā)現(xiàn) (表 2-1),這些蛋白質的功能主要富集于制相關功能,如 DNA 復制起始 (DNAreplicationinitiation:G(DNAreplication:GO:0006260) 等;(2) 代謝相關途徑,如生物
) 一種基于蛋白質互作網絡的方法 (使用本研究中的 PPI 數據) (Jian此方法篩選蛋白質互作網絡中具有差異表達信息的蛋白質,并計算目的差異表達值正值之和作為評分策略優(yōu)選蛋白質。) 一種基于蛋白質互作網絡和改進打分策略的方法:此方法篩選蛋白具有差異表達信息的蛋白質,并使用與本研究中與計算 KDscore 評分對每個蛋白質評分。果顯示 (圖 2-3),基于深度神經網絡模型的蛋白質篩選方法的受試者 (ROC)曲線下面積 (the area under the curve, AUC) 最大值接近 0.ress 和 ProteomicDB 兩個數據集中都明顯優(yōu)于其它 3 種方法,說明本方和打分策略上都優(yōu)于常規(guī)的差異表達值篩選法和基于蛋白質互作網絡 et al., 2015)。
【參考文獻】:
期刊論文
[1]Computational Approaches for Prioritizing Candidate Disease Genes Based on PPI Networks[J]. Wei Lan,Jianxin Wang,Min Li,Wei Peng,Fangxiang Wu. Tsinghua Science and Technology. 2015(05)
本文編號:2945256
【文章來源】:華中農業(yè)大學湖北省 211工程院校 教育部直屬院校
【文章頁數】:104 頁
【學位級別】:博士
【部分圖文】:
使用深度神經網絡模型預測癌癥相關蛋白質和蛋白質組合的流程
圖 2-2. KD score 預選的癌癥相關蛋白質韋恩圖(Pro: ProteomicsDB;字表示其中 TTD 的已知藥物靶點數目)。Figure 2-2. The Venn diagram of prioritized cancer-related proteinsBioXpress and ProteomicsDB (Pro: ProteomicsDB; Bio: BioXprenumbers of proteins in TTD).2.3.1.2 預測的癌癥相關蛋白質的功能分析在 TOP 500 個預選癌癥相關蛋白質 ( 細胞系之間平均 質) 中,有 211 個已知的癌癥藥物靶點,再對剩余 289 個蛋(GO)富集分析發(fā)現(xiàn) (表 2-1),這些蛋白質的功能主要富集于制相關功能,如 DNA 復制起始 (DNAreplicationinitiation:G(DNAreplication:GO:0006260) 等;(2) 代謝相關途徑,如生物
) 一種基于蛋白質互作網絡的方法 (使用本研究中的 PPI 數據) (Jian此方法篩選蛋白質互作網絡中具有差異表達信息的蛋白質,并計算目的差異表達值正值之和作為評分策略優(yōu)選蛋白質。) 一種基于蛋白質互作網絡和改進打分策略的方法:此方法篩選蛋白具有差異表達信息的蛋白質,并使用與本研究中與計算 KDscore 評分對每個蛋白質評分。果顯示 (圖 2-3),基于深度神經網絡模型的蛋白質篩選方法的受試者 (ROC)曲線下面積 (the area under the curve, AUC) 最大值接近 0.ress 和 ProteomicDB 兩個數據集中都明顯優(yōu)于其它 3 種方法,說明本方和打分策略上都優(yōu)于常規(guī)的差異表達值篩選法和基于蛋白質互作網絡 et al., 2015)。
【參考文獻】:
期刊論文
[1]Computational Approaches for Prioritizing Candidate Disease Genes Based on PPI Networks[J]. Wei Lan,Jianxin Wang,Min Li,Wei Peng,Fangxiang Wu. Tsinghua Science and Technology. 2015(05)
本文編號:2945256
本文鏈接:http://sikaile.net/yixuelunwen/zlx/2945256.html
最近更新
教材專著