基于稀疏表示的蛋白質相互作用預測及應用
發(fā)布時間:2021-04-01 10:52
蛋白質作為生命體的基礎物質之一,其功能發(fā)揮對于各種生命活動如新陳代謝、激素調節(jié)、細胞活動和酶的催化反應等都起到關鍵性的作用。因此,蛋白質相互作用研究不僅有利于了解生命運行機制,而且對于新藥研發(fā)等方面都具有重要意義。然而,采用傳統(tǒng)生物實驗方法鑒定蛋白質之間的相互作用不僅成本高昂,而且還存在著較高的假陽性和假陰性率。隨著信息技術的快速發(fā)展,采用智能計算的方法對蛋白質相互作用進行預測不僅速度快,而且準確率高,已成為預測蛋白質相互作用重要手段。本文的主要工作如下:(1)基于矩陣的特征提取方法選擇。為了高效且全面地提取到蛋白質序列中重要的特征向量矩陣,本文分別使用了矩陣主成分分析和矩陣線性判別分析方法對經過數(shù)值化表示后的蛋白質序列信息進行特征提取。通過在H.pylori、S.cerevisiae和Human數(shù)據(jù)集上與其它特征提取方法的實驗對比,證明了本文提出特征提取方法的有效性。(2)基于稀疏表示的預測模型設計。本文分別采用了稀疏表示模型和加權稀疏表示模型來實現(xiàn)蛋白質相互作用預測的功能。通過與支持向量機和其它模型的對比實驗,發(fā)現(xiàn)基于稀疏表示的模型能夠很好的與本文使用的特征提取方法相結合,并具有優(yōu)...
【文章來源】:西京學院陜西省
【文章頁數(shù)】:60 頁
【學位級別】:碩士
【部分圖文】:
蛋白質序列特征提取流程圖
近些年來隨著計算機視覺領域的發(fā)展,稀疏表示不僅應用于信號處理領域在圖像修復、模式識別、目標追蹤和圖像分類等諸多領域也得到了廣泛應用中,首先介紹了稀疏表示模型的基本理論,其次以 K-SVD 字典學習方法為例了稀疏表示模型中的字典學習過程,并簡要概述了稀疏表示模型在蛋白質相預測中的實際應用。.1 稀疏表示如下圖 2.2 所示,假設樣本 X 表示 M×N 大小的矩陣表示,其中每一行代 X 中的每一行向量,每一列代表矩陣 X 中的每一個列向量,一般而言,該矩稠密的,即大多數(shù)元素不為 0。稀疏表示的含義是尋找一個稀疏系數(shù)矩陣 (以及一個字典矩陣 D(M×K),使得 D× 盡可能的還原矩陣 X,該矩陣可能的稀疏,即大多數(shù)元素都為 0,則矩陣 便是矩陣 X 的稀疏表示。目前聽到的壓縮感知技術就是來自稀疏表示的思想,只不過它是稀疏表示的逆,并且壓縮感知的前提是樣本要具有一定稀疏性。
具體的匹配追蹤方法流程圖如下圖 2.3所示。圖 2. 3 匹配追蹤方法流程圖2.3.2 字典學習采用以上方法只是獲取了稀疏系數(shù)的矩陣,也就是說字典 D 矩陣是固定不變的,這樣一來訓練出的模型自適應能力較差,泛化能力也較低,為了彌補這方面的不足,Michal Aharon 等人提出了一種用于字典學習的 KSVD 方法[35],此方法能夠根據(jù)不同訓練樣本自適應的構造出新的字典 D’。其 KSVD 名字的由來是該方法要經過
【參考文獻】:
期刊論文
[1]多重耐藥銅綠假單胞菌的兩種同源性分析方法的比較[J]. 李進,胡韋維,張峰領,黎敏,陳鳴,鄧少麗,魯衛(wèi)平. 第三軍醫(yī)大學學報. 2018(14)
[2]轉錄組學和蛋白質組學關聯(lián)分析在植物研究中的應用[J]. 王曉丹,肖鋼,張振乾,肖楠,陳浩,官春云. 基因組學與應用生物學. 2018(01)
[3]‘春甜橘’及其突變體果皮差異相關蛋白質組分析[J]. 曾繼吾,鄧貴明,高長玉,姜波,鐘云,鐘廣炎,易干軍. 中國農業(yè)科學. 2015(24)
[4]基于物理化學性質優(yōu)化的蛋白質相互作用預測研究[J]. 倪青山,王正志,趙英杰,黎剛果. 生命科學研究. 2009(03)
[5]基于氨基酸序列預測蛋白質功能性點突變位點[J]. 宋卓,張寧,阮吉壽,楊卓,張濤. 生物物理學報. 2007(02)
[6]酵母基因上游與內含子可能存在的轉錄協(xié)同作用[J]. 張昆林,張靜,羅靜初. 生物化學與生物物理進展. 2005(01)
[7]植物F-box蛋白質及其研究進展[J]. 王洪云,黃劍,賴釗,薛勇彪. 科學通報. 2002(12)
碩士論文
[1]幾類重要蛋白—蛋白相互作用的分子模擬[D]. 昝金行.北京協(xié)和醫(yī)學院 2012
本文編號:3113216
【文章來源】:西京學院陜西省
【文章頁數(shù)】:60 頁
【學位級別】:碩士
【部分圖文】:
蛋白質序列特征提取流程圖
近些年來隨著計算機視覺領域的發(fā)展,稀疏表示不僅應用于信號處理領域在圖像修復、模式識別、目標追蹤和圖像分類等諸多領域也得到了廣泛應用中,首先介紹了稀疏表示模型的基本理論,其次以 K-SVD 字典學習方法為例了稀疏表示模型中的字典學習過程,并簡要概述了稀疏表示模型在蛋白質相預測中的實際應用。.1 稀疏表示如下圖 2.2 所示,假設樣本 X 表示 M×N 大小的矩陣表示,其中每一行代 X 中的每一行向量,每一列代表矩陣 X 中的每一個列向量,一般而言,該矩稠密的,即大多數(shù)元素不為 0。稀疏表示的含義是尋找一個稀疏系數(shù)矩陣 (以及一個字典矩陣 D(M×K),使得 D× 盡可能的還原矩陣 X,該矩陣可能的稀疏,即大多數(shù)元素都為 0,則矩陣 便是矩陣 X 的稀疏表示。目前聽到的壓縮感知技術就是來自稀疏表示的思想,只不過它是稀疏表示的逆,并且壓縮感知的前提是樣本要具有一定稀疏性。
具體的匹配追蹤方法流程圖如下圖 2.3所示。圖 2. 3 匹配追蹤方法流程圖2.3.2 字典學習采用以上方法只是獲取了稀疏系數(shù)的矩陣,也就是說字典 D 矩陣是固定不變的,這樣一來訓練出的模型自適應能力較差,泛化能力也較低,為了彌補這方面的不足,Michal Aharon 等人提出了一種用于字典學習的 KSVD 方法[35],此方法能夠根據(jù)不同訓練樣本自適應的構造出新的字典 D’。其 KSVD 名字的由來是該方法要經過
【參考文獻】:
期刊論文
[1]多重耐藥銅綠假單胞菌的兩種同源性分析方法的比較[J]. 李進,胡韋維,張峰領,黎敏,陳鳴,鄧少麗,魯衛(wèi)平. 第三軍醫(yī)大學學報. 2018(14)
[2]轉錄組學和蛋白質組學關聯(lián)分析在植物研究中的應用[J]. 王曉丹,肖鋼,張振乾,肖楠,陳浩,官春云. 基因組學與應用生物學. 2018(01)
[3]‘春甜橘’及其突變體果皮差異相關蛋白質組分析[J]. 曾繼吾,鄧貴明,高長玉,姜波,鐘云,鐘廣炎,易干軍. 中國農業(yè)科學. 2015(24)
[4]基于物理化學性質優(yōu)化的蛋白質相互作用預測研究[J]. 倪青山,王正志,趙英杰,黎剛果. 生命科學研究. 2009(03)
[5]基于氨基酸序列預測蛋白質功能性點突變位點[J]. 宋卓,張寧,阮吉壽,楊卓,張濤. 生物物理學報. 2007(02)
[6]酵母基因上游與內含子可能存在的轉錄協(xié)同作用[J]. 張昆林,張靜,羅靜初. 生物化學與生物物理進展. 2005(01)
[7]植物F-box蛋白質及其研究進展[J]. 王洪云,黃劍,賴釗,薛勇彪. 科學通報. 2002(12)
碩士論文
[1]幾類重要蛋白—蛋白相互作用的分子模擬[D]. 昝金行.北京協(xié)和醫(yī)學院 2012
本文編號:3113216
本文鏈接:http://sikaile.net/projectlw/swxlw/3113216.html
最近更新
教材專著