Hub蛋白質相互作用結合面預測方法研究
發(fā)布時間:2020-06-10 04:48
【摘要】:蛋白質相互作用中的Hub蛋白質是協(xié)調蛋白質相互作用并發(fā)揮生物學功能的關鍵因素,它有助于解釋蛋白質發(fā)揮其生物學功能的分子機制,進一步理解生命活動的微觀過程,并對基于蛋白質結構的藥物設計提供理論指導。蛋白質相互作用結合面上某些熱點殘基對結合自由能的貢獻較大。熱點殘基在蛋白質結合面上形成緊密堆積的熱區(qū)。熱區(qū)是受體與高親和力配體結合的重要區(qū)域,也是促進蛋白質相互作用穩(wěn)定性的特定功能區(qū)域。因此,研究Hub蛋白質相互作用結合面上的熱點和熱區(qū),以及不同類型的Hub蛋白質相互作用結合面,對于理解蛋白質的功能是非常重要的。雖然,越來越多的蛋白質結構和屬性被發(fā)現(xiàn),但是大量的信息是冗余的,導致使用傳統(tǒng)方法研究Hub蛋白質相互作用結合面極其困難。高質量的預測模型和高效的計算方法顯得尤為重要。本文利用集成學習和聚類方法對Hub蛋白質相互作用結合面開展了一些研究工作,主要內容包括:(1)基于相關系數的特征選擇方法首先,利用皮爾森相關系數對特征子集進行評價,獲得高度相關的特征屬性,并將相關系數矩陣進行可視化處理,移除一些高度關聯(lián)的特征屬性。為了將具有相關模式的變量聚集在一起,采用主成分分析法(PCA)對相關系數圖中矩陣的行和列進行重新排序。接著采用基于支持向量機的遞歸特征剔除方法(SVM-RFE)進行反向特征篩選,獲得最優(yōu)特征子集。通過該方法,無關的特征可以去除,且不會造成大量的信息丟失。(2)基于集成學習的Hub蛋白質結合面熱點預測方法為了有效地預測Hub蛋白質結合面上的熱點,并對不同類型的Hub蛋白質結合面進行分類,本文首先采用三個集成學習方法Boosting、Gradient Boosting和隨機森林在不同的數據集上建立訓練模型,并采用十折交叉驗證進行評估。然后,將三種集成學習方法用到Hub蛋白質結合面的熱點預測中,并采用相互作用傾向性優(yōu)化策略計算Hub蛋白質的傾向性系數,對傾向性系數較高的DD結合面(DateHub-DateHub)和PP結合面(PartyHub-PartyHub)進行分類。為了評估分類模型的性能,利用平均精確率下降曲線和平均基尼系數下降曲線對特征變量的重要性進行分析,并繪制邊緣分布圖來度量分類模型的確定性。實驗結果表明,基于相互作用傾向性的隨機森林方法的誤判率較低,模型的分類結果有較高的可信度。(3)基于局部社區(qū)結構探測的Hub蛋白質結合面熱區(qū)預測方法采用基于局部社區(qū)結構探測(LCSD)的聚類方法預測Hub蛋白質結合面上的熱區(qū)結構。首先,利用基于聚類的邊界點識別方法劃分社區(qū),并通過對勢和相對可及表面積優(yōu)化策略(PPRA)對熱區(qū)結果進行優(yōu)化。然后,通過丟失殘基優(yōu)化策略,對丟失的蛋白質殘基重新處理,從而得到最終的熱區(qū)。實驗結果表明LCSD方法預測熱區(qū)是可行和有效的,精度得到了較好的提升。(4)基于殘基配位數優(yōu)化和K-means的Hub蛋白質結合面熱區(qū)預測方法利用K-means聚類方法預測Hub蛋白質結合面上的熱區(qū)結構。首先,為了提高K-means聚類算法的效率,通過計算距離平方和以及平均輪廓值來確定能夠得到最佳聚類結果的k值。然后,用殘基配位數優(yōu)化(RCNO)策略計算平均配位數,同時,根據對勢和相對可及表面積(PPRA),對識別的熱區(qū)進行優(yōu)化。實驗結果表明,殘基配位數優(yōu)化策略對預測熱區(qū)的個數沒有影響,但在預測的熱區(qū)內部,熱點殘基數量增加,非熱點殘基數目減少,預測出來的熱區(qū)與標準熱區(qū)更為接近。綜上所述,本文基于新的特征選擇方法,采用三種集成學習和兩種聚類方法對Hub蛋白質結合面上的熱點殘基和熱區(qū)結構進行預測,并通過多種優(yōu)化策略進行優(yōu)化。實驗結果表明,使用本文方法所創(chuàng)建的模型具有較高的確定性,對預測Hub蛋白質結合面是有效的。
【學位授予單位】:武漢科技大學
【學位級別】:博士
【學位授予年份】:2019
【分類號】:Q51
本文編號:2705794
【學位授予單位】:武漢科技大學
【學位級別】:博士
【學位授予年份】:2019
【分類號】:Q51
【參考文獻】
相關期刊論文 前6條
1 張鑫;劉秉權;王曉龍;;復雜網絡中社區(qū)發(fā)現(xiàn)方法的研究[J];計算機工程與應用;2015年24期
2 尹穩(wěn);伏旭;李平;;蛋白質組學的應用研究進展[J];生物技術通報;2014年01期
3 龐爾麗;;蛋白質相互作用研究進展[J];生物學通報;2012年11期
4 張長勝;來魯華;;蛋白質相互作用預測、設計與調控[J];物理化學學報;2012年10期
5 白紅軍;來魯華;;蛋白質相互作用:界面分析,結合自由能計算與相互作用設計[J];物理化學學報;2010年07期
6 王靖;李霞;朱明珠;肖雪;;人類蛋白質互作網絡hub蛋白與其結構域關聯(lián)分析[J];生命科學研究;2008年03期
,本文編號:2705794
本文鏈接:http://sikaile.net/projectlw/swxlw/2705794.html