基于復雜網(wǎng)絡和圖嵌入表示的弱監(jiān)督蛋白質(zhì)交互識別
發(fā)布時間:2023-04-19 20:24
蛋白質(zhì)交互(Protein-Protein Interaction,PPI)對于生命過程有著巨大影響,在生物醫(yī)學領域的研究中起了重要作用。蛋白質(zhì)交互關系的發(fā)現(xiàn)與記錄可以幫助新藥的發(fā)現(xiàn),診斷的疾病等研究。目前的PPI相關內(nèi)容主要以文獻的形式存儲,然而隨著醫(yī)學文獻的飛速發(fā)展,查詢PPI關系往往給相關研究人員帶來了難度。因此,許多科研人員致力于研究如何自動從文獻中識別出PPI關系。目前,基于有監(jiān)督的算法是進行PPI識別的主流方法。該方法雖然能實現(xiàn)較好的效果,但需要大量的標注數(shù)據(jù),往往難以在實際中應用。因此,本文提出基于弱監(jiān)督的算法進行PPI識別。本文的主要工作為:一、首先,利用專業(yè)數(shù)據(jù)庫中所收集的目標蛋白質(zhì)對,從中查找出所有含有目標蛋白質(zhì)對的句子構(gòu)建簽名檔,并以少量有交互關系的蛋白質(zhì)對作為種子集。然后,從每個句子中提取能夠表達文本關系的特征作為詞匯模式,根據(jù)分布式假設原理將詞匯模式表示為向量,通過相似性提取出與種子詞匯模式相似的語料中的詞匯模式構(gòu)建候選集。最后,通過對候選集的評估,挑選出大于閾值的蛋白質(zhì)對加入種子集。重復上述過程進行迭代,通過對種子集的不斷迭代擴充實現(xiàn)交互關系的識別。該方法僅...
【文章頁數(shù)】:73 頁
【學位級別】:碩士
【文章目錄】:
摘要
abstract
縮略詞
第一章 緒論
1.1 研究背景及意義
1.2 研究現(xiàn)狀
1.3 本文的工作
1.4 本文的結(jié)構(gòu)
第二章 相關工作
2.1 生物醫(yī)學領域文本挖掘
2.1.1 生物醫(yī)學領域文本挖掘的研究介紹
2.1.2 生物醫(yī)學領域的文本挖掘研究內(nèi)容
2.2 蛋白質(zhì)交互關系識別
2.2.1 蛋白質(zhì)交互關系識別概述
2.2.2 蛋白質(zhì)交互關系識別方法
2.3 本章總結(jié)
第三章 基于弱監(jiān)督的蛋白質(zhì)交互關系識別框架
3.1 模型框架
3.2 語料與種子集的獲取
3.3 詞匯模式的抽取及表示
3.4 候選集生成
3.4.1 基于關鍵詞的詞匯模式集排序
3.4.2 序列聚類算法
3.4.3 挑選候選蛋白質(zhì)對
3.5 候選集評估及種子集更新
3.5.1 基礎候選集評分
3.5.2 基于功能詞的候選集評分
3.5.3 更新種子集
3.6 實驗設計及結(jié)果分析
3.6.1 實驗數(shù)據(jù)與設置
3.6.2 實驗結(jié)果與分析
3.7 本章總結(jié)
第四章 基于復雜網(wǎng)絡的PPI候選集評估模型
4.1 復雜網(wǎng)絡概述
4.2 基于簽名檔的復雜網(wǎng)絡模型
4.2.1 基于簽名檔的復雜網(wǎng)絡構(gòu)建
4.2.2 復雜網(wǎng)絡特征選擇
4.2.3 基于復雜網(wǎng)絡的候選集評估
4.3 實驗設計及結(jié)果分析
4.3.1 實驗數(shù)據(jù)與設置
4.3.2 實驗結(jié)果與分析
4.4 本章總結(jié)
第五章 基于圖嵌入學習的PPI特征表示
5.1 圖嵌入表示學習概述
5.2 基于圖嵌入學習表示PPI特征
5.2.1 圖嵌入模型
5.2.2 基于圖嵌入表示的PPI識別
5.3 實驗設計及結(jié)果分析
5.3.1 實驗數(shù)據(jù)與設置
5.3.2 實驗結(jié)果與分析
5.4 本章總結(jié)
第六章 總結(jié)與展望
6.1 工作總結(jié)
6.2 前景展望
參考文獻
致謝
在學期間的研究成果及發(fā)表的學術(shù)論文
本文編號:3794159
【文章頁數(shù)】:73 頁
【學位級別】:碩士
【文章目錄】:
摘要
abstract
縮略詞
第一章 緒論
1.1 研究背景及意義
1.2 研究現(xiàn)狀
1.3 本文的工作
1.4 本文的結(jié)構(gòu)
第二章 相關工作
2.1 生物醫(yī)學領域文本挖掘
2.1.1 生物醫(yī)學領域文本挖掘的研究介紹
2.1.2 生物醫(yī)學領域的文本挖掘研究內(nèi)容
2.2 蛋白質(zhì)交互關系識別
2.2.1 蛋白質(zhì)交互關系識別概述
2.2.2 蛋白質(zhì)交互關系識別方法
2.3 本章總結(jié)
第三章 基于弱監(jiān)督的蛋白質(zhì)交互關系識別框架
3.1 模型框架
3.2 語料與種子集的獲取
3.3 詞匯模式的抽取及表示
3.4 候選集生成
3.4.1 基于關鍵詞的詞匯模式集排序
3.4.2 序列聚類算法
3.4.3 挑選候選蛋白質(zhì)對
3.5 候選集評估及種子集更新
3.5.1 基礎候選集評分
3.5.2 基于功能詞的候選集評分
3.5.3 更新種子集
3.6 實驗設計及結(jié)果分析
3.6.1 實驗數(shù)據(jù)與設置
3.6.2 實驗結(jié)果與分析
3.7 本章總結(jié)
第四章 基于復雜網(wǎng)絡的PPI候選集評估模型
4.1 復雜網(wǎng)絡概述
4.2 基于簽名檔的復雜網(wǎng)絡模型
4.2.1 基于簽名檔的復雜網(wǎng)絡構(gòu)建
4.2.2 復雜網(wǎng)絡特征選擇
4.2.3 基于復雜網(wǎng)絡的候選集評估
4.3 實驗設計及結(jié)果分析
4.3.1 實驗數(shù)據(jù)與設置
4.3.2 實驗結(jié)果與分析
4.4 本章總結(jié)
第五章 基于圖嵌入學習的PPI特征表示
5.1 圖嵌入表示學習概述
5.2 基于圖嵌入學習表示PPI特征
5.2.1 圖嵌入模型
5.2.2 基于圖嵌入表示的PPI識別
5.3 實驗設計及結(jié)果分析
5.3.1 實驗數(shù)據(jù)與設置
5.3.2 實驗結(jié)果與分析
5.4 本章總結(jié)
第六章 總結(jié)與展望
6.1 工作總結(jié)
6.2 前景展望
參考文獻
致謝
在學期間的研究成果及發(fā)表的學術(shù)論文
本文編號:3794159
本文鏈接:http://sikaile.net/projectlw/swxlw/3794159.html
最近更新
教材專著