生物醫(yī)學文獻中的隱含知識發(fā)現方法研究
發(fā)布時間:2023-03-16 18:13
生物醫(yī)學文獻是目前最重要的生物醫(yī)學領域資源。隨著生物醫(yī)學領域研究的發(fā)展,生物醫(yī)學文獻的數量不斷的增長。如何充分地挖掘這些海量的文獻,從中發(fā)現新的生物醫(yī)學知識對生命科學研究領域有重要的意義。隱含知識發(fā)現(Literature Based Discovery)方法主要研究如何從已發(fā)表的生物醫(yī)學文獻中挖掘出新的知識,該方法已有效地應用到藥物發(fā)現、藥物副作用預測和藥物作用機制等研究領域。本文在前人的研究基礎上,研究如何從生物醫(yī)學文獻中發(fā)現隱含的生物醫(yī)學知識。對于給定的生物醫(yī)學文獻集合,目前主要有基于ABC框架和基于AnC框架兩種類型的隱含知識發(fā)現方法,從中挖掘隱含的生物醫(yī)學知識;谀壳半[含知識發(fā)現方法的兩種模型,本文主要做了以下三方面的工作:(1)提出了新的基于ABC框架的隱含知識發(fā)現方法。ABC框架是目前使用最廣泛的隱含知識發(fā)現模型,該模型主要通過單一共現的中間物質推理出間接相連的藥物和疾病的關系;贏BC框架的隱含知識發(fā)現方法具有簡單高效、可解釋性強的優(yōu)點。其中基于發(fā)現模板的方法是目前該類方法中準確率最高的方法。該方法通過領域專家定義的發(fā)現模板進行隱含知識發(fā)現。定義好的發(fā)現模板能夠較好...
【文章頁數】:112 頁
【學位級別】:博士
【文章目錄】:
摘要
ABSTRACT
主要符號表
1 緒論
1.1 研究背景與意義
1.2 生物醫(yī)學文本挖掘介紹
1.2.1 信息檢索
1.2.2 信息抽取
1.2.3 文檔摘要
1.2.4 問答
1.2.5 隱含知識發(fā)現
1.2.6 生物醫(yī)學文本挖掘小結
1.3 隱含知識發(fā)現研究現狀
1.3.1 基于關鍵詞的方法
1.3.2 基于概念的方法
1.3.3 基于關系的方法
1.3.4 基于圖的方法
1.3.5 混合方法
1.3.6 總結
1.4 本文主要研究思路與研究內容
2 基于強化語義模板的隱含知識發(fā)現方法
2.1 引言
2.2 相關工具及資源介紹
2.2.1 一體化醫(yī)學語言系統(tǒng)
2.2.2 MetaMap
2.2.3 SemRep和SemMedDB
2.2.4 斯坦福句法分析器
2.2.5 支持向量機
2.2.6 協(xié)同訓練
2.3 構造強化語義發(fā)現模板
2.3.1 語義類型模塊
2.3.2 訓練數據模塊
2.3.3 模型訓練模塊
2.3.4 強化語義發(fā)現模板
2.4 實驗結果及分析
2.4.1 關系抽取模型實驗結果
2.4.2 閉合式隱含知識發(fā)現實驗
2.4.3 開放式知識發(fā)現實驗
2.5 本章小結
3 基于知識圖譜語義分布的隱含知識發(fā)現方法
3.1 引言
3.2 相關概念和資源介紹
3.2.1 知識圖譜
3.2.2 治療靶標數據庫
3.3 構造生物醫(yī)學知識圖譜及訓練集
3.3.1 構造生物醫(yī)學知識圖譜
3.3.2 訓練數據集構造
3.4 SemaTyP方法
3.4.1 基于知識圖譜語義分布的特征抽取
3.4.2 訓練模型
3.4.3 隱含知識發(fā)現
3.4.4 對比方法介紹
3.5 實驗結果及分析
3.5.1 生物醫(yī)學知識圖譜SemKG和訓練集
3.5.2 評價方法
3.5.3 十倍交叉驗證
3.5.4 藥物發(fā)現實驗
3.5.5 實例展示
3.6 本章小結
4 基于圖嵌入與深度學習的隱含知識發(fā)現方法
4.1 引言
4.2 相關技術介紹
4.2.1 知識圖譜嵌入
4.2.2 循環(huán)神經網絡
4.3 GrEDeL方法介紹
4.3.1 生物醫(yī)學知識圖譜及訓練集的構造
4.3.2 GrEDeL方法整體框架
4.3.3 輸入層
4.3.4 知識圖譜嵌入層
4.3.5 深度學習層
4.3.6 輸出層
4.3.7 GrEDeL方法應用于隱含知識發(fā)現
4.3.8 對比方法介紹
4.4 實驗結果及分析
4.4.1 實驗數據
4.4.2 十倍交叉驗證實驗
4.4.3 圖嵌入層結果分析
4.4.4 深度學習層結果分析
4.4.5 開放式實驗結果分析
4.4.6 閉合式實驗結果分析
4.4.7 實驗樣例分析
4.5 本章小結
5 基于邏輯主題路徑的文獻選擇方法
5.1 引言
5.2 邏輯主題路徑文獻選擇方法
5.2.1 主題分布計算
5.2.2 主題路徑模板學習
5.2.3 文獻選擇方法
5.3 實驗結果及分析
5.3.1 實驗數據及對比方法
5.3.2 主題分布計算結果
5.3.3 隱含知識發(fā)現結果
5.4 本章小結
6 總結與展望
6.1 結論
6.2 創(chuàng)新點
6.3 展望
參考文獻
攻讀博士學位期間科研項目及科研成果
致謝
作者簡介
本文編號:3763064
【文章頁數】:112 頁
【學位級別】:博士
【文章目錄】:
摘要
ABSTRACT
主要符號表
1 緒論
1.1 研究背景與意義
1.2 生物醫(yī)學文本挖掘介紹
1.2.1 信息檢索
1.2.2 信息抽取
1.2.3 文檔摘要
1.2.4 問答
1.2.5 隱含知識發(fā)現
1.2.6 生物醫(yī)學文本挖掘小結
1.3 隱含知識發(fā)現研究現狀
1.3.1 基于關鍵詞的方法
1.3.2 基于概念的方法
1.3.3 基于關系的方法
1.3.4 基于圖的方法
1.3.5 混合方法
1.3.6 總結
1.4 本文主要研究思路與研究內容
2 基于強化語義模板的隱含知識發(fā)現方法
2.1 引言
2.2 相關工具及資源介紹
2.2.1 一體化醫(yī)學語言系統(tǒng)
2.2.2 MetaMap
2.2.3 SemRep和SemMedDB
2.2.4 斯坦福句法分析器
2.2.5 支持向量機
2.2.6 協(xié)同訓練
2.3 構造強化語義發(fā)現模板
2.3.1 語義類型模塊
2.3.2 訓練數據模塊
2.3.3 模型訓練模塊
2.3.4 強化語義發(fā)現模板
2.4 實驗結果及分析
2.4.1 關系抽取模型實驗結果
2.4.2 閉合式隱含知識發(fā)現實驗
2.4.3 開放式知識發(fā)現實驗
2.5 本章小結
3 基于知識圖譜語義分布的隱含知識發(fā)現方法
3.1 引言
3.2 相關概念和資源介紹
3.2.1 知識圖譜
3.2.2 治療靶標數據庫
3.3 構造生物醫(yī)學知識圖譜及訓練集
3.3.1 構造生物醫(yī)學知識圖譜
3.3.2 訓練數據集構造
3.4 SemaTyP方法
3.4.1 基于知識圖譜語義分布的特征抽取
3.4.2 訓練模型
3.4.3 隱含知識發(fā)現
3.4.4 對比方法介紹
3.5 實驗結果及分析
3.5.1 生物醫(yī)學知識圖譜SemKG和訓練集
3.5.2 評價方法
3.5.3 十倍交叉驗證
3.5.4 藥物發(fā)現實驗
3.5.5 實例展示
3.6 本章小結
4 基于圖嵌入與深度學習的隱含知識發(fā)現方法
4.1 引言
4.2 相關技術介紹
4.2.1 知識圖譜嵌入
4.2.2 循環(huán)神經網絡
4.3 GrEDeL方法介紹
4.3.1 生物醫(yī)學知識圖譜及訓練集的構造
4.3.2 GrEDeL方法整體框架
4.3.3 輸入層
4.3.4 知識圖譜嵌入層
4.3.5 深度學習層
4.3.6 輸出層
4.3.7 GrEDeL方法應用于隱含知識發(fā)現
4.3.8 對比方法介紹
4.4 實驗結果及分析
4.4.1 實驗數據
4.4.2 十倍交叉驗證實驗
4.4.3 圖嵌入層結果分析
4.4.4 深度學習層結果分析
4.4.5 開放式實驗結果分析
4.4.6 閉合式實驗結果分析
4.4.7 實驗樣例分析
4.5 本章小結
5 基于邏輯主題路徑的文獻選擇方法
5.1 引言
5.2 邏輯主題路徑文獻選擇方法
5.2.1 主題分布計算
5.2.2 主題路徑模板學習
5.2.3 文獻選擇方法
5.3 實驗結果及分析
5.3.1 實驗數據及對比方法
5.3.2 主題分布計算結果
5.3.3 隱含知識發(fā)現結果
5.4 本章小結
6 總結與展望
6.1 結論
6.2 創(chuàng)新點
6.3 展望
參考文獻
攻讀博士學位期間科研項目及科研成果
致謝
作者簡介
本文編號:3763064
本文鏈接:http://sikaile.net/yixuelunwen/yiyuanguanlilunwen/3763064.html
最近更新
教材專著