生物醫(yī)學(xué)文獻(xiàn)中的隱含知識(shí)發(fā)現(xiàn)方法研究
發(fā)布時(shí)間:2023-03-16 18:13
生物醫(yī)學(xué)文獻(xiàn)是目前最重要的生物醫(yī)學(xué)領(lǐng)域資源。隨著生物醫(yī)學(xué)領(lǐng)域研究的發(fā)展,生物醫(yī)學(xué)文獻(xiàn)的數(shù)量不斷的增長(zhǎng)。如何充分地挖掘這些海量的文獻(xiàn),從中發(fā)現(xiàn)新的生物醫(yī)學(xué)知識(shí)對(duì)生命科學(xué)研究領(lǐng)域有重要的意義。隱含知識(shí)發(fā)現(xiàn)(Literature Based Discovery)方法主要研究如何從已發(fā)表的生物醫(yī)學(xué)文獻(xiàn)中挖掘出新的知識(shí),該方法已有效地應(yīng)用到藥物發(fā)現(xiàn)、藥物副作用預(yù)測(cè)和藥物作用機(jī)制等研究領(lǐng)域。本文在前人的研究基礎(chǔ)上,研究如何從生物醫(yī)學(xué)文獻(xiàn)中發(fā)現(xiàn)隱含的生物醫(yī)學(xué)知識(shí)。對(duì)于給定的生物醫(yī)學(xué)文獻(xiàn)集合,目前主要有基于ABC框架和基于AnC框架兩種類型的隱含知識(shí)發(fā)現(xiàn)方法,從中挖掘隱含的生物醫(yī)學(xué)知識(shí)。基于目前隱含知識(shí)發(fā)現(xiàn)方法的兩種模型,本文主要做了以下三方面的工作:(1)提出了新的基于ABC框架的隱含知識(shí)發(fā)現(xiàn)方法。ABC框架是目前使用最廣泛的隱含知識(shí)發(fā)現(xiàn)模型,該模型主要通過單一共現(xiàn)的中間物質(zhì)推理出間接相連的藥物和疾病的關(guān)系;贏BC框架的隱含知識(shí)發(fā)現(xiàn)方法具有簡(jiǎn)單高效、可解釋性強(qiáng)的優(yōu)點(diǎn)。其中基于發(fā)現(xiàn)模板的方法是目前該類方法中準(zhǔn)確率最高的方法。該方法通過領(lǐng)域?qū)<叶x的發(fā)現(xiàn)模板進(jìn)行隱含知識(shí)發(fā)現(xiàn)。定義好的發(fā)現(xiàn)模板能夠較好...
【文章頁(yè)數(shù)】:112 頁(yè)
【學(xué)位級(jí)別】:博士
【文章目錄】:
摘要
ABSTRACT
主要符號(hào)表
1 緒論
1.1 研究背景與意義
1.2 生物醫(yī)學(xué)文本挖掘介紹
1.2.1 信息檢索
1.2.2 信息抽取
1.2.3 文檔摘要
1.2.4 問答
1.2.5 隱含知識(shí)發(fā)現(xiàn)
1.2.6 生物醫(yī)學(xué)文本挖掘小結(jié)
1.3 隱含知識(shí)發(fā)現(xiàn)研究現(xiàn)狀
1.3.1 基于關(guān)鍵詞的方法
1.3.2 基于概念的方法
1.3.3 基于關(guān)系的方法
1.3.4 基于圖的方法
1.3.5 混合方法
1.3.6 總結(jié)
1.4 本文主要研究思路與研究?jī)?nèi)容
2 基于強(qiáng)化語(yǔ)義模板的隱含知識(shí)發(fā)現(xiàn)方法
2.1 引言
2.2 相關(guān)工具及資源介紹
2.2.1 一體化醫(yī)學(xué)語(yǔ)言系統(tǒng)
2.2.2 MetaMap
2.2.3 SemRep和SemMedDB
2.2.4 斯坦福句法分析器
2.2.5 支持向量機(jī)
2.2.6 協(xié)同訓(xùn)練
2.3 構(gòu)造強(qiáng)化語(yǔ)義發(fā)現(xiàn)模板
2.3.1 語(yǔ)義類型模塊
2.3.2 訓(xùn)練數(shù)據(jù)模塊
2.3.3 模型訓(xùn)練模塊
2.3.4 強(qiáng)化語(yǔ)義發(fā)現(xiàn)模板
2.4 實(shí)驗(yàn)結(jié)果及分析
2.4.1 關(guān)系抽取模型實(shí)驗(yàn)結(jié)果
2.4.2 閉合式隱含知識(shí)發(fā)現(xiàn)實(shí)驗(yàn)
2.4.3 開放式知識(shí)發(fā)現(xiàn)實(shí)驗(yàn)
2.5 本章小結(jié)
3 基于知識(shí)圖譜語(yǔ)義分布的隱含知識(shí)發(fā)現(xiàn)方法
3.1 引言
3.2 相關(guān)概念和資源介紹
3.2.1 知識(shí)圖譜
3.2.2 治療靶標(biāo)數(shù)據(jù)庫(kù)
3.3 構(gòu)造生物醫(yī)學(xué)知識(shí)圖譜及訓(xùn)練集
3.3.1 構(gòu)造生物醫(yī)學(xué)知識(shí)圖譜
3.3.2 訓(xùn)練數(shù)據(jù)集構(gòu)造
3.4 SemaTyP方法
3.4.1 基于知識(shí)圖譜語(yǔ)義分布的特征抽取
3.4.2 訓(xùn)練模型
3.4.3 隱含知識(shí)發(fā)現(xiàn)
3.4.4 對(duì)比方法介紹
3.5 實(shí)驗(yàn)結(jié)果及分析
3.5.1 生物醫(yī)學(xué)知識(shí)圖譜SemKG和訓(xùn)練集
3.5.2 評(píng)價(jià)方法
3.5.3 十倍交叉驗(yàn)證
3.5.4 藥物發(fā)現(xiàn)實(shí)驗(yàn)
3.5.5 實(shí)例展示
3.6 本章小結(jié)
4 基于圖嵌入與深度學(xué)習(xí)的隱含知識(shí)發(fā)現(xiàn)方法
4.1 引言
4.2 相關(guān)技術(shù)介紹
4.2.1 知識(shí)圖譜嵌入
4.2.2 循環(huán)神經(jīng)網(wǎng)絡(luò)
4.3 GrEDeL方法介紹
4.3.1 生物醫(yī)學(xué)知識(shí)圖譜及訓(xùn)練集的構(gòu)造
4.3.2 GrEDeL方法整體框架
4.3.3 輸入層
4.3.4 知識(shí)圖譜嵌入層
4.3.5 深度學(xué)習(xí)層
4.3.6 輸出層
4.3.7 GrEDeL方法應(yīng)用于隱含知識(shí)發(fā)現(xiàn)
4.3.8 對(duì)比方法介紹
4.4 實(shí)驗(yàn)結(jié)果及分析
4.4.1 實(shí)驗(yàn)數(shù)據(jù)
4.4.2 十倍交叉驗(yàn)證實(shí)驗(yàn)
4.4.3 圖嵌入層結(jié)果分析
4.4.4 深度學(xué)習(xí)層結(jié)果分析
4.4.5 開放式實(shí)驗(yàn)結(jié)果分析
4.4.6 閉合式實(shí)驗(yàn)結(jié)果分析
4.4.7 實(shí)驗(yàn)樣例分析
4.5 本章小結(jié)
5 基于邏輯主題路徑的文獻(xiàn)選擇方法
5.1 引言
5.2 邏輯主題路徑文獻(xiàn)選擇方法
5.2.1 主題分布計(jì)算
5.2.2 主題路徑模板學(xué)習(xí)
5.2.3 文獻(xiàn)選擇方法
5.3 實(shí)驗(yàn)結(jié)果及分析
5.3.1 實(shí)驗(yàn)數(shù)據(jù)及對(duì)比方法
5.3.2 主題分布計(jì)算結(jié)果
5.3.3 隱含知識(shí)發(fā)現(xiàn)結(jié)果
5.4 本章小結(jié)
6 總結(jié)與展望
6.1 結(jié)論
6.2 創(chuàng)新點(diǎn)
6.3 展望
參考文獻(xiàn)
攻讀博士學(xué)位期間科研項(xiàng)目及科研成果
致謝
作者簡(jiǎn)介
本文編號(hào):3763064
【文章頁(yè)數(shù)】:112 頁(yè)
【學(xué)位級(jí)別】:博士
【文章目錄】:
摘要
ABSTRACT
主要符號(hào)表
1 緒論
1.1 研究背景與意義
1.2 生物醫(yī)學(xué)文本挖掘介紹
1.2.1 信息檢索
1.2.2 信息抽取
1.2.3 文檔摘要
1.2.4 問答
1.2.5 隱含知識(shí)發(fā)現(xiàn)
1.2.6 生物醫(yī)學(xué)文本挖掘小結(jié)
1.3 隱含知識(shí)發(fā)現(xiàn)研究現(xiàn)狀
1.3.1 基于關(guān)鍵詞的方法
1.3.2 基于概念的方法
1.3.3 基于關(guān)系的方法
1.3.4 基于圖的方法
1.3.5 混合方法
1.3.6 總結(jié)
1.4 本文主要研究思路與研究?jī)?nèi)容
2 基于強(qiáng)化語(yǔ)義模板的隱含知識(shí)發(fā)現(xiàn)方法
2.1 引言
2.2 相關(guān)工具及資源介紹
2.2.1 一體化醫(yī)學(xué)語(yǔ)言系統(tǒng)
2.2.2 MetaMap
2.2.3 SemRep和SemMedDB
2.2.4 斯坦福句法分析器
2.2.5 支持向量機(jī)
2.2.6 協(xié)同訓(xùn)練
2.3 構(gòu)造強(qiáng)化語(yǔ)義發(fā)現(xiàn)模板
2.3.1 語(yǔ)義類型模塊
2.3.2 訓(xùn)練數(shù)據(jù)模塊
2.3.3 模型訓(xùn)練模塊
2.3.4 強(qiáng)化語(yǔ)義發(fā)現(xiàn)模板
2.4 實(shí)驗(yàn)結(jié)果及分析
2.4.1 關(guān)系抽取模型實(shí)驗(yàn)結(jié)果
2.4.2 閉合式隱含知識(shí)發(fā)現(xiàn)實(shí)驗(yàn)
2.4.3 開放式知識(shí)發(fā)現(xiàn)實(shí)驗(yàn)
2.5 本章小結(jié)
3 基于知識(shí)圖譜語(yǔ)義分布的隱含知識(shí)發(fā)現(xiàn)方法
3.1 引言
3.2 相關(guān)概念和資源介紹
3.2.1 知識(shí)圖譜
3.2.2 治療靶標(biāo)數(shù)據(jù)庫(kù)
3.3 構(gòu)造生物醫(yī)學(xué)知識(shí)圖譜及訓(xùn)練集
3.3.1 構(gòu)造生物醫(yī)學(xué)知識(shí)圖譜
3.3.2 訓(xùn)練數(shù)據(jù)集構(gòu)造
3.4 SemaTyP方法
3.4.1 基于知識(shí)圖譜語(yǔ)義分布的特征抽取
3.4.2 訓(xùn)練模型
3.4.3 隱含知識(shí)發(fā)現(xiàn)
3.4.4 對(duì)比方法介紹
3.5 實(shí)驗(yàn)結(jié)果及分析
3.5.1 生物醫(yī)學(xué)知識(shí)圖譜SemKG和訓(xùn)練集
3.5.2 評(píng)價(jià)方法
3.5.3 十倍交叉驗(yàn)證
3.5.4 藥物發(fā)現(xiàn)實(shí)驗(yàn)
3.5.5 實(shí)例展示
3.6 本章小結(jié)
4 基于圖嵌入與深度學(xué)習(xí)的隱含知識(shí)發(fā)現(xiàn)方法
4.1 引言
4.2 相關(guān)技術(shù)介紹
4.2.1 知識(shí)圖譜嵌入
4.2.2 循環(huán)神經(jīng)網(wǎng)絡(luò)
4.3 GrEDeL方法介紹
4.3.1 生物醫(yī)學(xué)知識(shí)圖譜及訓(xùn)練集的構(gòu)造
4.3.2 GrEDeL方法整體框架
4.3.3 輸入層
4.3.4 知識(shí)圖譜嵌入層
4.3.5 深度學(xué)習(xí)層
4.3.6 輸出層
4.3.7 GrEDeL方法應(yīng)用于隱含知識(shí)發(fā)現(xiàn)
4.3.8 對(duì)比方法介紹
4.4 實(shí)驗(yàn)結(jié)果及分析
4.4.1 實(shí)驗(yàn)數(shù)據(jù)
4.4.2 十倍交叉驗(yàn)證實(shí)驗(yàn)
4.4.3 圖嵌入層結(jié)果分析
4.4.4 深度學(xué)習(xí)層結(jié)果分析
4.4.5 開放式實(shí)驗(yàn)結(jié)果分析
4.4.6 閉合式實(shí)驗(yàn)結(jié)果分析
4.4.7 實(shí)驗(yàn)樣例分析
4.5 本章小結(jié)
5 基于邏輯主題路徑的文獻(xiàn)選擇方法
5.1 引言
5.2 邏輯主題路徑文獻(xiàn)選擇方法
5.2.1 主題分布計(jì)算
5.2.2 主題路徑模板學(xué)習(xí)
5.2.3 文獻(xiàn)選擇方法
5.3 實(shí)驗(yàn)結(jié)果及分析
5.3.1 實(shí)驗(yàn)數(shù)據(jù)及對(duì)比方法
5.3.2 主題分布計(jì)算結(jié)果
5.3.3 隱含知識(shí)發(fā)現(xiàn)結(jié)果
5.4 本章小結(jié)
6 總結(jié)與展望
6.1 結(jié)論
6.2 創(chuàng)新點(diǎn)
6.3 展望
參考文獻(xiàn)
攻讀博士學(xué)位期間科研項(xiàng)目及科研成果
致謝
作者簡(jiǎn)介
本文編號(hào):3763064
本文鏈接:http://sikaile.net/yixuelunwen/yiyuanguanlilunwen/3763064.html
最近更新
教材專著