基于概念和段落檢索的生物醫(yī)學(xué)文獻(xiàn)知識(shí)發(fā)現(xiàn)
發(fā)布時(shí)間:2023-10-15 19:13
從生物醫(yī)學(xué)文獻(xiàn)中抽取潛在的生物學(xué)關(guān)系有助于建立生物醫(yī)學(xué)假說,而假說可以通過實(shí)驗(yàn)進(jìn)一步探索之。但是,隨著生物醫(yī)學(xué)文獻(xiàn)的快速增長(zhǎng),依靠人工閱讀來獲取知識(shí)是非常困難的。美國(guó)芝加哥大學(xué)情報(bào)學(xué)教授Don.R.Swanson創(chuàng)立的非相關(guān)文獻(xiàn)知識(shí)發(fā)現(xiàn)方法可以在大量醫(yī)學(xué)文獻(xiàn)中揭示學(xué)科間隱藏聯(lián)系,形成合理的假設(shè)來指導(dǎo)科學(xué)實(shí)踐。他的知識(shí)發(fā)現(xiàn)方法逐漸受到人們的關(guān)注,成為研究的熱點(diǎn)。 概念檢索計(jì)算簡(jiǎn)單直觀,實(shí)驗(yàn)采用共現(xiàn)分析技術(shù),對(duì)生物醫(yī)學(xué)文獻(xiàn)數(shù)據(jù)庫(kù)MEDLINE中的MeSH概念進(jìn)行隱含知識(shí)挖掘的研究。重點(diǎn)發(fā)現(xiàn)疾病與化學(xué)藥品、藥物、基因或者分子序列之間的新穎的、尚未被發(fā)現(xiàn)的生物學(xué)關(guān)系。實(shí)驗(yàn)利用三種計(jì)算方法:z分值、TFIDF(Term Frequency Inverse Document Frequency)和PMI(Pointwise MutualInformation),模擬Swanson的三組經(jīng)典實(shí)驗(yàn):Alzheimer’s disease(老年癡呆癥)、Migraine(偏頭疼)、Schizophrenia(精神分裂癥)。同時(shí)使用LitLinker系統(tǒng)提出的評(píng)測(cè)方法,計(jì)算了各組實(shí)驗(yàn)結(jié)果的正確率和召回率。...
【文章頁數(shù)】:54 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景
1.2 文本挖掘技術(shù)綜述
1.2.1 文本挖掘定義
1.2.2 文本挖掘的主要技術(shù)
1.2.3 文本挖掘在生物醫(yī)學(xué)文獻(xiàn)中的應(yīng)用
1.3 知識(shí)發(fā)現(xiàn)研究現(xiàn)狀
1.4 生物醫(yī)學(xué)文獻(xiàn)隱含知識(shí)發(fā)現(xiàn)研究現(xiàn)狀
1.5 本文的結(jié)構(gòu)
2 生物醫(yī)學(xué)文獻(xiàn)隱含知識(shí)發(fā)現(xiàn)相關(guān)知識(shí)及算法研究綜述
2.1 生物醫(yī)學(xué)文獻(xiàn)資源
2.1.1 醫(yī)學(xué)主題詞
2.1.2 醫(yī)學(xué)一體化語言系統(tǒng)
2.2 開放式發(fā)現(xiàn)算法和閉合式發(fā)現(xiàn)算法
2.2.1 開放式發(fā)現(xiàn)算法
2.2.2 閉合式發(fā)現(xiàn)算法
2.2.3 開放式發(fā)現(xiàn)算法和閉合式發(fā)現(xiàn)算法的區(qū)別
2.2.4 主要知識(shí)發(fā)現(xiàn)系統(tǒng)算法
3 概念檢索開放式知識(shí)發(fā)現(xiàn)
3.1 共現(xiàn)分析
3.1.1 共現(xiàn)定義
3.1.2 共現(xiàn)分析在文本挖掘中的作用
3.1.3 共現(xiàn)分析在隱含知識(shí)發(fā)現(xiàn)中的實(shí)現(xiàn)思路
3.2 方法
3.2.1 建立MeSH概念索引
3.2.2 開放式知識(shí)發(fā)現(xiàn)
4 段落檢索開放式知識(shí)發(fā)現(xiàn)
4.1 段落檢索
4.1.1 段落檢索研究背景
4.1.2 句子級(jí)重疊窗口
4.2 方法
4.2.1 建立索引
4.2.2 句子級(jí)重疊窗口索引的段落檢索
4.3 計(jì)算工具h(yuǎn)adoop
4.3.1 hadoop定義
4.3.2 hadoop結(jié)構(gòu)
4.3.3 hadoop在實(shí)驗(yàn)中的應(yīng)用
5 實(shí)驗(yàn)結(jié)果分析
5.1 實(shí)驗(yàn)數(shù)據(jù)
5.2 評(píng)測(cè)
5.3 發(fā)現(xiàn)的關(guān)系分析
5.3.1 Alzheimer's disease(老年癡呆癥)和indomethacin(消炎痛)
5.3.2 Migraine(偏頭疼)和Magnesium(鎂)
5.3.3 Schizophrenia(精神分裂癥)和Calcium-independent phospholipase A2(游離鈣磷脂酶A2)
5.4 實(shí)驗(yàn)方法討論
5.4.1 z分值、TFIDF、PMI結(jié)果對(duì)比分析
5.4.2 語義類型和閾值分析
5.4.3 融合計(jì)算分析
5.4.4 概念檢索和段落檢索方法分析
結(jié)論
參考文獻(xiàn)
致謝
本文編號(hào):3854505
【文章頁數(shù)】:54 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景
1.2 文本挖掘技術(shù)綜述
1.2.1 文本挖掘定義
1.2.2 文本挖掘的主要技術(shù)
1.2.3 文本挖掘在生物醫(yī)學(xué)文獻(xiàn)中的應(yīng)用
1.3 知識(shí)發(fā)現(xiàn)研究現(xiàn)狀
1.4 生物醫(yī)學(xué)文獻(xiàn)隱含知識(shí)發(fā)現(xiàn)研究現(xiàn)狀
1.5 本文的結(jié)構(gòu)
2 生物醫(yī)學(xué)文獻(xiàn)隱含知識(shí)發(fā)現(xiàn)相關(guān)知識(shí)及算法研究綜述
2.1 生物醫(yī)學(xué)文獻(xiàn)資源
2.1.1 醫(yī)學(xué)主題詞
2.1.2 醫(yī)學(xué)一體化語言系統(tǒng)
2.2 開放式發(fā)現(xiàn)算法和閉合式發(fā)現(xiàn)算法
2.2.1 開放式發(fā)現(xiàn)算法
2.2.2 閉合式發(fā)現(xiàn)算法
2.2.3 開放式發(fā)現(xiàn)算法和閉合式發(fā)現(xiàn)算法的區(qū)別
2.2.4 主要知識(shí)發(fā)現(xiàn)系統(tǒng)算法
3 概念檢索開放式知識(shí)發(fā)現(xiàn)
3.1 共現(xiàn)分析
3.1.1 共現(xiàn)定義
3.1.2 共現(xiàn)分析在文本挖掘中的作用
3.1.3 共現(xiàn)分析在隱含知識(shí)發(fā)現(xiàn)中的實(shí)現(xiàn)思路
3.2 方法
3.2.1 建立MeSH概念索引
3.2.2 開放式知識(shí)發(fā)現(xiàn)
4 段落檢索開放式知識(shí)發(fā)現(xiàn)
4.1 段落檢索
4.1.1 段落檢索研究背景
4.1.2 句子級(jí)重疊窗口
4.2 方法
4.2.1 建立索引
4.2.2 句子級(jí)重疊窗口索引的段落檢索
4.3 計(jì)算工具h(yuǎn)adoop
4.3.1 hadoop定義
4.3.2 hadoop結(jié)構(gòu)
4.3.3 hadoop在實(shí)驗(yàn)中的應(yīng)用
5 實(shí)驗(yàn)結(jié)果分析
5.1 實(shí)驗(yàn)數(shù)據(jù)
5.2 評(píng)測(cè)
5.3 發(fā)現(xiàn)的關(guān)系分析
5.3.1 Alzheimer's disease(老年癡呆癥)和indomethacin(消炎痛)
5.3.2 Migraine(偏頭疼)和Magnesium(鎂)
5.3.3 Schizophrenia(精神分裂癥)和Calcium-independent phospholipase A2(游離鈣磷脂酶A2)
5.4 實(shí)驗(yàn)方法討論
5.4.1 z分值、TFIDF、PMI結(jié)果對(duì)比分析
5.4.2 語義類型和閾值分析
5.4.3 融合計(jì)算分析
5.4.4 概念檢索和段落檢索方法分析
結(jié)論
參考文獻(xiàn)
致謝
本文編號(hào):3854505
本文鏈接:http://sikaile.net/tushudanganlunwen/3854505.html
最近更新
教材專著