天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 社科論文 > 圖書檔案論文 >

基于概念和段落檢索的生物醫(yī)學(xué)文獻(xiàn)知識(shí)發(fā)現(xiàn)

發(fā)布時(shí)間:2023-10-15 19:13
  從生物醫(yī)學(xué)文獻(xiàn)中抽取潛在的生物學(xué)關(guān)系有助于建立生物醫(yī)學(xué)假說,而假說可以通過實(shí)驗(yàn)進(jìn)一步探索之。但是,隨著生物醫(yī)學(xué)文獻(xiàn)的快速增長(zhǎng),依靠人工閱讀來獲取知識(shí)是非常困難的。美國(guó)芝加哥大學(xué)情報(bào)學(xué)教授Don.R.Swanson創(chuàng)立的非相關(guān)文獻(xiàn)知識(shí)發(fā)現(xiàn)方法可以在大量醫(yī)學(xué)文獻(xiàn)中揭示學(xué)科間隱藏聯(lián)系,形成合理的假設(shè)來指導(dǎo)科學(xué)實(shí)踐。他的知識(shí)發(fā)現(xiàn)方法逐漸受到人們的關(guān)注,成為研究的熱點(diǎn)。 概念檢索計(jì)算簡(jiǎn)單直觀,實(shí)驗(yàn)采用共現(xiàn)分析技術(shù),對(duì)生物醫(yī)學(xué)文獻(xiàn)數(shù)據(jù)庫(kù)MEDLINE中的MeSH概念進(jìn)行隱含知識(shí)挖掘的研究。重點(diǎn)發(fā)現(xiàn)疾病與化學(xué)藥品、藥物、基因或者分子序列之間的新穎的、尚未被發(fā)現(xiàn)的生物學(xué)關(guān)系。實(shí)驗(yàn)利用三種計(jì)算方法:z分值、TFIDF(Term Frequency Inverse Document Frequency)和PMI(Pointwise MutualInformation),模擬Swanson的三組經(jīng)典實(shí)驗(yàn):Alzheimer’s disease(老年癡呆癥)、Migraine(偏頭疼)、Schizophrenia(精神分裂癥)。同時(shí)使用LitLinker系統(tǒng)提出的評(píng)測(cè)方法,計(jì)算了各組實(shí)驗(yàn)結(jié)果的正確率和召回率。...

【文章頁數(shù)】:54 頁

【學(xué)位級(jí)別】:碩士

【文章目錄】:
摘要
Abstract
1 緒論
    1.1 研究背景
    1.2 文本挖掘技術(shù)綜述
        1.2.1 文本挖掘定義
        1.2.2 文本挖掘的主要技術(shù)
        1.2.3 文本挖掘在生物醫(yī)學(xué)文獻(xiàn)中的應(yīng)用
    1.3 知識(shí)發(fā)現(xiàn)研究現(xiàn)狀
    1.4 生物醫(yī)學(xué)文獻(xiàn)隱含知識(shí)發(fā)現(xiàn)研究現(xiàn)狀
    1.5 本文的結(jié)構(gòu)
2 生物醫(yī)學(xué)文獻(xiàn)隱含知識(shí)發(fā)現(xiàn)相關(guān)知識(shí)及算法研究綜述
    2.1 生物醫(yī)學(xué)文獻(xiàn)資源
        2.1.1 醫(yī)學(xué)主題詞
        2.1.2 醫(yī)學(xué)一體化語言系統(tǒng)
    2.2 開放式發(fā)現(xiàn)算法和閉合式發(fā)現(xiàn)算法
        2.2.1 開放式發(fā)現(xiàn)算法
        2.2.2 閉合式發(fā)現(xiàn)算法
        2.2.3 開放式發(fā)現(xiàn)算法和閉合式發(fā)現(xiàn)算法的區(qū)別
        2.2.4 主要知識(shí)發(fā)現(xiàn)系統(tǒng)算法
3 概念檢索開放式知識(shí)發(fā)現(xiàn)
    3.1 共現(xiàn)分析
        3.1.1 共現(xiàn)定義
        3.1.2 共現(xiàn)分析在文本挖掘中的作用
        3.1.3 共現(xiàn)分析在隱含知識(shí)發(fā)現(xiàn)中的實(shí)現(xiàn)思路
    3.2 方法
        3.2.1 建立MeSH概念索引
        3.2.2 開放式知識(shí)發(fā)現(xiàn)
4 段落檢索開放式知識(shí)發(fā)現(xiàn)
    4.1 段落檢索
        4.1.1 段落檢索研究背景
        4.1.2 句子級(jí)重疊窗口
    4.2 方法
        4.2.1 建立索引
        4.2.2 句子級(jí)重疊窗口索引的段落檢索
    4.3 計(jì)算工具h(yuǎn)adoop
        4.3.1 hadoop定義
        4.3.2 hadoop結(jié)構(gòu)
        4.3.3 hadoop在實(shí)驗(yàn)中的應(yīng)用
5 實(shí)驗(yàn)結(jié)果分析
    5.1 實(shí)驗(yàn)數(shù)據(jù)
    5.2 評(píng)測(cè)
    5.3 發(fā)現(xiàn)的關(guān)系分析
        5.3.1 Alzheimer's disease(老年癡呆癥)和indomethacin(消炎痛)
        5.3.2 Migraine(偏頭疼)和Magnesium(鎂)
        5.3.3 Schizophrenia(精神分裂癥)和Calcium-independent phospholipase A2(游離鈣磷脂酶A2)
    5.4 實(shí)驗(yàn)方法討論
        5.4.1 z分值、TFIDF、PMI結(jié)果對(duì)比分析
        5.4.2 語義類型和閾值分析
        5.4.3 融合計(jì)算分析
        5.4.4 概念檢索和段落檢索方法分析
結(jié)論
參考文獻(xiàn)
致謝



本文編號(hào):3854505

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/tushudanganlunwen/3854505.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶04569***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com