天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

疾病名稱識(shí)別和規(guī)范化

發(fā)布時(shí)間:2024-07-07 04:02
  近年來,隨著生物醫(yī)學(xué)實(shí)驗(yàn)方法的變革,生物醫(yī)學(xué)方面的實(shí)驗(yàn)數(shù)據(jù)和文獻(xiàn)資料呈指數(shù)級(jí)增長(zhǎng),如何從如此龐大的科學(xué)文獻(xiàn)數(shù)據(jù)中快速有效地抽取有價(jià)值的信息,是當(dāng)前亟待解決的問題。生物醫(yī)學(xué)領(lǐng)域(如基因/蛋白質(zhì)、化學(xué)物和疾病等)的實(shí)體識(shí)別與規(guī)范化是生物醫(yī)學(xué)文本挖掘的基礎(chǔ),它對(duì)生物醫(yī)學(xué)實(shí)體關(guān)系的抽取和生物醫(yī)學(xué)知識(shí)庫(kù)的建立等方面都有著重要的研究意義。其中,疾病名稱識(shí)別與規(guī)范化是從生物醫(yī)學(xué)文獻(xiàn)資料中自動(dòng)抽取疾病名稱并且鏈接到指定疾病數(shù)據(jù)庫(kù)中。針對(duì)這一任務(wù),本文進(jìn)行了以下三個(gè)方面的研究工作:(1)基于句法和語義特征的疾病名稱識(shí)別。針對(duì)目前疾病名稱識(shí)別中存在的問題,在條件隨機(jī)場(chǎng)模型的基礎(chǔ)上,提出了一系列新的句法特征和語義特征來獲取疾病名稱在句子中的結(jié)構(gòu)信息以及在數(shù)據(jù)庫(kù)中的語義信息。實(shí)驗(yàn)結(jié)果表明,本文的特征能夠在疾病實(shí)體識(shí)別任務(wù)中取得較好的結(jié)果。(2)基于深度學(xué)習(xí)的疾病名稱識(shí)別。為了緩解傳統(tǒng)機(jī)器學(xué)習(xí)中特征稀疏性問題,本文采用了高性能的深度學(xué)習(xí)模型BiLSTM-CRF來實(shí)現(xiàn)疾病名稱識(shí)別,探討了不同的句法特征以及語義特征對(duì)疾病名稱識(shí)別的影響。實(shí)驗(yàn)表明,深度學(xué)習(xí)模型獲得了與當(dāng)前最高性能相當(dāng)?shù)慕Y(jié)果。(3)基于上下文信息的疾病...

【文章頁數(shù)】:73 頁

【學(xué)位級(jí)別】:碩士

【文章目錄】:
摘要
abstract
第一章 緒論
    1.1 研究背景與意義
    1.2 課題研究現(xiàn)狀
        1.2.1 生物醫(yī)學(xué)領(lǐng)域的疾病名稱識(shí)別
        1.2.2 生物醫(yī)學(xué)領(lǐng)域的疾病名稱規(guī)范化
    1.3 研究?jī)?nèi)容
    1.4 文章組織結(jié)構(gòu)
第二章 相關(guān)知識(shí)方法
    2.1 相關(guān)實(shí)驗(yàn)方法
        2.1.1 條件隨機(jī)場(chǎng)
        2.1.2 循環(huán)神經(jīng)網(wǎng)絡(luò)
        2.1.3 卷積神經(jīng)網(wǎng)絡(luò)
        2.1.4 注意力機(jī)制
    2.2 相關(guān)工具及資源
        2.2.1 句法分析器
        2.2.2 縮寫識(shí)別工具
        2.2.3 復(fù)合物識(shí)別工具
        2.2.4 疾病詞典
        2.2.5 深度學(xué)習(xí)開源框架
第三章 基于句法和語義特征的疾病名稱識(shí)別
    3.1 疾病名稱識(shí)別介紹
        3.1.1 任務(wù)描述
        3.1.2 疾病名稱識(shí)別難點(diǎn)
    3.2 疾病名稱識(shí)別框架
    3.3 特征提取
        3.3.1 詞法特征
        3.3.2 句法特征
        3.3.3 語義特征
    3.4 實(shí)驗(yàn)
        3.4.1 實(shí)驗(yàn)語料
        3.4.2 評(píng)估標(biāo)準(zhǔn)
        3.4.3 語料預(yù)處理
        3.4.4 實(shí)驗(yàn)結(jié)果
    3.5 本章小結(jié)
第四章 基于深度學(xué)習(xí)的疾病名稱識(shí)別
    4.1 疾病名稱識(shí)別模型
    4.2 特征提取
        4.2.1 詞法特征(MOR)
        4.2.2 句法特征(SYN)
        4.2.3 語義特征(SEM)
    4.3 實(shí)驗(yàn)
        4.3.1 參數(shù)設(shè)置
        4.3.2 實(shí)驗(yàn)結(jié)果
    4.4 本章小結(jié)
第五章 基于上下文信息的疾病名稱規(guī)范化
    5.1 疾病規(guī)范化介紹
        5.1.1 任務(wù)描述
        5.1.2 任務(wù)難點(diǎn)
    5.2 疾病名稱規(guī)范化
        5.2.1 數(shù)據(jù)預(yù)處理
        5.2.2 候選集生成
        5.2.3 候選集消歧
    5.3 實(shí)驗(yàn)
        5.3.1 實(shí)驗(yàn)語料
        5.3.2 評(píng)估標(biāo)準(zhǔn)
        5.3.3 實(shí)驗(yàn)結(jié)果
    5.4 本章小結(jié)
第六章 總結(jié)與展望
    6.1 工作總結(jié)
    6.2 工作展望
參考文獻(xiàn)
攻讀碩士學(xué)位期間的研究成果
致謝



本文編號(hào):4003125

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/4003125.html

上一篇:三角網(wǎng)格孔洞修補(bǔ)算法研究  
下一篇:沒有了

Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶ce666***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com