天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

基于機(jī)器學(xué)習(xí)的生物醫(yī)學(xué)命名實(shí)體識別的研究

發(fā)布時(shí)間:2022-09-17 21:06
  在大數(shù)據(jù)時(shí)代的背景下,生物醫(yī)學(xué)的研究正在快速發(fā)展,每年都有大量的文獻(xiàn)在增加。海量的生物醫(yī)學(xué)文獻(xiàn)作為一個(gè)巨大的非結(jié)構(gòu)化數(shù)據(jù)庫,提供了豐富的生物醫(yī)學(xué)研究知識,是最重要的生物醫(yī)學(xué)領(lǐng)域資源。因此,如何從這些海量的文獻(xiàn)中快速獲取專業(yè)知識受到了越來越多的關(guān)注。生物醫(yī)學(xué)文本挖掘技術(shù)在文本知識的自動(dòng)獲取中發(fā)揮著重要的作用,而命名實(shí)體識別作為該項(xiàng)技術(shù)的任務(wù)之一,旨在從生物醫(yī)學(xué)文獻(xiàn)中識別出指定類型的名稱,如蛋白質(zhì)、DNA、RNA、細(xì)胞等,為進(jìn)一步地抽取關(guān)系和其他潛在信息提供了前提。本文的研究工作包含以下三個(gè)部分:(1)基于條件隨機(jī)場的生物醫(yī)學(xué)命名實(shí)體識別。使用生物醫(yī)學(xué)語料庫,根據(jù)生物實(shí)體的特性人工設(shè)計(jì)了15種特征;采用條件隨機(jī)場算法訓(xùn)練模型,結(jié)合單獨(dú)最優(yōu)組合法挑選出最優(yōu)的特征集,分析各個(gè)特征對實(shí)驗(yàn)結(jié)果的影響,經(jīng)過測試評估,綜合評價(jià)值F最高可達(dá)75.91%。(2)基于雙向長短期記憶網(wǎng)絡(luò)聯(lián)合條件隨機(jī)場的生物醫(yī)學(xué)命名實(shí)體識別。傳統(tǒng)的機(jī)器學(xué)習(xí)算法不僅需要人工選取特征,還需要一定的領(lǐng)域知識;同時(shí)模型的好壞取決于高質(zhì)量的數(shù)據(jù)集和最優(yōu)的特征集合,這需要付出眾多的人力代價(jià)。為了解決傳統(tǒng)方法存在的問題,本文提出了基于雙向長... 

【文章頁數(shù)】:56 頁

【學(xué)位級別】:碩士

【文章目錄】:
摘要
Abstract
第一章 緒論
    1.1 研究背景與意義
        1.1.1 課題研究背景
        1.1.2 課題研究的意義
    1.2 國內(nèi)外研究現(xiàn)狀
    1.3 本文的主要研究內(nèi)容
    1.4 本文的組織結(jié)構(gòu)
第二章 相關(guān)理論與技術(shù)介紹
    2.1 生物醫(yī)學(xué)命名實(shí)體識別概述
    2.2 相關(guān)模型介紹
        2.2.1 隱馬爾可夫模型
        2.2.2 條件隨機(jī)場模型
        2.2.3 長短期記憶神經(jīng)網(wǎng)絡(luò)模型
    2.3 本章小節(jié)
第三章 基于CRF的生物醫(yī)學(xué)命名實(shí)體識別
    3.1 研究內(nèi)容
        3.1.1 構(gòu)建實(shí)驗(yàn)數(shù)據(jù)集
        3.1.2 特征選擇
    3.2 CRF方法
        3.2.1 特征模板
        3.2.2 模型訓(xùn)練
        3.2.3 評估方法
    3.3 實(shí)驗(yàn)結(jié)果與分析
    3.4 本章小結(jié)
第四章 基于Bi-LSTM-CRF的生物醫(yī)學(xué)命名實(shí)體識別
    4.1 詞表示模型
        4.1.1 獨(dú)熱表示
        4.1.2 分布式表示
        4.1.3 Skip-gram和CBOW模型
    4.2 Bi-LSTM-CRF模型
        4.2.1 詞向量的訓(xùn)練
        4.2.2 實(shí)體模型的訓(xùn)練
        4.2.3 訓(xùn)練參數(shù)
    4.3 實(shí)驗(yàn)結(jié)果與評價(jià)
    4.4 本章小結(jié)
第五章 生物醫(yī)學(xué)命名實(shí)體識別系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
    5.1 命名實(shí)體識別系統(tǒng)的設(shè)計(jì)
        5.1.1 總體架構(gòu)設(shè)計(jì)
        5.1.2 功能模塊設(shè)計(jì)
        5.1.3 系統(tǒng)開發(fā)技術(shù)
    5.2 命名實(shí)體識別系統(tǒng)的實(shí)現(xiàn)
        5.2.1 文獻(xiàn)的預(yù)處理
        5.2.2 實(shí)體標(biāo)注展示
        5.2.3 實(shí)體查詢
        5.2.4 圖表展示
        5.2.5 實(shí)體識別關(guān)系的展示
    5.3 本章小結(jié)
第六章 總結(jié)與展望
    6.1 總結(jié)
    6.2 展望
參考文獻(xiàn)
附錄1 攻讀碩士學(xué)位期間撰寫的論文
致謝


【參考文獻(xiàn)】:
期刊論文
[1]基于B/S架構(gòu)的試驗(yàn)數(shù)據(jù)管理系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J]. 樊丹丹,于慧勇,劉晨.  電子測量技術(shù). 2018(10)
[2]命名實(shí)體識別研究綜述[J]. 劉瀏,王東波.  情報(bào)學(xué)報(bào). 2018(03)
[3]一種基于Word2Vec的訓(xùn)練效果優(yōu)化策略研究[J]. 王飛,譚新.  計(jì)算機(jī)應(yīng)用與軟件. 2018(01)
[4]基于Python的MYSQL數(shù)據(jù)庫訪問技術(shù)[J]. 黃傳祿.  現(xiàn)代信息科技. 2017(04)
[5]面向互聯(lián)網(wǎng)資源的醫(yī)學(xué)命名實(shí)體識別研究[J]. 田家源,楊東華,王宏志.  計(jì)算機(jī)科學(xué)與探索. 2018(06)
[6]基于詞表示方法的生物醫(yī)學(xué)命名實(shí)體識別[J]. 李麗雙,何紅磊,劉珊珊,黃德根.  小型微型計(jì)算機(jī)系統(tǒng). 2016(02)
[7]命名實(shí)體識別研究進(jìn)展綜述[J]. 孫鎮(zhèn),王惠臨.  現(xiàn)代圖書情報(bào)技術(shù). 2010(06)
[8]生物醫(yī)學(xué)命名實(shí)體識別的研究與進(jìn)展[J]. 鄭強(qiáng),劉齊軍,王正華,朱云平.  計(jì)算機(jī)應(yīng)用研究. 2010(03)

博士論文
[1]生物命名實(shí)體識別及生物文本分類[D]. 豆增發(fā).西安電子科技大學(xué) 2013

碩士論文
[1]基于文本挖掘的生物命名實(shí)體識別算法研究[D]. 高冰濤.西北農(nóng)林科技大學(xué) 2018
[2]基于遞歸神經(jīng)網(wǎng)絡(luò)的生物醫(yī)學(xué)命名實(shí)體識別[D]. 金留可.大連理工大學(xué) 2016
[3]生物醫(yī)學(xué)領(lǐng)域的命名實(shí)體識別和標(biāo)準(zhǔn)化[D]. 范文婷.大連理工大學(xué) 2013
[4]一種HMM的學(xué)習(xí)算法[D]. 張路.西南交通大學(xué) 2010
[5]線性鏈條件隨機(jī)場訓(xùn)練算法優(yōu)化的研究[D]. 陳天緣.復(fù)旦大學(xué) 2010



本文編號:3679939

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3679939.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶46982***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com