天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 社科論文 > 圖書檔案論文 >

精準(zhǔn)醫(yī)學(xué)知識庫構(gòu)建中的生物醫(yī)學(xué)命名實體識別研究

發(fā)布時間:2020-12-30 18:50
  精準(zhǔn)醫(yī)學(xué)是通過整合分析患者生物醫(yī)學(xué)數(shù)據(jù),構(gòu)建發(fā)現(xiàn)個體患病機(jī)制的知識圖譜,制定個性化診療方案的前沿醫(yī)學(xué)理念。以基因-變異-疾病關(guān)系為核心內(nèi)容的生物醫(yī)學(xué)知識庫,對精準(zhǔn)醫(yī)學(xué)的科學(xué)研究和臨床實踐都具有不可替代的重要作用。面對海量且飛速增長的生物醫(yī)學(xué)文獻(xiàn),通過人工抽取知識將耗費(fèi)大量的時間與人力,因此利用機(jī)器學(xué)習(xí)技術(shù)自動挖掘生物醫(yī)學(xué)文本逐漸成為精準(zhǔn)醫(yī)學(xué)知識庫構(gòu)建中的關(guān)鍵環(huán)節(jié)。生物醫(yī)學(xué)命名實體識別,即用計算機(jī)自動識別出文本中表示指定生物醫(yī)學(xué)實體類型的名稱,是生物文獻(xiàn)知識挖掘過程中基礎(chǔ)而關(guān)鍵的一步。本文以精準(zhǔn)醫(yī)學(xué)知識庫構(gòu)建為背景,對生物醫(yī)學(xué)文獻(xiàn)中的基因、基因變異、疾病三種命名實體識別的方法和技術(shù)開展了系統(tǒng)研究,提出了結(jié)合深度神經(jīng)網(wǎng)絡(luò)和傳統(tǒng)方法,用于識別基因變異實體的新算法模型,開發(fā)了識別和標(biāo)注三種實體的軟件系統(tǒng)。主要研究結(jié)果如下:1.對生物醫(yī)學(xué)命名實體識別算法的研究現(xiàn)狀進(jìn)行了調(diào)查,并對算法中采用的各種方法模型展開了研究。調(diào)研發(fā)現(xiàn)當(dāng)前主流的疾病與基因變異識別模型大多基于統(tǒng)計機(jī)器學(xué)習(xí)算法,需要繁復(fù)的人工特征工程,且依賴設(shè)計人員的專業(yè)知識背景和自然語言處理經(jīng)驗。同時,基因命名實體識別算法較為成熟,已經(jīng)存在多... 

【文章來源】:軍事科學(xué)院北京市

【文章頁數(shù)】:59 頁

【學(xué)位級別】:碩士

【部分圖文】:

精準(zhǔn)醫(yī)學(xué)知識庫構(gòu)建中的生物醫(yī)學(xué)命名實體識別研究


圖3.1分布式詞向量在二維向量空間中示例圖

多層感知器,非線形,激活函數(shù),神經(jīng)網(wǎng)絡(luò)


軍事科學(xué)院碩士學(xué)位論文過反復(fù)實驗進(jìn)行篩選。而無監(jiān)督的詞向量與有監(jiān)Network)結(jié)合的端到端(End-to-End)的學(xué)習(xí)方式,避層神經(jīng)網(wǎng)絡(luò)自主提取輸入數(shù)據(jù)中的特征,能夠?qū)W感知機(jī)(Multilayer Perceptron,MLP)[41]是一種前向的人量到一組輸出向量,層與層之間為全聯(lián)接。設(shè)輸入 N=|x|。如圖 3.2 所示,每個輸入單元 xi都由一個 映射到隱藏層單元 hj。接著把隱藏層單元作為下絡(luò)中添加多個隱藏層對輸入數(shù)據(jù)進(jìn)行深度的學(xué)習(xí)

神經(jīng)網(wǎng)絡(luò)模型


圖 3.3 使用 Dropout 的神經(jīng)網(wǎng)絡(luò)模型Dropout 算法一方面使得整體訓(xùn)練過程相當(dāng)于同時訓(xùn)練多個神經(jīng)網(wǎng)絡(luò)取平均結(jié)果,類似機(jī)器學(xué)習(xí)中訓(xùn)練多個分類器再綜合的作法,通過集成多個模型減少過擬合。另一方面也減少了神經(jīng)元之間復(fù)雜的共適應(yīng)關(guān)系,防止了某些特征僅在其他特定特征出現(xiàn)時有效的情況,提升了模型的泛化能力。本文在訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)中加入 dropout,以訓(xùn)練泛化性能更好的模型,防止過擬合。3.3.5 循環(huán)神經(jīng)網(wǎng)絡(luò)如果在 MLP 的神經(jīng)元上增加一個循環(huán)連接,就可以得到循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Networks, RNNs)[49]。如圖 3.4 所示,在 RNN 中,神經(jīng)元不僅可以利用當(dāng)前輸入還可以結(jié)合之前隱藏層單元的輸出映射本次輸出,這樣就給予了神經(jīng)網(wǎng)絡(luò)一定的記憶能力,能夠利用前序數(shù)據(jù)中的信息對當(dāng)前輸出進(jìn)行處理,更有助于處理文本信息。

【參考文獻(xiàn)】:
期刊論文
[1]MBNER:面向生物醫(yī)學(xué)領(lǐng)域的多種實體識別系統(tǒng)[J]. 楊婭,楊志豪,林鴻飛,宮本東,王健.  中文信息學(xué)報. 2016(01)



本文編號:2948126

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/tushudanganlunwen/2948126.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶87173***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com