基于深度學(xué)習(xí)的出生缺陷關(guān)系抽取及知識圖譜的構(gòu)建
發(fā)布時(shí)間:2021-02-09 07:47
出生缺陷是指胎兒在形成發(fā)育時(shí)期形成的機(jī)體結(jié)構(gòu)、代謝或功能異常等,它嚴(yán)重影響著出生人口質(zhì)量和兒童的生命健康,使得患兒的生活質(zhì)量得不到保障。此外,它還給患者家庭帶來了沉重的精神和經(jīng)濟(jì)壓力。目前國內(nèi)關(guān)于出生缺陷的相關(guān)統(tǒng)計(jì)信息較少,缺乏對出生缺陷疾病相關(guān)信息系統(tǒng)性地整合,這對出生缺陷的防預(yù)和治療非常不利。針對這個問題,本研究基于共現(xiàn)的方法,從PubMed歷年文獻(xiàn)中篩選出生缺陷與表型/癥狀、基因、致畸物/藥物等共同出現(xiàn)的句子。首先,本文對這些句子進(jìn)行了假陽性處理,根據(jù)遠(yuǎn)程監(jiān)督的思想,利用UMLS定義的關(guān)系,人工給句子中兩個實(shí)體標(biāo)注關(guān)系,從而建立起出生缺陷相關(guān)的語料庫。然后,利用人工標(biāo)注好的語料庫訓(xùn)練了三種不同的深度學(xué)習(xí)關(guān)系抽取模型,分別為Bi-LSTM+Attention、PCNN+Attention和BERT+Softmax模型。本文依據(jù)這三種模型的預(yù)測結(jié)果,采用多數(shù)表決和高置信度的方法,生成最終的關(guān)系抽取預(yù)測模型以得到<實(shí)體,關(guān)系,實(shí)體>三元組。接下來將三元組相關(guān)信息存儲在圖數(shù)據(jù)庫Neo4j中,構(gòu)建了出生缺陷領(lǐng)域的知識圖譜。最后,利用訓(xùn)練好的預(yù)測模型對新句子進(jìn)行預(yù)測從而推斷出句子...
【文章來源】:華東師范大學(xué)上海市 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:81 頁
【學(xué)位級別】:碩士
【部分圖文】:
知識圖譜構(gòu)建流程圖
Word2vec的兩種訓(xùn)練模型
華東師范大學(xué)碩士學(xué)位畢業(yè)論文25圖2-2LSTM單元結(jié)構(gòu)圖LSTM單元組成的單層網(wǎng)絡(luò)結(jié)構(gòu)如圖2-3所示:圖2-3LSTM網(wǎng)絡(luò)結(jié)構(gòu)圖輸入門(InputGate)主要用來控制當(dāng)前時(shí)刻的輸入,決定當(dāng)前時(shí)刻的輸入有多少可以被保存到單元(Cell)狀態(tài)。遺忘門(ForgetGate)控制著上一時(shí)刻的單元狀態(tài)有多少“記憶”可以被保留至當(dāng)前時(shí)刻。它使得神經(jīng)網(wǎng)絡(luò)具有了選擇記憶
【參考文獻(xiàn)】:
期刊論文
[1]基于BI-GRU-CRF模型的中文分詞法[J]. 車金立,唐力偉,鄧士杰,蘇續(xù)軍. 火力與指揮控制. 2019(09)
[2]知識圖譜技術(shù)綜述[J]. 徐增林,盛泳潘,賀麗榮,王雅芳. 電子科技大學(xué)學(xué)報(bào). 2016(04)
[3]出生缺陷概況及產(chǎn)前篩查[J]. 吳怡,程蔚蔚. 中國計(jì)劃生育和婦產(chǎn)科. 2016(01)
[4]大型中醫(yī)藥知識圖譜構(gòu)建研究[J]. 于彤,劉靜,賈李蓉,張竹綠,楊碩,劉麗紅,李敬華,于琦. 中國數(shù)字醫(yī)學(xué). 2015(03)
[5]孕中期產(chǎn)前篩查/產(chǎn)前診斷在減少出生缺陷中的價(jià)值[J]. 張方芳,徐永蓮,張光艷,劉佳,侯麗娜,伍文霞,余沂菲. 中國婦幼保健. 2013(28)
[6]出生缺陷的相關(guān)因素及預(yù)防現(xiàn)狀分析[J]. 曾小玲. 現(xiàn)代診斷與治療. 2012(06)
碩士論文
[1]基于深度學(xué)習(xí)的中文文本實(shí)體關(guān)系抽取研究與實(shí)現(xiàn)[D]. 佘恒.北京郵電大學(xué) 2019
[2]融合上下文信息的漢語分詞方法研究[D]. 李質(zhì)軒.北京交通大學(xué) 2018
本文編號:3025311
【文章來源】:華東師范大學(xué)上海市 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:81 頁
【學(xué)位級別】:碩士
【部分圖文】:
知識圖譜構(gòu)建流程圖
Word2vec的兩種訓(xùn)練模型
華東師范大學(xué)碩士學(xué)位畢業(yè)論文25圖2-2LSTM單元結(jié)構(gòu)圖LSTM單元組成的單層網(wǎng)絡(luò)結(jié)構(gòu)如圖2-3所示:圖2-3LSTM網(wǎng)絡(luò)結(jié)構(gòu)圖輸入門(InputGate)主要用來控制當(dāng)前時(shí)刻的輸入,決定當(dāng)前時(shí)刻的輸入有多少可以被保存到單元(Cell)狀態(tài)。遺忘門(ForgetGate)控制著上一時(shí)刻的單元狀態(tài)有多少“記憶”可以被保留至當(dāng)前時(shí)刻。它使得神經(jīng)網(wǎng)絡(luò)具有了選擇記憶
【參考文獻(xiàn)】:
期刊論文
[1]基于BI-GRU-CRF模型的中文分詞法[J]. 車金立,唐力偉,鄧士杰,蘇續(xù)軍. 火力與指揮控制. 2019(09)
[2]知識圖譜技術(shù)綜述[J]. 徐增林,盛泳潘,賀麗榮,王雅芳. 電子科技大學(xué)學(xué)報(bào). 2016(04)
[3]出生缺陷概況及產(chǎn)前篩查[J]. 吳怡,程蔚蔚. 中國計(jì)劃生育和婦產(chǎn)科. 2016(01)
[4]大型中醫(yī)藥知識圖譜構(gòu)建研究[J]. 于彤,劉靜,賈李蓉,張竹綠,楊碩,劉麗紅,李敬華,于琦. 中國數(shù)字醫(yī)學(xué). 2015(03)
[5]孕中期產(chǎn)前篩查/產(chǎn)前診斷在減少出生缺陷中的價(jià)值[J]. 張方芳,徐永蓮,張光艷,劉佳,侯麗娜,伍文霞,余沂菲. 中國婦幼保健. 2013(28)
[6]出生缺陷的相關(guān)因素及預(yù)防現(xiàn)狀分析[J]. 曾小玲. 現(xiàn)代診斷與治療. 2012(06)
碩士論文
[1]基于深度學(xué)習(xí)的中文文本實(shí)體關(guān)系抽取研究與實(shí)現(xiàn)[D]. 佘恒.北京郵電大學(xué) 2019
[2]融合上下文信息的漢語分詞方法研究[D]. 李質(zhì)軒.北京交通大學(xué) 2018
本文編號:3025311
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3025311.html
最近更新
教材專著