醫(yī)學(xué)表型實體的同義關(guān)系分析和概念規(guī)范化研究
發(fā)布時間:2020-08-15 12:10
【摘要】:醫(yī)學(xué)知識圖譜構(gòu)建是醫(yī)學(xué)人工智能研究的重要問題,是臨床診療決策支持系統(tǒng)研發(fā)的重要支撐,其中表型實體及其關(guān)系是醫(yī)學(xué)知識圖譜的重要組成部分。然而由于醫(yī)學(xué)術(shù)語庫的動態(tài)變化和醫(yī)學(xué)文本的快速累積,醫(yī)學(xué)知識圖譜中表型實體及其關(guān)系的維護(hù)和更新耗時耗力。因此,自動預(yù)測醫(yī)學(xué)術(shù)語庫間的表型概念同義關(guān)系,并建立醫(yī)學(xué)文本中表型術(shù)語提及與規(guī)范化概念的映射關(guān)系是醫(yī)學(xué)知識圖譜構(gòu)建的基礎(chǔ)性研究工作。針對以上問題,本文的主要研究工作如下:首先,本文針對不同術(shù)語庫的表型同義關(guān)系分析問題,構(gòu)建了基于排序?qū)W習(xí)的分析方法。該方法將表型同義關(guān)系預(yù)測問題轉(zhuǎn)化為對候選表型術(shù)語排序的問題,利用PubMed文獻(xiàn)及相關(guān)信息,生成表型術(shù)語網(wǎng)絡(luò)嵌入表示。然后通過相似度計算和排序?qū)W習(xí)的排序方法預(yù)測不同表型術(shù)語的同義關(guān)系。其次,研制了基于分類學(xué)習(xí)的術(shù)語同義關(guān)系分析方法。該方法將表型同義關(guān)系預(yù)測問題轉(zhuǎn)化為對表型關(guān)系分類的問題,基于表型術(shù)語的網(wǎng)絡(luò)嵌入表示構(gòu)建表型術(shù)語關(guān)系的特征向量,分別使用支持向量機(jī)、邏輯回歸、多層感知機(jī)、樸素高斯貝葉斯和隨機(jī)森林等分類模型進(jìn)行表型術(shù)語關(guān)系分類,然后基于融合分類模型對表型關(guān)系分類,進(jìn)而預(yù)測表型之間的同義關(guān)系。本文在表型術(shù)語同義關(guān)系數(shù)據(jù)集上分別進(jìn)行了基于排序?qū)W習(xí)和基于分類學(xué)習(xí)方法的同義關(guān)系預(yù)測實驗。結(jié)果表明,兩種方法在表型同義關(guān)系分析問題上均有較好的表現(xiàn),其中基于分類的方法F1最高可達(dá)0.942。最后,針對表型概念規(guī)范化問題,本文將該問題分解為表型命名實體識別和表型實體鏈接兩個子任務(wù)。首先,分別利用卷積神經(jīng)網(wǎng)絡(luò)(CNN)和雙向長短期記憶網(wǎng)絡(luò)(BiLSTM)學(xué)習(xí)字符向量和詞向量,并結(jié)合條件隨機(jī)場(CRF)構(gòu)建BiLSTM-CNN-CRF模型,實現(xiàn)表型命名實體識別。然后基于CNN排序模型實現(xiàn)表型實體鏈接。并在National Center for Biotechnology Information(NCBI)疾病語料庫和BioCreative V Chemical Disease Relation(BC5CDR)疾病語料庫上進(jìn)行對比實驗,驗證了方法的有效性。
【學(xué)位授予單位】:北京交通大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:TP391.1;R-05
【圖文】:
游走模型來適用于網(wǎng)絡(luò)領(lǐng)域的各種定義。N0de2veC定義了兩個參數(shù)p和q,在廣度優(yōu)先逡逑采樣(Breadth-first邋Sampling,邋BFS)和深度優(yōu)先采樣(Depth-first邋Sampling,邋DFS)采樣中逡逑達(dá)到一個平衡,同時考慮到局部和宏觀的信息,具有很高的適應(yīng)性。如圖2-2所示,逡逑控制跳回上一節(jié)點的概率,當(dāng)從t跳到v以后,跳回節(jié)點t的概率為1/p,對應(yīng)BFS。g逡逑對應(yīng)DFS,控制從節(jié)點v跳到其他節(jié)點的概率。逡逑圖2-2邋node2vec節(jié)點領(lǐng)域表示逡逑Figure邋2-2邋node2vec邋node邋field邋representation逡逑2.1.3排序?qū)W習(xí)逡逑I邋</i邋I'邋^邐 ̄ ̄|i逡逑I邋^邐x:2-1邐i邐i邐…逡逑I邋l;,)邐A邋產(chǎn)邐X;*1邐i逡逑i邋;邐:邐卜夬學(xué)習(xí)系統(tǒng)逡逑I邋^邐^邐x%邐|逡逑■邐I邋)邐iy{2)邐yf舄)邐:逡逑il丨路集邐Mc?deJ邋h逡逑1邐^邐|p-j|逡逑i邋x.(邋:邐i:邋:、aJ11邋t邐:邋X]邋:逡逑i邋,邋I邐?邐'邋|逡逑!邋:逡逑I邋?邋j邐j邋h{x);逡逑s.邐逡逑MSi"邐sE逡逑圖2-3機(jī)器學(xué)習(xí)排序模型逡逑Figure邋2-3邋Machine邋Learning邋to邋Rank邋Model逡逑9逡逑
游走模型來適用于網(wǎng)絡(luò)領(lǐng)域的各種定義。N0de2veC定義了兩個參數(shù)p和q,在廣度優(yōu)先逡逑采樣(Breadth-first邋Sampling,邋BFS)和深度優(yōu)先采樣(Depth-first邋Sampling,邋DFS)采樣中逡逑達(dá)到一個平衡,同時考慮到局部和宏觀的信息,具有很高的適應(yīng)性。如圖2-2所示,逡逑控制跳回上一節(jié)點的概率,當(dāng)從t跳到v以后,跳回節(jié)點t的概率為1/p,對應(yīng)BFS。g逡逑對應(yīng)DFS,控制從節(jié)點v跳到其他節(jié)點的概率。逡逑圖2-2邋node2vec節(jié)點領(lǐng)域表示逡逑Figure邋2-2邋node2vec邋node邋field邋representation逡逑2.1.3排序?qū)W習(xí)逡逑I邋</i邋I'邋^邐 ̄ ̄|i逡逑I邋^邐x:2-1邐i邐i邐…逡逑I邋l;,)邐A邋產(chǎn)邐X;*1邐i逡逑i邋;邐:邐卜夬學(xué)習(xí)系統(tǒng)逡逑I邋^邐^邐x%邐|逡逑■邐I邋)邐iy{2)邐yf舄)邐:逡逑il丨路集邐Mc?deJ邋h逡逑1邐^邐|p-j|逡逑i邋x.(邋:邐i:邋:、aJ11邋t邐:邋X]邋:逡逑i邋,邋I邐?邐'邋|逡逑!邋:逡逑I邋?邋j邐j邋h{x);逡逑s.邐逡逑MSi"邐sE逡逑圖2-3機(jī)器學(xué)習(xí)排序模型逡逑Figure邋2-3邋Machine邋Learning邋to邋Rank邋Model逡逑9逡逑
(2)支持向量機(jī)(Support邋Vector邋Machines,SVM)逡逑支持向量機(jī)通常用來解決二分類問題[48]。它的基本模型是定義一個在特征空間上的逡逑間隔最大的線性分類器。如圖2-4所示:逡逑#逡逑H邋\邋?邋?逡逑?邋?邋?邋\/\/逡逑\v邋/margin逡逑O邐N/逡逑圖2-4支持向量機(jī)超平面劃分逡逑Figure邋2-4邋The邋Hyper邋plane邋of邋Support邋Vector邋Machine逡逑其中,//是最優(yōu)超平面,/^和/^分別是兩個支持平面,margin是兩個平面間的距逡逑離。支持向量機(jī)的輸入數(shù)據(jù)為1々=1,2,...,4,輸出為;;,少2罰保嗑必
本文編號:2794090
【學(xué)位授予單位】:北京交通大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:TP391.1;R-05
【圖文】:
游走模型來適用于網(wǎng)絡(luò)領(lǐng)域的各種定義。N0de2veC定義了兩個參數(shù)p和q,在廣度優(yōu)先逡逑采樣(Breadth-first邋Sampling,邋BFS)和深度優(yōu)先采樣(Depth-first邋Sampling,邋DFS)采樣中逡逑達(dá)到一個平衡,同時考慮到局部和宏觀的信息,具有很高的適應(yīng)性。如圖2-2所示,逡逑控制跳回上一節(jié)點的概率,當(dāng)從t跳到v以后,跳回節(jié)點t的概率為1/p,對應(yīng)BFS。g逡逑對應(yīng)DFS,控制從節(jié)點v跳到其他節(jié)點的概率。逡逑圖2-2邋node2vec節(jié)點領(lǐng)域表示逡逑Figure邋2-2邋node2vec邋node邋field邋representation逡逑2.1.3排序?qū)W習(xí)逡逑I邋</i邋I'邋^邐 ̄ ̄|i逡逑I邋^邐x:2-1邐i邐i邐…逡逑I邋l;,)邐A邋產(chǎn)邐X;*1邐i逡逑i邋;邐:邐卜夬學(xué)習(xí)系統(tǒng)逡逑I邋^邐^邐x%邐|逡逑■邐I邋)邐iy{2)邐yf舄)邐:逡逑il丨路集邐Mc?deJ邋h逡逑1邐^邐|p-j|逡逑i邋x.(邋:邐i:邋:、aJ11邋t邐:邋X]邋:逡逑i邋,邋I邐?邐'邋|逡逑!邋:逡逑I邋?邋j邐j邋h{x);逡逑s.邐逡逑MSi"邐sE逡逑圖2-3機(jī)器學(xué)習(xí)排序模型逡逑Figure邋2-3邋Machine邋Learning邋to邋Rank邋Model逡逑9逡逑
游走模型來適用于網(wǎng)絡(luò)領(lǐng)域的各種定義。N0de2veC定義了兩個參數(shù)p和q,在廣度優(yōu)先逡逑采樣(Breadth-first邋Sampling,邋BFS)和深度優(yōu)先采樣(Depth-first邋Sampling,邋DFS)采樣中逡逑達(dá)到一個平衡,同時考慮到局部和宏觀的信息,具有很高的適應(yīng)性。如圖2-2所示,逡逑控制跳回上一節(jié)點的概率,當(dāng)從t跳到v以后,跳回節(jié)點t的概率為1/p,對應(yīng)BFS。g逡逑對應(yīng)DFS,控制從節(jié)點v跳到其他節(jié)點的概率。逡逑圖2-2邋node2vec節(jié)點領(lǐng)域表示逡逑Figure邋2-2邋node2vec邋node邋field邋representation逡逑2.1.3排序?qū)W習(xí)逡逑I邋</i邋I'邋^邐 ̄ ̄|i逡逑I邋^邐x:2-1邐i邐i邐…逡逑I邋l;,)邐A邋產(chǎn)邐X;*1邐i逡逑i邋;邐:邐卜夬學(xué)習(xí)系統(tǒng)逡逑I邋^邐^邐x%邐|逡逑■邐I邋)邐iy{2)邐yf舄)邐:逡逑il丨路集邐Mc?deJ邋h逡逑1邐^邐|p-j|逡逑i邋x.(邋:邐i:邋:、aJ11邋t邐:邋X]邋:逡逑i邋,邋I邐?邐'邋|逡逑!邋:逡逑I邋?邋j邐j邋h{x);逡逑s.邐逡逑MSi"邐sE逡逑圖2-3機(jī)器學(xué)習(xí)排序模型逡逑Figure邋2-3邋Machine邋Learning邋to邋Rank邋Model逡逑9逡逑
(2)支持向量機(jī)(Support邋Vector邋Machines,SVM)逡逑支持向量機(jī)通常用來解決二分類問題[48]。它的基本模型是定義一個在特征空間上的逡逑間隔最大的線性分類器。如圖2-4所示:逡逑#逡逑H邋\邋?邋?逡逑?邋?邋?邋\/\/逡逑\v邋/margin逡逑O邐N/逡逑圖2-4支持向量機(jī)超平面劃分逡逑Figure邋2-4邋The邋Hyper邋plane邋of邋Support邋Vector邋Machine逡逑其中,//是最優(yōu)超平面,/^和/^分別是兩個支持平面,margin是兩個平面間的距逡逑離。支持向量機(jī)的輸入數(shù)據(jù)為1々=1,2,...,4,輸出為;;,少2罰保嗑必
本文編號:2794090
本文鏈接:http://sikaile.net/yixuelunwen/yiyuanguanlilunwen/2794090.html
最近更新
教材專著