面向中文醫(yī)療文本的信息抽取技術(shù)研究
發(fā)布時間:2021-08-10 01:28
隨著醫(yī)療信息化進程的推進,中文電子病歷的數(shù)量也在不斷增加。電子病歷包含了豐富的醫(yī)療領(lǐng)域知識,對于醫(yī)療健康服務(wù)的信息化、智能化發(fā)展有著重要的意義。電子病歷包含了病人就診過程中產(chǎn)生的各種診療信息,有效的挖掘并利用其中的醫(yī)療知識對于醫(yī)療事業(yè)的健康發(fā)展有著積極的意義。不同于通用領(lǐng)域的信息抽取,中文電子病歷固有的很多特點,使得對于中文電子病歷的信息抽取面臨一定的難度。本課題在充分調(diào)研通用領(lǐng)域信息抽取的基礎(chǔ)上,對中文醫(yī)療領(lǐng)域的信息抽取任務(wù)展開了以下研究:首先,傳統(tǒng)的命名實體識別方法需要人工構(gòu)造大量的特征,針對這一問題,本文設(shè)計了基于字標注的醫(yī)療命名實體識別算法,通過在詞向量表征中添加詞性、詞典等特征,以豐富原有字向量的表示,并在BiLSTM的輸出層后加入CRF層,來學(xué)習(xí)標簽之間的依賴關(guān)系。在自建數(shù)據(jù)集上的實驗結(jié)果表明,本文提出的基于字標注的BiLSTM-CRF方法,能夠有效學(xué)習(xí)句子的表征,提升醫(yī)療實體識別的效果。其次,針對醫(yī)療實體關(guān)系類別較多,受限于有限的標注數(shù)據(jù),提出一種基于特征融合的方法,首先提取句子的詞法特征和句法特征作為基本特征,通過支持向量機模型構(gòu)建多個分類器預(yù)測醫(yī)療實體的關(guān)系類別。并根...
【文章來源】:北京工業(yè)大學(xué)北京市 211工程院校
【文章頁數(shù)】:73 頁
【學(xué)位級別】:碩士
【部分圖文】:
典型的感知器網(wǎng)絡(luò)模型結(jié)構(gòu)圖
圖 2-2 多層感知器網(wǎng)絡(luò)模型結(jié)構(gòu)圖Figure 2-2 Structure of Multilayer Perceptor Network Mod感知機還引入了新的激活函數(shù),常見的有 sigmo(公式 2-3)等。單層感知器僅能學(xué)習(xí)線性函數(shù),進行學(xué)習(xí)。( )11xsigmoid xe = tanh( )x xx xe exe e = 數(shù)也稱為 Logistic 函數(shù),取值范圍為(0,1)之間于輸入的歸一化。圖 2-3 為 sigmoid 函數(shù)的圖像較強,但是它的缺點在于軟飽和性,反向傳播的,所以一般用作二分類問題或者作為輸出層的激 函數(shù)的變形,取值范圍在(-1,1)之間,實際應(yīng)
圖 2-2 多層感知器網(wǎng)絡(luò)模型結(jié)構(gòu)圖Figure 2-2 Structure of Multilayer Perceptor Network Model多層感知機還引入了新的激活函數(shù),常見的有 sigmoid 函 函數(shù)(公式 2-3)等。單層感知器僅能學(xué)習(xí)線性函數(shù),而多函數(shù)進行學(xué)習(xí)。( )11xsigmoid xe = tanh( )x xx xe exe e = id 函數(shù)也稱為 Logistic 函數(shù),取值范圍為(0,1)之間,可或用于輸入的歸一化。圖 2-3 為 sigmoid 函數(shù)的圖像。sig性也較強,但是它的缺點在于軟飽和性,反向傳播的過程情況,所以一般用作二分類問題或者作為輸出層的激活函moid 函數(shù)的變形,取值范圍在(-1,1)之間,實際應(yīng)用中
本文編號:3333179
【文章來源】:北京工業(yè)大學(xué)北京市 211工程院校
【文章頁數(shù)】:73 頁
【學(xué)位級別】:碩士
【部分圖文】:
典型的感知器網(wǎng)絡(luò)模型結(jié)構(gòu)圖
圖 2-2 多層感知器網(wǎng)絡(luò)模型結(jié)構(gòu)圖Figure 2-2 Structure of Multilayer Perceptor Network Mod感知機還引入了新的激活函數(shù),常見的有 sigmo(公式 2-3)等。單層感知器僅能學(xué)習(xí)線性函數(shù),進行學(xué)習(xí)。( )11xsigmoid xe = tanh( )x xx xe exe e = 數(shù)也稱為 Logistic 函數(shù),取值范圍為(0,1)之間于輸入的歸一化。圖 2-3 為 sigmoid 函數(shù)的圖像較強,但是它的缺點在于軟飽和性,反向傳播的,所以一般用作二分類問題或者作為輸出層的激 函數(shù)的變形,取值范圍在(-1,1)之間,實際應(yīng)
圖 2-2 多層感知器網(wǎng)絡(luò)模型結(jié)構(gòu)圖Figure 2-2 Structure of Multilayer Perceptor Network Model多層感知機還引入了新的激活函數(shù),常見的有 sigmoid 函 函數(shù)(公式 2-3)等。單層感知器僅能學(xué)習(xí)線性函數(shù),而多函數(shù)進行學(xué)習(xí)。( )11xsigmoid xe = tanh( )x xx xe exe e = id 函數(shù)也稱為 Logistic 函數(shù),取值范圍為(0,1)之間,可或用于輸入的歸一化。圖 2-3 為 sigmoid 函數(shù)的圖像。sig性也較強,但是它的缺點在于軟飽和性,反向傳播的過程情況,所以一般用作二分類問題或者作為輸出層的激活函moid 函數(shù)的變形,取值范圍在(-1,1)之間,實際應(yīng)用中
本文編號:3333179
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3333179.html
最近更新
教材專著