基于深度學習的醫(yī)療文本信息抽取
發(fā)布時間:2024-05-10 23:00
醫(yī)療文本的信息抽取是醫(yī)療領域自然語言處理研究中重要的一環(huán)。其目的是從電子化的醫(yī)療文本中,挖掘有價值的信息,并進行提取和分析,以幫助醫(yī)生或患者分析病情,實現醫(yī)療智能化。隨著人民的生活水平提高,對身體健康的關注日益加強,發(fā)展醫(yī)療信息化、將大量的醫(yī)療文本通過自然語言處理技術轉化為醫(yī)療知識是一份十分重要的工作。然而,如何對中文文本使用自然語言處理技術進行信息抽取,具有以下幾個問題:(一)由于中文的漢字和詞語都具有語義,這不同于英文等以單詞為最小語言單位的語言,在中文自然語言處理時,不同場景下,對中文的表征有不同需求,有的場景需要用字作為基本單位,有的場景需要以詞語作為基本單位。因此,在文本信息抽取任務中,需要一個魯棒性好,適應性強的中文分詞算法。(二)在醫(yī)療文本中,包含了如“疾病名稱”、“發(fā)病部位”、“癥狀”、“藥品名稱”和“治療手段”等大量有價值的信息,這是醫(yī)療文本信息抽取的主要內容。由于醫(yī)療文本多為描述復雜的非結構化自由文本,且具有很多專業(yè)領域的描述方式,如何準確的提取上述信息,是醫(yī)療文本信息抽取的難點和關鍵點。(三)僅僅識別醫(yī)療文本中的實體,還不足以滿足醫(yī)療文本信息抽取這一需求。實體的屬...
【文章頁數】:77 頁
【學位級別】:碩士
【部分圖文】:
本文編號:3969143
【文章頁數】:77 頁
【學位級別】:碩士
【部分圖文】:
圖1.2本文工作內容
杭州師范大學碩士學位論文緒論自然語言處理的基本任務,針對醫(yī)療文本的自然語言處理也叫醫(yī)療語言處理(MedicalLanguageProcessing,MLP)[17],該任務大致可分為兩個部分。第一部分是基礎研究,該部分主要涉及到自然語言處理的基本問題,如中文分詞、命名實體識別....
圖2.1簡單的前饋神經網絡結構
DeepLearning,DL)是機器學習的一種方法,是euralNetwork,ANN)為基本架構,對數據進行特,它大量借鑒了人們關于人腦、統計學和應用數更加強大的計算機、海量的數據和更深層的神經及程度和實用性都有巨大的發(fā)展。本節(jié)將對深度網絡絡(FeedforwardNeu....
圖2.2sigmoid函數圖像
換(affinetransformation),多層神經網絡的仿射變換的疊加。而激活函數的作用是在每一個仿射變換后引入非線性變換網絡輸出值應用非線性函數改變其值(這一過程稱為激活)下一層的輸入。的激活函數有Sigmoid、ReLU、Tanh等。oid函數oid函數可以將變....
圖2.3ReLU函數圖像
圖2.3ReLU函數圖像采用ReLU激活函數的神經元只需要進行加法、乘法和大小比較操作更加高效。另外,在優(yōu)化方面,ReLU激活函數為左飽和函數,且在數為1,相對于sigmoid型函數的兩端飽和,ReLU函數在一定程度上經網絡中可能會出現的梯度消失問題,并加速反....
本文編號:3969143
本文鏈接:http://sikaile.net/yixuelunwen/yiyuanguanlilunwen/3969143.html
最近更新
教材專著