在線醫(yī)療文本中的實(shí)體識(shí)別研究
發(fā)布時(shí)間:2018-01-01 07:45
本文關(guān)鍵詞:在線醫(yī)療文本中的實(shí)體識(shí)別研究 出處:《北京大學(xué)學(xué)報(bào)(自然科學(xué)版)》2016年01期 論文類型:期刊論文
更多相關(guān)文章: 實(shí)體識(shí)別 數(shù)據(jù)挖掘 條件隨機(jī)場(chǎng) 醫(yī)療信息
【摘要】:針對(duì)在線醫(yī)療文本,設(shè)計(jì)考慮醫(yī)療領(lǐng)域特性的識(shí)別特征,并在自建數(shù)據(jù)集上進(jìn)行實(shí)體識(shí)別實(shí)驗(yàn)。針對(duì)常見的5類疾病:胃炎、肺癌、哮喘、高血壓和糖尿病,采用近年來較先進(jìn)的機(jī)器學(xué)習(xí)模型條件隨機(jī)場(chǎng),進(jìn)行訓(xùn)練和測(cè)試,抽取目標(biāo)實(shí)體包括疾病、癥狀、藥品、治療方法和檢查5類。通過采用逐一添加特征的實(shí)驗(yàn)方式,驗(yàn)證所提特征的有效性,取得總體上81.26%的準(zhǔn)確率和60.18%的召回率,隨后對(duì)識(shí)別特征給出進(jìn)一步分析。
[Abstract]:According to the online medical text recognition, feature design considering the characteristics of the medical field, and entity recognition experiment in self built data sets. For 5 kinds of common diseases, gastritis, lung cancer, asthma, hypertension and diabetes in recent years, with the more advanced machine learning model of CRFs, training and testing, including the target entity extraction diseases, symptoms, drug, treatment and examination of 5 class. The experimental way through one by one to add features, to verify the effectiveness of the proposed feature, achieved recall rate of overall accuracy rate of 81.26% and 60.18%, as well as the recognition features are further analyzed.
【作者單位】: 南開大學(xué)計(jì)算機(jī)與控制工程學(xué)院(軟件學(xué)院);
【基金】:天津市科技支撐項(xiàng)目(13ZCZDGX01098) 天津市自然科學(xué)基金(14JCQNJC00600) 中國民航信息技術(shù)科研基地開放課題(CAAC-ITRB-201303)資助
【分類號(hào)】:TP391.1
【正文快照】: 天津市科技支撐項(xiàng)目(13ZCZDGX01098)、天津市自然科學(xué)基金(14JCQNJC00600)和中國民航信息技術(shù)科研基地開放課題(CAAC-ITRB-201303)資助隨著生活水平的提高,人們對(duì)于健康問題日益關(guān)注;ヂ(lián)網(wǎng)行業(yè)的迅猛發(fā)展催生一大批在線醫(yī)療社區(qū)和醫(yī)療信息網(wǎng)站,為患者提供了多元化的醫(yī)療信息
【參考文獻(xiàn)】
相關(guān)期刊論文 前2條
1 楊錦鋒;于秋濱;關(guān)毅;蔣志鵬;;電子病歷命名實(shí)體識(shí)別和實(shí)體關(guān)系抽取研究綜述[J];自動(dòng)化學(xué)報(bào);2014年08期
2 葉楓;陳鶯鶯;周根貴;李昊e,
本文編號(hào):1363572
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1363572.html
最近更新
教材專著