天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于半監(jiān)督條件隨機(jī)場(chǎng)的中文電子病歷分詞研究與應(yīng)用

發(fā)布時(shí)間:2021-05-19 06:20
  電子病歷(Electrical Medical Record,EMR)是醫(yī)療健康大數(shù)據(jù)的重要組成部分。一份電子病歷由醫(yī)護(hù)人員記錄,通常包括數(shù)值化數(shù)據(jù),醫(yī)療圖像以及描述性文本。對(duì)電子病歷進(jìn)行分析利用對(duì)提升醫(yī)療服務(wù)水平具有重要意義。對(duì)電子病歷中描述性文本的分析與處理依賴于電子病歷的中文分詞結(jié)果。與英語類語言不同,漢語語言使用字符表示語言實(shí)體,不同的字符組合表示不同的語言成分,如單詞,主語,謂語,副詞等。漢語常用字符約為5,000個(gè),不同的字符組合表示了豐富多彩的漢語詞匯。在應(yīng)用自然語言處理技術(shù)處理中文電子病歷中的描述性文本時(shí),一個(gè)基本的前提是從中文字符序列中提取出相應(yīng)的單詞序列,并基于單詞序列進(jìn)行后續(xù)的詞性標(biāo)注、語義角色提取、文檔分類等分析任務(wù)。隨著電子病歷的大量產(chǎn)生,如何有效的處理中文電子病歷是一個(gè)急需解決的難題。中文分詞作為中文自然語言處理的基本任務(wù),得到了廣泛的研究。學(xué)術(shù)界提出了一系列方法,并在公開數(shù)據(jù)集上取得了良好的效果。傳統(tǒng)分詞算法多基于有監(jiān)督的學(xué)習(xí)方式,訓(xùn)練與測(cè)試數(shù)據(jù)集一般是來自于新聞等領(lǐng)域的語料。語料規(guī)模相對(duì)較小,但標(biāo)注難度大。算法推廣應(yīng)用到其他領(lǐng)域,如醫(yī)學(xué)、法律、金融時(shí),面... 

【文章來源】:上海交通大學(xué)上海市 211工程院校 985工程院校 教育部直屬院校

【文章頁數(shù)】:67 頁

【學(xué)位級(jí)別】:碩士

【文章目錄】:
摘要
ABSTRACT
第一章 研究背景與現(xiàn)狀
    1.1 電子病歷
    1.2 電子病歷處理研究現(xiàn)狀
    1.3 中文自然語言處理研究現(xiàn)狀
    1.4 分布式機(jī)器學(xué)習(xí)
    1.5 本課題主要研究內(nèi)容
    1.6 論文安排
第二章 基于詞典的半監(jiān)督CRF中文分詞研究
    2.1 條件隨機(jī)場(chǎng)
        2.1.1 概率圖模型
        2.1.2 一階鏈?zhǔn)綏l件隨機(jī)場(chǎng)
    2.2 基于CRF的中文分詞算法
        2.2.1 標(biāo)簽體系
        2.2.2 前向向量與后向向量
        2.2.3 特征函數(shù)模板
    2.3 基于詞典的半監(jiān)督CRF中文分詞算法
        2.3.1 半監(jiān)督CRF
        2.3.2 基于詞典匹配的中文電子病歷分詞
        2.3.3 由CRF預(yù)測(cè)中文字符序列的分詞結(jié)果
    2.4 基于詞典的半監(jiān)督CRF分詞算法性能研究
        2.4.1 詞典的獲取
        2.4.2 訓(xùn)練與測(cè)試數(shù)據(jù)
        2.4.3 特征函數(shù)選取
        2.4.4 性能分析
    2.5 本章總結(jié)
第三章 基于隱式狄利克雷分布的電子病歷分類
    3.1 隱式狄利克雷分布
        3.1.1 貝葉斯網(wǎng)絡(luò)
        3.1.2 LDA潛在語義分析
    3.2 基于參數(shù)服務(wù)器的LDA算法模型并行加速
    3.3 基于LDA的電子病歷分類算法
        3.3.1 文檔分類
        3.3.2 LDA與LR結(jié)合的電子病歷分類
    3.4 基于LDA與LR的電子病歷科室分類算法性能研究
        3.4.1 電子病歷科室分類實(shí)驗(yàn)與分析
        3.4.2 基于參數(shù)服務(wù)器的LDA并行加速性能比較
    3.5 基于電子病歷分詞結(jié)果的隱含特征挖掘
    3.6 本章總結(jié)
第四章 系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)
    4.1 微服務(wù)架構(gòu)
    4.2 系統(tǒng)設(shè)計(jì)
    4.3 負(fù)載均衡
    4.4 功能接口展示
    4.5 本章總結(jié)
第五章 全文總結(jié)
參考文獻(xiàn)
致謝
攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文



本文編號(hào):3195282

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/yixuelunwen/yiyuanguanlilunwen/3195282.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶c8851***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com