基于用戶意圖分析的電子病歷檢索技術(shù)研究
發(fā)布時間:2021-01-05 02:38
隨著臨床醫(yī)學(xué)的發(fā)展和醫(yī)療信息技術(shù)的廣泛應(yīng)用,通過對正確的診斷和治療過程的分析來幫助臨床醫(yī)學(xué)中對病情的預(yù)判變得愈加的重要。同時,電子病歷的大規(guī)模應(yīng)用和推廣為后續(xù)的分析提供了重要的數(shù)據(jù)基礎(chǔ)。作為針對大規(guī)模信息領(lǐng)域的關(guān)鍵技術(shù),信息檢索在互聯(lián)網(wǎng)的應(yīng)用已經(jīng)非常成熟。但是由于醫(yī)療領(lǐng)域信息表述的特殊性以及內(nèi)容關(guān)系的復(fù)雜性,面向醫(yī)療領(lǐng)域的信息檢索技術(shù)研究還在初級階段。針對以上問題,本文在對中文電子病歷的處理基礎(chǔ)之上,實現(xiàn)對用戶查詢意圖的理解以及通過圖檢索的方式進(jìn)行數(shù)據(jù)檢索,進(jìn)而對查詢的結(jié)果進(jìn)行多樣化排序,最終達(dá)到有效利用電子病歷中存儲的大量數(shù)據(jù)來輔助醫(yī)生進(jìn)行分析研究與診斷的目的,提高醫(yī)生患者和醫(yī)療服務(wù)人員的醫(yī)療服務(wù)水平和效率。本文詳細(xì)的分析了中文電子病歷的結(jié)構(gòu)特點,對電子病歷進(jìn)行語義分析,抽取醫(yī)療實體以及實體關(guān)系,奠定了后續(xù)研究的基礎(chǔ)。在分析用戶查詢意圖方面,針對查詢的寬泛性和歧義性本文使用基于密度的聚類算法來對用戶查詢的歷史數(shù)據(jù)進(jìn)行子意圖的聚類分析。針對查詢中的醫(yī)療專業(yè)詞匯則提出一種基于信息熵計算概念特征相似度和概念相關(guān)度的方法,從而得出概念語義相似度的計算模型來識別醫(yī)療專業(yè)概念中的意圖。主要利用樸...
【文章來源】:中北大學(xué)山西省
【文章頁數(shù)】:81 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 課題研究背景及意義
1.2 國內(nèi)外相關(guān)研究現(xiàn)狀
1.3 本文主要研究內(nèi)容
1.4 本文的主要組織和結(jié)構(gòu)
1.5 本章小結(jié)
2 中文電子病歷語料分析
2.1 電子病歷結(jié)構(gòu)分析
2.2 語料標(biāo)注
2.3 中文分詞工具Hanlp
2.3.1 用戶自定義詞典
2.3.2 N-最短路徑分詞
2.3.3 摘要提取
2.3.4 依存句法解析
2.4 實體關(guān)系抽取
2.5 本章小結(jié)
3 基于電子病歷用戶查詢意圖識別方法研究
3.1 基于聚類算法的子意圖識別
3.1.1 DBscan算法
3.1.2 基于DBscan的意圖聚類
3.1.3 MinPts和半徑Eps的值
3.2 基于信息熵的子意圖識別
3.2.1 概念信息熵
3.2.2 樸素貝葉斯分類算法
3.2.3 概念信息熵
3.2.4 概念語義相似度計算
3.2.5 實驗結(jié)果及分析
3.3 本章小結(jié)
4 電子病歷圖結(jié)構(gòu)化檢索方法研究
4.1 電子病歷的圖結(jié)構(gòu)化
4.2 基本概念
4.2.1 電子病歷實體
4.2.2 具體定義
4.3 改進(jìn)的EMRSearch算法
4.4 實驗結(jié)果及分析
4.4.1 檢索質(zhì)量評價指標(biāo)
4.4.2 實驗結(jié)果分析
4.5 本章小結(jié)
5 電子病歷查詢結(jié)果多樣化排序
5.1 前期研究
5.2 多樣性排序算法
5.2.1 初期
5.2.2 問題的公式化
5.2.3 D(k)的貪心算法
5.2.4 算法描述
5.3 實驗結(jié)果
5.4 本章小結(jié)
6 總結(jié)與展望
6.1 總結(jié)
6.2 展望
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表的論文及所取得的研究成果
致謝
本文編號:2957852
【文章來源】:中北大學(xué)山西省
【文章頁數(shù)】:81 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 課題研究背景及意義
1.2 國內(nèi)外相關(guān)研究現(xiàn)狀
1.3 本文主要研究內(nèi)容
1.4 本文的主要組織和結(jié)構(gòu)
1.5 本章小結(jié)
2 中文電子病歷語料分析
2.1 電子病歷結(jié)構(gòu)分析
2.2 語料標(biāo)注
2.3 中文分詞工具Hanlp
2.3.1 用戶自定義詞典
2.3.2 N-最短路徑分詞
2.3.3 摘要提取
2.3.4 依存句法解析
2.4 實體關(guān)系抽取
2.5 本章小結(jié)
3 基于電子病歷用戶查詢意圖識別方法研究
3.1 基于聚類算法的子意圖識別
3.1.1 DBscan算法
3.1.2 基于DBscan的意圖聚類
3.1.3 MinPts和半徑Eps的值
3.2 基于信息熵的子意圖識別
3.2.1 概念信息熵
3.2.2 樸素貝葉斯分類算法
3.2.3 概念信息熵
3.2.4 概念語義相似度計算
3.2.5 實驗結(jié)果及分析
3.3 本章小結(jié)
4 電子病歷圖結(jié)構(gòu)化檢索方法研究
4.1 電子病歷的圖結(jié)構(gòu)化
4.2 基本概念
4.2.1 電子病歷實體
4.2.2 具體定義
4.3 改進(jìn)的EMRSearch算法
4.4 實驗結(jié)果及分析
4.4.1 檢索質(zhì)量評價指標(biāo)
4.4.2 實驗結(jié)果分析
4.5 本章小結(jié)
5 電子病歷查詢結(jié)果多樣化排序
5.1 前期研究
5.2 多樣性排序算法
5.2.1 初期
5.2.2 問題的公式化
5.2.3 D(k)的貪心算法
5.2.4 算法描述
5.3 實驗結(jié)果
5.4 本章小結(jié)
6 總結(jié)與展望
6.1 總結(jié)
6.2 展望
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表的論文及所取得的研究成果
致謝
本文編號:2957852
本文鏈接:http://sikaile.net/yixuelunwen/yiyuanguanlilunwen/2957852.html
最近更新
教材專著