中文醫(yī)學(xué)術(shù)語(yǔ)資源對(duì)真實(shí)世界醫(yī)學(xué)文檔語(yǔ)料的覆蓋度調(diào)研
發(fā)布時(shí)間:2023-10-11 23:24
背景:隨著互聯(lián)網(wǎng)和信息技術(shù)的快速發(fā)展,大數(shù)據(jù)和人工智能在醫(yī)療領(lǐng)域的應(yīng)用逐漸變得全面而深入,促進(jìn)著我國(guó)醫(yī)療衛(wèi)生信息化建設(shè)。我國(guó)擁有著海量的醫(yī)療健康大數(shù)據(jù)資源,然而醫(yī)學(xué)術(shù)語(yǔ)在真實(shí)世界中所使用的表達(dá)方式復(fù)雜多樣,對(duì)醫(yī)療健康大數(shù)據(jù)資源的應(yīng)用造成了阻礙。因此,我國(guó)已發(fā)布大量的中文醫(yī)學(xué)術(shù)語(yǔ)資源,為醫(yī)療健康大數(shù)據(jù)的整合與應(yīng)用打下了良好的基礎(chǔ)。目的:通過(guò)統(tǒng)計(jì)中文醫(yī)學(xué)術(shù)語(yǔ)資源和真實(shí)世界醫(yī)學(xué)文檔之間相同術(shù)語(yǔ)的數(shù)量,探索國(guó)內(nèi)既有中文醫(yī)學(xué)術(shù)語(yǔ)資源對(duì)真實(shí)世界醫(yī)學(xué)文檔語(yǔ)料的描述能力。方法:本研究系統(tǒng)的收集了包括國(guó)家標(biāo)準(zhǔn)、醫(yī)學(xué)詞典在內(nèi)的15個(gè)中文醫(yī)學(xué)術(shù)語(yǔ)資源,還收集了6個(gè)以醫(yī)學(xué)指南、電子病歷為代表的臨床文本作為真實(shí)世界數(shù)據(jù),并從中提取以疾病、癥狀等臨床表型為代表的醫(yī)學(xué)術(shù)語(yǔ)。隨后以國(guó)際上權(quán)威的UMLS本體系統(tǒng)為核心搭建醫(yī)學(xué)術(shù)語(yǔ)雙語(yǔ)映射流程,將中文醫(yī)學(xué)術(shù)語(yǔ)從中文映射和英文映射兩條路徑映射到UMLS本體上。最后通過(guò)字符串直接匹配和UMLS映射間接匹配兩種方法計(jì)算出中文醫(yī)學(xué)術(shù)語(yǔ)資源對(duì)真實(shí)世界醫(yī)學(xué)文檔語(yǔ)料的覆蓋程度。結(jié)果:在真實(shí)世界醫(yī)學(xué)文檔中所收集的69865個(gè)醫(yī)學(xué)術(shù)語(yǔ)中,與中文醫(yī)學(xué)術(shù)語(yǔ)資源相匹配的數(shù)量為22183(31.7...
【文章頁(yè)數(shù)】:53 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
中文摘要
abstract
第一章 前言
1.1 研究背景和意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 國(guó)外研究現(xiàn)狀
1.2.2 國(guó)內(nèi)研究現(xiàn)狀
1.3 論文主要工作及結(jié)構(gòu)
1.3.1 論文主要工作
1.3.2 全文組織結(jié)構(gòu)
1.4 研究的創(chuàng)新點(diǎn)和難點(diǎn)
1.4.1 研究的創(chuàng)新點(diǎn)
1.4.2 研究的難點(diǎn)
第二章 研究材料
2.1 中文醫(yī)學(xué)術(shù)語(yǔ)資源
2.1.1 中文醫(yī)學(xué)術(shù)語(yǔ)資源的收集
2.1.2 中文醫(yī)學(xué)術(shù)語(yǔ)資源的預(yù)處理
2.1.3 中文醫(yī)學(xué)術(shù)語(yǔ)資源的數(shù)量統(tǒng)計(jì)
2.2 真實(shí)世界醫(yī)學(xué)文檔語(yǔ)料
2.2.1 真實(shí)世界醫(yī)學(xué)文檔語(yǔ)料的收集
2.2.2 真實(shí)世界醫(yī)學(xué)文檔語(yǔ)料的預(yù)處理
2.2.3 真實(shí)世界醫(yī)學(xué)文檔語(yǔ)料的數(shù)量統(tǒng)計(jì)與詞頻分類
2.3 小結(jié)
第三章 研究方法與技術(shù)
3.1 UMLS 簡(jiǎn)介
3.2 基礎(chǔ)工具與技術(shù)
3.2.1 MetaMap
3.2.2 Fuzzy Wuzzy
3.2.3 文本翻譯API
3.3 基于UMLS本體的醫(yī)學(xué)術(shù)語(yǔ)雙語(yǔ)映射流程
3.3.1 英文術(shù)語(yǔ)映射流程
3.3.2 中文術(shù)語(yǔ)映射流程
3.3.3 雙語(yǔ)映射結(jié)果匯總流程
3.4 映射結(jié)果分析
3.5 小結(jié)
第四章 研究結(jié)果
4.1 引言
4.2 中文醫(yī)學(xué)術(shù)語(yǔ)資源對(duì)真實(shí)世界醫(yī)學(xué)文檔語(yǔ)料的覆蓋度調(diào)研
4.2.1 基于字符串匹配的醫(yī)學(xué)術(shù)語(yǔ)覆蓋度調(diào)研
4.2.2 基于UMLS本體映射匹配的醫(yī)學(xué)術(shù)語(yǔ)覆蓋度調(diào)研
4.2.3 結(jié)合字符串匹配和UMLS本體映射匹配的醫(yī)學(xué)術(shù)語(yǔ)覆蓋度調(diào)研
4.3 醫(yī)學(xué)術(shù)語(yǔ)的構(gòu)詞結(jié)構(gòu)對(duì)覆蓋度的影響分析
4.4 小結(jié)
第五章 結(jié)論與展望
5.1 結(jié)論
5.2 不足與展望
參考文獻(xiàn)
縮略詞匯
致謝
本文編號(hào):3852994
【文章頁(yè)數(shù)】:53 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
中文摘要
abstract
第一章 前言
1.1 研究背景和意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 國(guó)外研究現(xiàn)狀
1.2.2 國(guó)內(nèi)研究現(xiàn)狀
1.3 論文主要工作及結(jié)構(gòu)
1.3.1 論文主要工作
1.3.2 全文組織結(jié)構(gòu)
1.4 研究的創(chuàng)新點(diǎn)和難點(diǎn)
1.4.1 研究的創(chuàng)新點(diǎn)
1.4.2 研究的難點(diǎn)
第二章 研究材料
2.1 中文醫(yī)學(xué)術(shù)語(yǔ)資源
2.1.1 中文醫(yī)學(xué)術(shù)語(yǔ)資源的收集
2.1.2 中文醫(yī)學(xué)術(shù)語(yǔ)資源的預(yù)處理
2.1.3 中文醫(yī)學(xué)術(shù)語(yǔ)資源的數(shù)量統(tǒng)計(jì)
2.2 真實(shí)世界醫(yī)學(xué)文檔語(yǔ)料
2.2.1 真實(shí)世界醫(yī)學(xué)文檔語(yǔ)料的收集
2.2.2 真實(shí)世界醫(yī)學(xué)文檔語(yǔ)料的預(yù)處理
2.2.3 真實(shí)世界醫(yī)學(xué)文檔語(yǔ)料的數(shù)量統(tǒng)計(jì)與詞頻分類
2.3 小結(jié)
第三章 研究方法與技術(shù)
3.1 UMLS 簡(jiǎn)介
3.2 基礎(chǔ)工具與技術(shù)
3.2.1 MetaMap
3.2.2 Fuzzy Wuzzy
3.2.3 文本翻譯API
3.3 基于UMLS本體的醫(yī)學(xué)術(shù)語(yǔ)雙語(yǔ)映射流程
3.3.1 英文術(shù)語(yǔ)映射流程
3.3.2 中文術(shù)語(yǔ)映射流程
3.3.3 雙語(yǔ)映射結(jié)果匯總流程
3.4 映射結(jié)果分析
3.5 小結(jié)
第四章 研究結(jié)果
4.1 引言
4.2 中文醫(yī)學(xué)術(shù)語(yǔ)資源對(duì)真實(shí)世界醫(yī)學(xué)文檔語(yǔ)料的覆蓋度調(diào)研
4.2.1 基于字符串匹配的醫(yī)學(xué)術(shù)語(yǔ)覆蓋度調(diào)研
4.2.2 基于UMLS本體映射匹配的醫(yī)學(xué)術(shù)語(yǔ)覆蓋度調(diào)研
4.2.3 結(jié)合字符串匹配和UMLS本體映射匹配的醫(yī)學(xué)術(shù)語(yǔ)覆蓋度調(diào)研
4.3 醫(yī)學(xué)術(shù)語(yǔ)的構(gòu)詞結(jié)構(gòu)對(duì)覆蓋度的影響分析
4.4 小結(jié)
第五章 結(jié)論與展望
5.1 結(jié)論
5.2 不足與展望
參考文獻(xiàn)
縮略詞匯
致謝
本文編號(hào):3852994
本文鏈接:http://sikaile.net/tushudanganlunwen/3852994.html
最近更新
教材專著