天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于中醫(yī)電子病歷的疾病診斷方法研究

發(fā)布時間:2020-10-11 20:25
   疾病診斷是臨床診療的首要環(huán)節(jié),利用電子病歷數(shù)據(jù)進行疾病的自動診斷分析是近年來醫(yī)學(xué)信息學(xué)與醫(yī)學(xué)人工智能研究的熱點。隨著中醫(yī)院電子病歷系統(tǒng)的廣泛應(yīng)用和推廣,利用中醫(yī)電子病歷進行疾病診斷研究具備了可行性,鑒于中醫(yī)電子病歷(住院病歷)以中西醫(yī)結(jié)合的診療過程為主要內(nèi)容以及中西醫(yī)臨床診斷特征的差異性,基于西醫(yī)電子病歷的相關(guān)研究能否直接推延到中醫(yī)臨床環(huán)境,是一個有待探索的問題。本文通過結(jié)合一定規(guī)模的中醫(yī)電子病歷和中醫(yī)領(lǐng)域知識開展疾病診斷方法研究,構(gòu)建了多種疾病診斷的標(biāo)準(zhǔn)數(shù)據(jù)集,并重點在特征處理和表示學(xué)習(xí)方面進行探索,結(jié)合多種分類學(xué)習(xí)模型,提出了幾種具有一定實用價值的疾病診斷新方法,主要研究結(jié)果包括如下兩個方面:首先,本文按照診斷的納入標(biāo)準(zhǔn)收集并整理了一批中醫(yī)電子病歷數(shù)據(jù),構(gòu)建了多種專病的標(biāo)準(zhǔn)數(shù)據(jù)集,包括慢性病毒性乙型肝炎數(shù)據(jù)集(1366個診次),二型糖尿病數(shù)據(jù)集(856個診次)和肝硬化數(shù)據(jù)集(2304個診次),以上數(shù)據(jù)集包含癥狀、舌脈象、中藥、既往史和實驗室檢查信息等多種臨床特征;在分析不同種類臨床特征重要性的基礎(chǔ)上,提出了基于權(quán)重的特征篩選方法,結(jié)合多種分類模型(如邏輯回歸、SVM、集成學(xué)習(xí)和Stacking模型),在構(gòu)建的標(biāo)準(zhǔn)數(shù)據(jù)集上進行了比較實驗分析。研究結(jié)果表明,基于特征篩選的疾病診斷方法,能達到基于專家人工篩選特征的疾病診斷方法的效果,相比無特征篩選的基線方法診斷性能顯著提升,同時,在使用Stacking模型時取得了最好性能(AUC值在三個數(shù)據(jù)集上相較于基線方法分別為 0.919 vs 0.676,0.922 vs 0.68,0.979 vs 0.911)。其次,本文引入基于網(wǎng)絡(luò)嵌入的深度特征表示方法,結(jié)合中藥靶點等網(wǎng)絡(luò)數(shù)據(jù),進行特征表示學(xué)習(xí),提出了基于網(wǎng)絡(luò)嵌入的疾病診斷方法。該方法能夠根據(jù)不同特征之間的相似性來對病人的特征進行擴展和補充,從而提升診斷性能。結(jié)合Stacking模型,該方法在慢性病毒性乙型肝炎、二型糖尿病和肝硬化數(shù)據(jù)集上的AUC 值分別達到了 0.965、0.966 和 0.988。以上研究表明,結(jié)合Stacking模型的基于網(wǎng)絡(luò)嵌入的疾病診斷方法存在較大優(yōu)勢,已經(jīng)具備了針對不同疾病進行預(yù)測的實用價值,有望成為一種有潛力的基于中醫(yī)電子病歷的疾病診斷方法。
【學(xué)位單位】:北京交通大學(xué)
【學(xué)位級別】:碩士
【學(xué)位年份】:2018
【中圖分類】:TP18;R197.4
【部分圖文】:

集成學(xué)習(xí),學(xué)習(xí)器


疾病診斷方法的相關(guān)研宄??出發(fā),進行反復(fù)的學(xué)習(xí),得到一系列弱分類器(基本分類器),然后組合這些弱分??類器構(gòu)成一個強分類器。集成學(xué)習(xí)的流程如圖2-1所示:??g鮮聊I、J??(弱學(xué)習(xí)器2?二琴\、^、??'''''強學(xué)習(xí)器)??弱學(xué)習(xí)器n??圖2-1集成學(xué)習(xí)??Figure?2-1?Ensemble?Learning??可以發(fā)現(xiàn)在集成學(xué)習(xí)中有兩個主要的問題需要解決,第一是如何得到若干個??個體學(xué)習(xí)器,第二是如何選擇一種結(jié)合策略,將這些個體學(xué)習(xí)器集合成一個強學(xué)習(xí)??器。按照個體學(xué)習(xí)器之間是否存在依賴關(guān)系可以分為兩類,第一個是個體學(xué)習(xí)器之??間存在強依賴關(guān)系,一系列個體學(xué)習(xí)器基本都需要串行生成,代表算法是Boosting??系列算法,例如Adaboost和GBDT等;第二個是個體學(xué)習(xí)器之間不存在強依賴關(guān)??系,一系列個體學(xué)習(xí)器可以并行生成,代表算法是Bagging系列算法。??Boosting是一種串行的工作機制,即個體學(xué)習(xí)器的訓(xùn)練存在依賴關(guān)系,必須一??步一步序列化進行。其基本思想是:增加前一個基學(xué)習(xí)器在訓(xùn)練訓(xùn)練過程中預(yù)測錯??誤樣本的權(quán)重

流程圖,流程,決策樹,學(xué)習(xí)器


規(guī)則如下:??1)對每棵決策樹的訓(xùn)練集,隨機森林使用隨機采樣bootstrap的方法來選擇采??樣集作為決策樹的訓(xùn)練集,極端隨機樹不使用隨機采樣,而是采用原始的訓(xùn)練集。??2)在選定了劃分特征后,隨機森林會基于信息增益、基尼系數(shù)或者均方差之類??的原則,選擇一個最優(yōu)的特征值劃分點,這和傳統(tǒng)的決策樹相同。但是ExtraTree??會采用激進的方法,它會隨機的選擇一個特征值來劃分決策樹。??從第二點可以看出,由于隨機選擇了特征值的劃分點位,而不是最優(yōu)點位,這??樣會導(dǎo)致生成的決策樹的規(guī)模一般會大于隨機森林的規(guī)模。即模型的方差相對于??隨機森林進一步減少,在某些時候,極端隨機樹的泛化能力比隨機森林更好。??2.3.3模型融合??模型融合(Stacking)就是用初始訓(xùn)練數(shù)據(jù)學(xué)習(xí)出若千個基學(xué)習(xí)器后,將這幾??個學(xué)習(xí)器的預(yù)測結(jié)果作為新的訓(xùn)練集,來學(xué)習(xí)一個新的學(xué)習(xí)器的方法。Stacking的??具體流程如圖2-2所示:??Model?1?Model?1?Model?1?Model?1?Model?1?New?Feature?Model2??

示意圖,示意圖,分類預(yù)測,優(yōu)劣性


在本實驗中,我們將針對慢性病毒性乙型肝炎、二型糖尿病和肝硬化的數(shù)據(jù)??集,得到基于WBFS方法所篩選的特征和基于專家手工篩選后的特征,選擇相同??的分類預(yù)測模型,比較兩種方法的優(yōu)劣性。實驗結(jié)果見圖3-3:??27??
【參考文獻】

相關(guān)期刊論文 前2條

1 孟洪宇;孟慶剛;;基于條件隨機場的中醫(yī)術(shù)語抽取方法及其應(yīng)用探析[J];中華中醫(yī)藥學(xué)刊;2014年10期

2 李梢;張博;;中藥網(wǎng)絡(luò)藥理學(xué):理論、方法與應(yīng)用(英文)[J];中國天然藥物;2013年02期


相關(guān)博士學(xué)位論文 前2條

1 胡佳卉;基于信息處理的中醫(yī)藥治療2型糖尿病方藥數(shù)據(jù)挖掘與分析研究[D];北京中醫(yī)藥大學(xué);2017年

2 宋亞南;基于數(shù)據(jù)挖掘的新安醫(yī)家婦科常見病辨治特色與用藥規(guī)律研究[D];北京中醫(yī)藥大學(xué);2017年


相關(guān)碩士學(xué)位論文 前5條

1 王萍;基于電子病歷數(shù)據(jù)的疾病預(yù)測模型構(gòu)建研究[D];吉林大學(xué);2017年

2 李昆;基于電子病歷的深度神經(jīng)網(wǎng)絡(luò)預(yù)測模型研究與應(yīng)用[D];鄭州大學(xué);2017年

3 李奇航;面向復(fù)雜因素的心血管疾病預(yù)測研究[D];鄭州大學(xué);2017年

4 王鳳利;基于BP神經(jīng)網(wǎng)絡(luò)和DS證據(jù)理論的疾病預(yù)測模型研究[D];太原理工大學(xué);2016年

5 張宸鳴;核矩陣近似的研究及其在支持向量機中的應(yīng)用[D];北京交通大學(xué);2015年



本文編號:2837075

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/yixuelunwen/yiyuanguanlilunwen/2837075.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶62b04***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com