目的1、開展湖北省晚期血吸蟲病人現(xiàn)狀調(diào)查,為掌握全省晚期血吸蟲病分布和救治現(xiàn)狀提供基線資料,為提高全省晚期血吸蟲病人救治管理水平提供參考依據(jù)。2、以第一部分的調(diào)查數(shù)據(jù)為樣本,基于機器學習模型分別對全省晚期血吸蟲病人的預后轉(zhuǎn)歸進行預測,并用AUC、靈敏度和特異度指標對不同機器學習模型的預測效能進行比較研究。3、以孝南區(qū)晚期血吸蟲病人為例,分別研究肝纖維化四項指標、B型超聲檢查和肝功能指標與晚期血吸蟲病預后的關(guān)系。方法1、調(diào)查表由湖北省血防所統(tǒng)一設(shè)計,各疫區(qū)縣(市、區(qū))血防專業(yè)機構(gòu)按調(diào)查表對轄區(qū)內(nèi)在冊晚期血吸蟲病患者統(tǒng)一開展流行病學調(diào)查,按照相應(yīng)病例納入和排除標準進行篩選,共納入4136名符合條件的晚期血吸蟲病病人。收集患者實驗室檢查、臨床和流行病學調(diào)查資料,并調(diào)查患者救治轉(zhuǎn)歸和治療費用情況。2、以上述資料為樣本,根據(jù)轉(zhuǎn)歸結(jié)局分為預后良好和預后不良兩組。預后不良(死亡或病情惡化)被編碼為1,預后良好(治愈或好轉(zhuǎn))被編碼為0。晚期血吸蟲病患者死亡主要是由于血吸蟲病和血吸蟲引起的并發(fā)癥引起的,例如肝癌、肝昏迷、肝腎綜合征和上消化道出血。因此,本研究中的死亡是指全因死亡。惡化指主要癥狀持續(xù)存在(例如無腹水消減征象或脾腫大型患者無手術(shù)指征)。將70%患者隨機分配到訓練組(2896人),30%患者分配到測試集(1240人),kNN、SVM、ANN、DT、LR、NBN、TAN、GBN、RF和GBDT模型都是在R3.4.3(R Core Team R,2016)軟件中實現(xiàn)。kNN模型計算歐式距離,SVM模型采用核函數(shù)將低維數(shù)據(jù)映射到高維平面,ANN模型采用標準前饋式反向傳播(BP)網(wǎng)絡(luò)結(jié)構(gòu),DT模型基于C4.5算法,3種貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)加入了先驗知識,RF和GBDT模型均集成5000棵決策樹進行預測。對于所有的比較,用雙側(cè)檢驗,P0.05被認為是統(tǒng)計學差異的。模型預測效能采用ROC曲線下面積(AUC)、準確度、靈敏度、特異度等指標綜合比較。3、第六部分以孝南區(qū)血防專科醫(yī)院2015年收治的104例確診晚期血吸蟲病人資料作為研究對象,按照預后轉(zhuǎn)歸不同分為兩組,預后良好組和預后不良組,分別探討肝纖維化四項指標、B型超聲檢查指標和肝功能指標與晚期血吸蟲病人預后的關(guān)系。結(jié)果1、患者主要分布在荊州,黃石、孝感等地,以腹水型和巨脾型為主。一般人口學特征中,腹水型和巨脾型兩組患者間的年齡、性別、BMI、發(fā)育狀況和營養(yǎng)狀況的差異有統(tǒng)計學意義。通過對既往病史、癥狀體征、實驗室檢查、B超和X線檢查的研究發(fā)現(xiàn),老年組和青壯年組在多項指標中具有差異。臨床救治方面,脾切除、腹水史、救治手段、治療費用和治療轉(zhuǎn)歸在腹水型、巨脾型兩組間的差異有統(tǒng)計學意義。2、對kNN、SVM模型的研究發(fā)現(xiàn),kNN模型和SVM模型在晚期血吸蟲病人預后預測中的性能都比較理想(AUC0.75),靈敏度,kNN模型優(yōu)于SVM模型;特異度,SVM模型優(yōu)于kNN模型。研究還發(fā)現(xiàn),在不同參數(shù)條件下,隨著k取值的降低,模型的性能逐漸提升。對ANN、決策樹和LR模型的研究發(fā)現(xiàn),每個預測模型都被證明是有效的并且有其自身的優(yōu)勢,但ANN模型在AUC和靈敏度方面優(yōu)于LR和DT模型。3種貝葉斯網(wǎng)絡(luò)模型的預測效果都較為理想,晚期血吸蟲病患者預后預測研究更適合采用NBN(AUC=0.724)和TAN(AUC=0.737),因為這兩種模型的AUC高于GBN(AUC=0.658)。而在NBN和TAN兩種模型中,雖然AUC接近,但是由于TAN考慮了自變量間的相互關(guān)系,可能更符合人們?nèi)粘UJ知,解釋性更強。對于集成學習模型,隨機森林和梯度提升決策樹(參數(shù)n.tree=5000)都取得了不錯的效果(AUC0.75)。在訓練集中,RF模型預測性能的主要指標(AUC、靈敏度和特異度)均優(yōu)于GBDT和DT模型;RF模型的AUC在測試集中優(yōu)于GBDT和DT模型,三個模型的靈敏度和特異度接近。值得注意的是,GBDT的預測性能指標并沒有優(yōu)于DT模型。這可能與模型的參數(shù)調(diào)整有關(guān),也可能與數(shù)據(jù)集本身的特征有關(guān),這一部分還探討了調(diào)參過程對模型預測性能的影響。預后預測模型的選擇,應(yīng)在性能進行比較后,結(jié)合具體醫(yī)學問題的實際需要,再加以選擇。3、肝纖維化四項指標中,透明質(zhì)酸(HA)和層黏蛋白(LN)可作為預后指標。B超結(jié)果顯示,腹水可作為判斷晚期血吸蟲病患者預后的關(guān)鍵臨床指標。肝功能指標中,AST/ALT可以作為判斷晚期血吸蟲病人預后的指標。結(jié)論1、對晚期血吸蟲病患者開展流行病學調(diào)查,對了解晚期血吸蟲病分布現(xiàn)狀,提升晚期血吸蟲病救治管理水平,以及制定科學合理的防治策略提供了基線資料和依據(jù),具有重要意義。2、本研究中kNN、SVM等9種機器學習模型預測晚期血吸蟲病的預后,都取得了良好的預測效果。在數(shù)據(jù)資料不滿足特定分布的情況下,參數(shù)模型(如LR模型)和半?yún)?shù)模型(如Cox比例風險模型)不適用,本研究提供了新的思路,有助于不同方法之間結(jié)果的對比。kNN、SVM和ANN模型數(shù)據(jù)比傳統(tǒng)預后預測模型要求低,DT模型顯示了清晰的變量篩選過程,容易理解,3種BN模型在分析諸多自變量之間的交互作用時,可解釋性最好。集成學習模型克服了單棵決策樹泛化能力不足的缺點。而且機器學習模型容易調(diào)整參數(shù),能生成預測效能更好的模型。3、肝纖維化四項指標中的透明質(zhì)酸(HA)、層黏蛋白(LN),B超檢查的腹水,以及肝功能檢查的AST/ALT指標,可作為晚期血吸蟲病臨床預后指標。
【學位單位】:華中科技大學
【學位級別】:博士
【學位年份】:2018
【中圖分類】:TP391.41;R532.21
【部分圖文】:
圖 1 患者地區(qū)分布本次調(diào)查中,患者主要為腹水型(3482 人)和巨脾型(637 人),侏儒型和結(jié)腸增殖型患者罕見,共 17 人。見圖 2。圖 2 不同臨床分型的病人數(shù)

19圖 2 不同臨床分型的病人數(shù)人口學特征 1 可見,人口特征中性別(χ2=4.615,P=0.032)、年齡(χ2=52.3 BMI(χ2=7.991,P =0.046)、發(fā)育(χ2=11.997,P =0.001)和營養(yǎng)狀

和病情死亡的情況。預后不良事件(死亡或病情病情好轉(zhuǎn))被編碼為 0。死亡主要是由血吸蟲病和癌,肝昏迷和上消化道出血,本研究中死亡指的續(xù)存在(如無腹水消減征象或脾腫大型患者無手N)模型 世紀 60 年代 Cover 和 Hart 提出的,是機器學習應(yīng)用于文本分類、圖像識別、字符識別等領(lǐng)域。中 k 個樣本中,大多屬于一類,而一個樣本與這 類。與機器學習中急切學習(Eager learning)對earning), 即 kNN 模型可以沒有學習過程,或者說度較高的特點,新樣本與數(shù)據(jù)集中每個數(shù)據(jù)之間據(jù)個數(shù)成正比,所以 kNN 模型理論上更適用于kNN 模型分類的結(jié)果可能差別很大。見圖 1。
【參考文獻】
相關(guān)期刊論文 前10條
1 雷正龍;張利娟;徐志敏;黨輝;許靜;呂山;曹淳力;李石柱;周曉農(nóng);;2014年全國血吸蟲病疫情通報[J];中國血吸蟲病防治雜志;2015年06期
2 廖紅保;;220例腹水型晚期血吸蟲病患者臨床路徑救治效果[J];中國血吸蟲病防治雜志;2015年03期
3 黃先龍;王方紅;張建凱;;晚期血吸蟲病門脈高壓癥術(shù)后門靜脈血栓形成的危險因素分析[J];中國血吸蟲病防治雜志;2015年02期
4 鐘森林;田學根;陳德銀;盛榮;劉承海;;臨床路徑在腹水型晚期血吸蟲病患者中的應(yīng)用效果評價[J];熱帶病與寄生蟲學;2014年03期
5 周曉蓉;楊軍晶;陳莉;劉建兵;;晚期血吸蟲病腹水型臨床路徑的制定與初步應(yīng)用[J];公共衛(wèi)生與預防醫(yī)學;2014年03期
6 朱峰;;拉米夫定聯(lián)合吡喹酮對血吸蟲病小鼠肝功能的影響[J];海南醫(yī)學院學報;2014年10期
7 劉敏;;B超診斷晚期血吸蟲病肝腹水的臨床研究[J];當代醫(yī)學;2013年33期
8 Cláudia Camila Dias;Pedro Pereira Rodrigues;Altamiro da Costa Pereira;Fernando Magro;;Clinical prognostic factors for disabling Crohn's disease: A systematic review and meta-analysis[J];World Journal of Gastroenterology;2013年24期
9 杜華;;晚期血吸蟲病與HBV感染的關(guān)系[J];中國血吸蟲病防治雜志;2013年01期
10 周曉蓉;龔新國;黃水生;楊軍晶;王靜;;湖北省2004-2011年晚期血吸蟲病患者救治動態(tài)分析[J];公共衛(wèi)生與預防醫(yī)學;2012年05期
相關(guān)博士學位論文 前2條
1 陳艷艷;湖北省血吸蟲病空間流行特征及預測分析[D];華中科技大學;2014年
2 甘秀敏;血吸蟲病流行的評估與預測預警研究[D];華中科技大學;2011年
本文編號:
2821100
本文鏈接:http://sikaile.net/yixuelunwen/chuanranbingxuelunwen/2821100.html