基于臨床病理特征、中醫(yī)證候的IgA腎病預后模型研究
發(fā)布時間:2019-10-13 13:26
【摘要】:目的:探索整合中醫(yī)預后相關因素能否幫助IgAN預后預測,比較決策樹、自適應增強、隨機森林、支持向量機四種算法建模的預測能力。方法:本研究為回顧性隊列研究,以經(jīng)腎穿診斷為IgA腎病的患者為研究對象,采集人口學、臨床病理、中醫(yī)證候等相關基線指標,并收集各個病例的隨訪資料,以血肌酐翻倍、eGFR下降≥50%、ESRD、透析、死亡為主要終點指標,使用Cox比例風險模型篩選與IgA腎病不良預后相關的因素。將預后相關因素分為西醫(yī)變量、中醫(yī)變量。分別基于西醫(yī)變量、中醫(yī)變量和聯(lián)合中西醫(yī)變量三種情況,使用決策樹、隨機森林、自適應增強、支持向量機、神經(jīng)網(wǎng)絡等算法,建立IgA腎病預后預測模型,判斷IgAN患者是否在5年內(nèi)發(fā)生復合終點事件,并對預后模型的預測效能進行評估對比。結果:本研究共納入402例IgAN隨訪病例,年齡為32.5(25-41)歲,其中女性占53.2%,從起病到腎活檢的時間為6(1-24)個月,隨訪時間為2.2(1.1-3.9)年,其中45例患者出現(xiàn)終點事件。Cox回歸單因素分析提示基線收縮壓、基線舒張壓、起始癥狀乏困、起始癥狀水腫、起始無癥狀、高血壓病史、尿蛋白定量、尿素氮、血肌酐、eGFR、血尿酸、血鉀、血磷、血清總蛋白、血清白蛋白、Haas分型、Lee分級、Katafuchi積分、MEST-T評分、新月體比例分級、疲倦乏力、浮腫、夜尿多、畏寒肢冷、惡心、舌質(zhì)淡紅、舌質(zhì)淡、舌苔白膩、脾腎陽虛證、血瘀證、兼證數(shù)目等31個變量與IgA腎病預后關系密切。經(jīng)共線性診斷后,31個變量剔除基線收縮壓、基線舒張壓、血清總蛋白、Lee分級4個變量,新加入基線平均動脈壓,最終有28個變量進入多因素分析和預測模型建模。Cox回歸多因素分析提示基線血肌酐、MEST評分的T分值、脾腎陽虛證是不良預后的獨立危險因素。隨機數(shù)據(jù)5年內(nèi)發(fā)生終點事件和隨訪5年未發(fā)生終點的患者數(shù)據(jù),按7:3的比例分成訓練集和測試集。使用訓練集數(shù)據(jù)在中醫(yī)變量、西醫(yī)變量、中西醫(yī)變量三種條件下分別通過決策樹、自適應增強、隨機森林、支持向量機四種算法構建了 12個模型。評估各模型對訓練集的數(shù)據(jù)解析能力,發(fā)現(xiàn)同算法下,總體錯誤率上,中醫(yī)變量西醫(yī)變量中西醫(yī)變量;擬合度和ROC曲線下面積方面,中西醫(yī)變量西醫(yī)變量中醫(yī)變量。而在變量相同的情況下,隨機森林錯誤率最低、R2和ROC曲線下面積最大,決策樹模型錯誤率最高、R2和ROC曲線下面積最小居于末席,自適應增強模型和支持向量機并列居中。用12個模型對測試集的數(shù)據(jù)進行預測,發(fā)現(xiàn)使用中醫(yī)變量、西醫(yī)變量、中西醫(yī)變量在四種算法下構建的模型,ROC曲線下面積均大于0.7,具有良好的預測能力,而支持向量機使用中西變量建模,ROC曲線下面積更是超過0.9,達到0.91,預測能力優(yōu)秀。在同算法下,中西醫(yī)變量的準確率、R2、ROC曲線下面積均最高,而西醫(yī)變量排第二,中醫(yī)變量第三。變量相同的情況下,支持向量機的準確率、R2、ROC曲線下面積均最大,模型驗證預測效能最好;隨機森林錯誤率和支持向量機一樣,R2第二,ROC曲線下面積第三,總體預測效能第二;自適應增強模型總體錯誤率最高,R2大于決策樹排第三,ROC曲線下面積排第二,總體預測效能排第三;決策樹模型除總體錯誤率居于第三外,R2和ROC曲線下面積位于末席,總體預測效能第四。結論:使用中醫(yī)變量和西醫(yī)變量構建預測模型,均能達到良好的預測效能,但使用西醫(yī)變量的預測能力更強,而聯(lián)合中西醫(yī)變量建模優(yōu)于單獨使用中醫(yī)或西醫(yī)變量。在開展類似的IgAN預后預測研究時,如能獲取足夠的中醫(yī)資料,推薦同時使用中西醫(yī)預后相關因素構建預測模型。決策樹、自適應增強、隨機森林、支持向量機四種算法均能構建出具有良好預測能力的模型,在相同建模變量的情況下,支持向量機表現(xiàn)最優(yōu),其次為隨機森林,自適應增強算法第三,決策樹居末。但由于每種算法均有其優(yōu)勢和局限性,應根據(jù)實際需要選擇合適的算法。
【圖文】:
隨機森林逡逑圖四十四顯示了建模變量的重要程度,其eGFR、Katafuchi積分、MEST-酐、Haas等變量對模型的正確率貢獻較大。而對分類后數(shù)據(jù)集的單純度量為eGFR、血肌酐、Katafuchi積分。圖四十五顯示隨機森林經(jīng)過生成4錯誤率維持在一較低水平,,提示模型對訓練集數(shù)據(jù)的解析足夠穩(wěn)定。逡逑78逡逑
【學位授予單位】:廣州中醫(yī)藥大學
【學位級別】:博士
【學位授予年份】:2017
【分類號】:R277.5
【圖文】:
隨機森林逡逑圖四十四顯示了建模變量的重要程度,其eGFR、Katafuchi積分、MEST-酐、Haas等變量對模型的正確率貢獻較大。而對分類后數(shù)據(jù)集的單純度量為eGFR、血肌酐、Katafuchi積分。圖四十五顯示隨機森林經(jīng)過生成4錯誤率維持在一較低水平,,提示模型對訓練集數(shù)據(jù)的解析足夠穩(wěn)定。逡逑78逡逑
【學位授予單位】:廣州中醫(yī)藥大學
【學位級別】:博士
【學位授予年份】:2017
【分類號】:R277.5
【參考文獻】
相關期刊論文 前10條
1 曹云松;劉美奇;任可;王暴魁;;IgA腎病中西醫(yī)診療進展[J];遼寧中醫(yī)藥大學學報;2015年03期
2 彭亞軍;胡淑娟;李旭華;何澤云;廖春來;何雅琴;;中醫(yī)藥治療IgA腎病的meta分析[J];中國中西醫(yī)結合腎病雜志;2015年02期
3 聶莉芳;;IgA腎病中醫(yī)病名、證候特點及益氣滋腎治法研究[J];中國中西醫(yī)結合腎病雜志;2015年01期
4 繆建霞;陳洪宇;;IgA腎病中醫(yī)證型的研究概況[J];山西中醫(yī)學院學報;2014年05期
5 萬廷信;戴恩來;王文革;劉天喜;劉l
本文編號:2548693
本文鏈接:http://sikaile.net/shoufeilunwen/yxlbs/2548693.html
最近更新
教材專著