基于臨床病理特征、中醫(yī)證候的IgA腎病預(yù)后模型研究
發(fā)布時(shí)間:2019-10-13 13:26
【摘要】:目的:探索整合中醫(yī)預(yù)后相關(guān)因素能否幫助IgAN預(yù)后預(yù)測(cè),比較決策樹(shù)、自適應(yīng)增強(qiáng)、隨機(jī)森林、支持向量機(jī)四種算法建模的預(yù)測(cè)能力。方法:本研究為回顧性隊(duì)列研究,以經(jīng)腎穿診斷為IgA腎病的患者為研究對(duì)象,采集人口學(xué)、臨床病理、中醫(yī)證候等相關(guān)基線(xiàn)指標(biāo),并收集各個(gè)病例的隨訪(fǎng)資料,以血肌酐翻倍、eGFR下降≥50%、ESRD、透析、死亡為主要終點(diǎn)指標(biāo),使用Cox比例風(fēng)險(xiǎn)模型篩選與IgA腎病不良預(yù)后相關(guān)的因素。將預(yù)后相關(guān)因素分為西醫(yī)變量、中醫(yī)變量。分別基于西醫(yī)變量、中醫(yī)變量和聯(lián)合中西醫(yī)變量三種情況,使用決策樹(shù)、隨機(jī)森林、自適應(yīng)增強(qiáng)、支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)等算法,建立IgA腎病預(yù)后預(yù)測(cè)模型,判斷IgAN患者是否在5年內(nèi)發(fā)生復(fù)合終點(diǎn)事件,并對(duì)預(yù)后模型的預(yù)測(cè)效能進(jìn)行評(píng)估對(duì)比。結(jié)果:本研究共納入402例IgAN隨訪(fǎng)病例,年齡為32.5(25-41)歲,其中女性占53.2%,從起病到腎活檢的時(shí)間為6(1-24)個(gè)月,隨訪(fǎng)時(shí)間為2.2(1.1-3.9)年,其中45例患者出現(xiàn)終點(diǎn)事件。Cox回歸單因素分析提示基線(xiàn)收縮壓、基線(xiàn)舒張壓、起始癥狀乏困、起始癥狀水腫、起始無(wú)癥狀、高血壓病史、尿蛋白定量、尿素氮、血肌酐、eGFR、血尿酸、血鉀、血磷、血清總蛋白、血清白蛋白、Haas分型、Lee分級(jí)、Katafuchi積分、MEST-T評(píng)分、新月體比例分級(jí)、疲倦乏力、浮腫、夜尿多、畏寒肢冷、惡心、舌質(zhì)淡紅、舌質(zhì)淡、舌苔白膩、脾腎陽(yáng)虛證、血瘀證、兼證數(shù)目等31個(gè)變量與IgA腎病預(yù)后關(guān)系密切。經(jīng)共線(xiàn)性診斷后,31個(gè)變量剔除基線(xiàn)收縮壓、基線(xiàn)舒張壓、血清總蛋白、Lee分級(jí)4個(gè)變量,新加入基線(xiàn)平均動(dòng)脈壓,最終有28個(gè)變量進(jìn)入多因素分析和預(yù)測(cè)模型建模。Cox回歸多因素分析提示基線(xiàn)血肌酐、MEST評(píng)分的T分值、脾腎陽(yáng)虛證是不良預(yù)后的獨(dú)立危險(xiǎn)因素。隨機(jī)數(shù)據(jù)5年內(nèi)發(fā)生終點(diǎn)事件和隨訪(fǎng)5年未發(fā)生終點(diǎn)的患者數(shù)據(jù),按7:3的比例分成訓(xùn)練集和測(cè)試集。使用訓(xùn)練集數(shù)據(jù)在中醫(yī)變量、西醫(yī)變量、中西醫(yī)變量三種條件下分別通過(guò)決策樹(shù)、自適應(yīng)增強(qiáng)、隨機(jī)森林、支持向量機(jī)四種算法構(gòu)建了 12個(gè)模型。評(píng)估各模型對(duì)訓(xùn)練集的數(shù)據(jù)解析能力,發(fā)現(xiàn)同算法下,總體錯(cuò)誤率上,中醫(yī)變量西醫(yī)變量中西醫(yī)變量;擬合度和ROC曲線(xiàn)下面積方面,中西醫(yī)變量西醫(yī)變量中醫(yī)變量。而在變量相同的情況下,隨機(jī)森林錯(cuò)誤率最低、R2和ROC曲線(xiàn)下面積最大,決策樹(shù)模型錯(cuò)誤率最高、R2和ROC曲線(xiàn)下面積最小居于末席,自適應(yīng)增強(qiáng)模型和支持向量機(jī)并列居中。用12個(gè)模型對(duì)測(cè)試集的數(shù)據(jù)進(jìn)行預(yù)測(cè),發(fā)現(xiàn)使用中醫(yī)變量、西醫(yī)變量、中西醫(yī)變量在四種算法下構(gòu)建的模型,ROC曲線(xiàn)下面積均大于0.7,具有良好的預(yù)測(cè)能力,而支持向量機(jī)使用中西變量建模,ROC曲線(xiàn)下面積更是超過(guò)0.9,達(dá)到0.91,預(yù)測(cè)能力優(yōu)秀。在同算法下,中西醫(yī)變量的準(zhǔn)確率、R2、ROC曲線(xiàn)下面積均最高,而西醫(yī)變量排第二,中醫(yī)變量第三。變量相同的情況下,支持向量機(jī)的準(zhǔn)確率、R2、ROC曲線(xiàn)下面積均最大,模型驗(yàn)證預(yù)測(cè)效能最好;隨機(jī)森林錯(cuò)誤率和支持向量機(jī)一樣,R2第二,ROC曲線(xiàn)下面積第三,總體預(yù)測(cè)效能第二;自適應(yīng)增強(qiáng)模型總體錯(cuò)誤率最高,R2大于決策樹(shù)排第三,ROC曲線(xiàn)下面積排第二,總體預(yù)測(cè)效能排第三;決策樹(shù)模型除總體錯(cuò)誤率居于第三外,R2和ROC曲線(xiàn)下面積位于末席,總體預(yù)測(cè)效能第四。結(jié)論:使用中醫(yī)變量和西醫(yī)變量構(gòu)建預(yù)測(cè)模型,均能達(dá)到良好的預(yù)測(cè)效能,但使用西醫(yī)變量的預(yù)測(cè)能力更強(qiáng),而聯(lián)合中西醫(yī)變量建模優(yōu)于單獨(dú)使用中醫(yī)或西醫(yī)變量。在開(kāi)展類(lèi)似的IgAN預(yù)后預(yù)測(cè)研究時(shí),如能獲取足夠的中醫(yī)資料,推薦同時(shí)使用中西醫(yī)預(yù)后相關(guān)因素構(gòu)建預(yù)測(cè)模型。決策樹(shù)、自適應(yīng)增強(qiáng)、隨機(jī)森林、支持向量機(jī)四種算法均能構(gòu)建出具有良好預(yù)測(cè)能力的模型,在相同建模變量的情況下,支持向量機(jī)表現(xiàn)最優(yōu),其次為隨機(jī)森林,自適應(yīng)增強(qiáng)算法第三,決策樹(shù)居末。但由于每種算法均有其優(yōu)勢(shì)和局限性,應(yīng)根據(jù)實(shí)際需要選擇合適的算法。
【圖文】:
隨機(jī)森林逡逑圖四十四顯示了建模變量的重要程度,其eGFR、Katafuchi積分、MEST-酐、Haas等變量對(duì)模型的正確率貢獻(xiàn)較大。而對(duì)分類(lèi)后數(shù)據(jù)集的單純度量為eGFR、血肌酐、Katafuchi積分。圖四十五顯示隨機(jī)森林經(jīng)過(guò)生成4錯(cuò)誤率維持在一較低水平,,提示模型對(duì)訓(xùn)練集數(shù)據(jù)的解析足夠穩(wěn)定。逡逑78逡逑
【學(xué)位授予單位】:廣州中醫(yī)藥大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2017
【分類(lèi)號(hào)】:R277.5
【圖文】:
隨機(jī)森林逡逑圖四十四顯示了建模變量的重要程度,其eGFR、Katafuchi積分、MEST-酐、Haas等變量對(duì)模型的正確率貢獻(xiàn)較大。而對(duì)分類(lèi)后數(shù)據(jù)集的單純度量為eGFR、血肌酐、Katafuchi積分。圖四十五顯示隨機(jī)森林經(jīng)過(guò)生成4錯(cuò)誤率維持在一較低水平,,提示模型對(duì)訓(xùn)練集數(shù)據(jù)的解析足夠穩(wěn)定。逡逑78逡逑
【學(xué)位授予單位】:廣州中醫(yī)藥大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2017
【分類(lèi)號(hào)】:R277.5
【參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 曹云松;劉美奇;任可;王暴魁;;IgA腎病中西醫(yī)診療進(jìn)展[J];遼寧中醫(yī)藥大學(xué)學(xué)報(bào);2015年03期
2 彭亞軍;胡淑娟;李旭華;何澤云;廖春來(lái);何雅琴;;中醫(yī)藥治療IgA腎病的meta分析[J];中國(guó)中西醫(yī)結(jié)合腎病雜志;2015年02期
3 聶莉芳;;IgA腎病中醫(yī)病名、證候特點(diǎn)及益氣滋腎治法研究[J];中國(guó)中西醫(yī)結(jié)合腎病雜志;2015年01期
4 繆建霞;陳洪宇;;IgA腎病中醫(yī)證型的研究概況[J];山西中醫(yī)學(xué)院學(xué)報(bào);2014年05期
5 萬(wàn)廷信;戴恩來(lái);王文革;劉天喜;劉l
本文編號(hào):2548693
本文鏈接:http://sikaile.net/shoufeilunwen/yxlbs/2548693.html
最近更新
教材專(zhuān)著