基于BP神經(jīng)網(wǎng)絡(luò)和隨機(jī)森林算法的冠狀動(dòng)脈狹窄風(fēng)險(xiǎn)識(shí)別模型研究
發(fā)布時(shí)間:2020-04-14 16:54
【摘要】:目的:冠心病是由冠狀動(dòng)脈血管狹窄所致心肌缺血缺氧的一種心血管疾病,其預(yù)后情況復(fù)雜多變。冠心病已然成為當(dāng)前威脅人類生命健康的重要原因。冠狀動(dòng)脈造影手術(shù)治療是目前唯一可以直接觀察冠狀動(dòng)脈形態(tài)的論斷方法,被認(rèn)為是當(dāng)前診斷冠心病的“金標(biāo)準(zhǔn)”,但由于冠狀動(dòng)脈造影存在創(chuàng)傷性,禁忌癥和術(shù)后并發(fā)癥,費(fèi)用昂貴等諸多缺點(diǎn),無(wú)法開(kāi)展大規(guī)模的人群篩查,因此針對(duì)冠心病患者,構(gòu)建冠狀動(dòng)脈狹窄早期風(fēng)險(xiǎn)識(shí)別模型顯得尤為重要。本研究基于冠心病心衰患者臨床病歷資料,構(gòu)建冠脈狹窄早期風(fēng)險(xiǎn)識(shí)別模型,實(shí)現(xiàn)高效、無(wú)創(chuàng)的識(shí)別冠狀動(dòng)脈狹窄,以指導(dǎo)臨床醫(yī)生和患者選擇合理的預(yù)防性治療和干預(yù)措施,以期降低冠狀動(dòng)脈狹窄的發(fā)生率和致死率。方法:根據(jù)本課題研究對(duì)象的納入和排除標(biāo)準(zhǔn),共篩選出符合條件的山西省心血管病醫(yī)院和山西醫(yī)科大學(xué)第一醫(yī)院心內(nèi)科2011年10月至2018年5月期間確診為冠心病心衰的2926例住院患者作為本研究的研究對(duì)象,通過(guò)查閱兩所醫(yī)院病案室中相關(guān)電子和紙質(zhì)病歷,獲取患者的一般人口學(xué)資料、既往史、實(shí)驗(yàn)室檢查、心電圖、心臟彩超、冠脈造影、用藥等信息。利用卡方檢驗(yàn)和基于秩的非參數(shù)檢驗(yàn)從上述資料中篩選出與冠狀動(dòng)脈狹窄有關(guān)的變量。采用分層抽樣的方法從冠脈造影手術(shù)結(jié)果Gensini評(píng)分大于等于4的患者和Gensini評(píng)分小于4的患者(包括未行冠脈造影手術(shù)的患者)兩種數(shù)據(jù)資料中分別抽取四分之三樣本作為訓(xùn)練數(shù)據(jù)集,該部分?jǐn)?shù)據(jù)用于訓(xùn)練初始模型,將剩余四分之一樣本作為測(cè)試數(shù)據(jù)集,用來(lái)評(píng)價(jià)各模型的分類效果。將從病歷資料中篩選出的變量作為輸入變量,將冠脈造影手術(shù)結(jié)果Gensini評(píng)分是否大于4作為結(jié)局變量,在訓(xùn)練數(shù)據(jù)集中分別建立logistic回歸、BP神經(jīng)網(wǎng)絡(luò)和隨機(jī)森林分類識(shí)別模型,在測(cè)試數(shù)據(jù)集中通過(guò)準(zhǔn)確度、靈敏度、特異度、陽(yáng)性預(yù)測(cè)值、陰性預(yù)測(cè)值和受試者工作特征曲線下面積AUC指標(biāo)來(lái)評(píng)價(jià)和比較三種模型的綜合性能。結(jié)果:通過(guò)單因素檢驗(yàn)(卡方檢驗(yàn)和基于秩的非參數(shù)檢驗(yàn)),從147個(gè)變量中初步篩選出與冠狀動(dòng)脈狹窄相關(guān)的變量共49個(gè),其中包括心律失常、高血壓、血紅蛋白、血小板等。通過(guò)基于AUC的隨機(jī)森林自變量篩選方法對(duì)上述單因素檢驗(yàn)得到的變量進(jìn)行進(jìn)一步篩選,最終獲得36個(gè)變量進(jìn)入最終模型進(jìn)行訓(xùn)練。將36個(gè)變量作為模型的輸入變量,用來(lái)訓(xùn)練logistic回歸、BP神經(jīng)網(wǎng)絡(luò)和隨機(jī)森林的初始模型。logistic回歸模型在測(cè)試數(shù)據(jù)集中的結(jié)果:靈敏度為75.76%,特異度為72.95%,準(zhǔn)確度為74.05%,陽(yáng)性預(yù)測(cè)值為73.95%,陰性預(yù)測(cè)值為72.07%,AUC值為0.7399。訓(xùn)練BP神經(jīng)網(wǎng)絡(luò)之前,首先通過(guò)模擬試驗(yàn),確定隱含層個(gè)數(shù),實(shí)驗(yàn)結(jié)果發(fā)現(xiàn),當(dāng)神經(jīng)網(wǎng)絡(luò)模型的隱含層個(gè)數(shù)為25時(shí),模型誤差相對(duì)較小,因此構(gòu)建模型結(jié)構(gòu)為36-25-1的神經(jīng)網(wǎng)絡(luò)模型,BP神經(jīng)網(wǎng)絡(luò)模型在測(cè)試數(shù)據(jù)集中的結(jié)果:靈敏度為74.30%,特異度為70.00%,準(zhǔn)確度為72.30%,陽(yáng)性預(yù)測(cè)值為75.05%,陰性預(yù)測(cè)值為69.18%,AUC值為0.7231。在訓(xùn)練隨機(jī)森林模型之前,首先對(duì)模型參數(shù)mtry和ntree進(jìn)行選擇,結(jié)果發(fā)現(xiàn),當(dāng)參數(shù)mtry設(shè)置為3,ntree設(shè)置為1000時(shí),模型性能達(dá)到最佳,測(cè)試數(shù)據(jù)集中,隨機(jī)森林模型的模型效果:靈敏度為93.70%,特異度為62.97%,準(zhǔn)確度為79.49%,陽(yáng)性預(yù)測(cè)值為74.58%,陰性預(yù)測(cè)值為89.39%,AUC值為0.7522。結(jié)論:隨機(jī)森林模型在冠狀動(dòng)脈狹窄程度識(shí)別中的綜合性能最佳,可以在患者發(fā)病早期,實(shí)現(xiàn)對(duì)冠狀動(dòng)脈狹窄的識(shí)別,這使得冠狀動(dòng)脈狹窄的發(fā)生概率被估計(jì)的更加準(zhǔn)確,在臨床上為醫(yī)生和患者提供更加精確和高效的意見(jiàn)和建議,對(duì)提高診療質(zhì)量具有重要意義。
【圖文】:
圖 1-1 神經(jīng)網(wǎng)絡(luò)簡(jiǎn)圖可以看出,神經(jīng)網(wǎng)絡(luò)[27]主要可以分為以下三部分:網(wǎng)絡(luò)結(jié)構(gòu)、初始活函數(shù)。根據(jù)不同的網(wǎng)絡(luò)結(jié)構(gòu),可將神經(jīng)網(wǎng)絡(luò)分為幾種不同的類的類型有前饋型神經(jīng)網(wǎng)絡(luò)和反饋型神經(jīng)網(wǎng)絡(luò)兩種,常見(jiàn)的 BP 神經(jīng)神經(jīng)網(wǎng)絡(luò),Hopfield 神經(jīng)網(wǎng)絡(luò)[28]是反饋網(wǎng)絡(luò)中最簡(jiǎn)單且應(yīng)用最廣用中較為常見(jiàn)神經(jīng)網(wǎng)絡(luò)模型為 BP 神經(jīng)網(wǎng)絡(luò),它的主要思想[29]是利估計(jì)輸出層前一層的誤差,,再用該層誤差來(lái)估計(jì)更前一層誤差,如估計(jì),這里的誤差估計(jì)可以理解為某種偏導(dǎo)數(shù),我們就是根據(jù)這種的連接權(quán)值,再用調(diào)整后的連接權(quán)值重新計(jì)算輸出誤差,直到輸出要求或者迭代次數(shù)溢出設(shè)定值。森林(Random forests,RF)林算法是一種基于決策樹(shù)的集成學(xué)習(xí)方法,它最早是由 Breiman
圖 2-1 模型入選自變量重要性比較根據(jù)上述自變量的重要性排序結(jié)果,將MDG指標(biāo)較小的幾個(gè)變量進(jìn)行后向其他變量來(lái)參與模型重建,所得模型 AUC 值(即 OOB-AUC)的變化趨勢(shì)示。
【學(xué)位授予單位】:山西醫(yī)科大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2019
【分類號(hào)】:TP183;R541.4
【圖文】:
圖 1-1 神經(jīng)網(wǎng)絡(luò)簡(jiǎn)圖可以看出,神經(jīng)網(wǎng)絡(luò)[27]主要可以分為以下三部分:網(wǎng)絡(luò)結(jié)構(gòu)、初始活函數(shù)。根據(jù)不同的網(wǎng)絡(luò)結(jié)構(gòu),可將神經(jīng)網(wǎng)絡(luò)分為幾種不同的類的類型有前饋型神經(jīng)網(wǎng)絡(luò)和反饋型神經(jīng)網(wǎng)絡(luò)兩種,常見(jiàn)的 BP 神經(jīng)神經(jīng)網(wǎng)絡(luò),Hopfield 神經(jīng)網(wǎng)絡(luò)[28]是反饋網(wǎng)絡(luò)中最簡(jiǎn)單且應(yīng)用最廣用中較為常見(jiàn)神經(jīng)網(wǎng)絡(luò)模型為 BP 神經(jīng)網(wǎng)絡(luò),它的主要思想[29]是利估計(jì)輸出層前一層的誤差,,再用該層誤差來(lái)估計(jì)更前一層誤差,如估計(jì),這里的誤差估計(jì)可以理解為某種偏導(dǎo)數(shù),我們就是根據(jù)這種的連接權(quán)值,再用調(diào)整后的連接權(quán)值重新計(jì)算輸出誤差,直到輸出要求或者迭代次數(shù)溢出設(shè)定值。森林(Random forests,RF)林算法是一種基于決策樹(shù)的集成學(xué)習(xí)方法,它最早是由 Breiman
圖 2-1 模型入選自變量重要性比較根據(jù)上述自變量的重要性排序結(jié)果,將MDG指標(biāo)較小的幾個(gè)變量進(jìn)行后向其他變量來(lái)參與模型重建,所得模型 AUC 值(即 OOB-AUC)的變化趨勢(shì)示。
【學(xué)位授予單位】:山西醫(yī)科大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2019
【分類號(hào)】:TP183;R541.4
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 沈智勇;蘇
本文編號(hào):2627503
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2627503.html
最近更新
教材專著