四種機器學(xué)習(xí)分類方法在乙肝相關(guān)肝癌診斷中的應(yīng)用和比較
發(fā)布時間:2021-03-05 02:09
目的醫(yī)療診斷是醫(yī)生綜合患者的癥狀體征和多種檢查信息進行決策和判斷的過程,其本質(zhì)為分類。肝癌是我國最常見的惡性腫瘤之一,早期肝癌患者臨床癥狀和各類檢查的特征均不明顯,因此難以篩查和診斷。本研究嘗試使用機器學(xué)習(xí)中Logistic回歸、加權(quán)k近鄰、決策樹、BP人工神經(jīng)網(wǎng)絡(luò)四種分類方法分別構(gòu)建基于血清學(xué)指標的早期肝癌的診斷模型,比較模型的診斷效能,評估四種診斷模型的肝癌篩查價值和輔助臨床醫(yī)生進行早期診斷的可行性。比較四種分類方法的算法特點,探索每種方法在臨床數(shù)據(jù)分析中合適的應(yīng)用場景。方法選擇2010年1月至2018年12月解放軍總醫(yī)院第五醫(yī)學(xué)中心收治的5642例慢性乙型肝炎病毒感染者為研究對象,其中慢性乙型肝炎患者1425例,代償期肝硬化患者567例,失代償期肝硬化患者731例,肝癌患者2919例。2919例肝癌患者中符合米蘭標準的有808例,定義為早期肝癌患者。本研究只關(guān)注早期肝癌,因此研究總樣本為3531例。使用分層抽樣的方法按照7:3的比例將總樣本分為訓(xùn)練集和測試集。訓(xùn)練集中使用Logistic回歸、加權(quán)k近鄰、決策樹、BP人工神經(jīng)網(wǎng)絡(luò)分別構(gòu)建早期肝癌的診斷模型,并得到相應(yīng)模型的最佳參數(shù)...
【文章來源】:鄭州大學(xué)河南省 211工程院校
【文章頁數(shù)】:75 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2.1研宄流程圖??6??
?對象與方法???通過梯度下降的方法多次迭代計算即可估算出自變量的回歸系數(shù)。見圖2.2。???_?5.?■?r?[.....|?.'丨'??I-?/?:|?I??〇?.,??〇?^ ̄ ̄|?1?1?1?1 ̄?!??-4?-2?0?2?4??圖2.2?Sigmoid函數(shù)圖像(左)和梯度下降算法模式圖(右)??2.3.2加權(quán)k近鄰算法原理??k近鄰算法思想非常樸素。首先將訓(xùn)練集的觀察對象依據(jù)其變量值投射到高??維空間,每個觀察對象就是高維空間中的一個點。觀察對象之間的變量屬性越相??似,這些點的空間距離就會越近。因此相似的觀察對象在高維空間中表現(xiàn)出一定??的空間聚集性。在本次研究中,當將模型應(yīng)用于測試集時,實際上是將測試集中??的每一個觀察對象依據(jù)其變量信息(向量)投射到由訓(xùn)練集構(gòu)成的高維空間圖上。??選取距離每一個測試集觀察對象最近的k個點,k個點中如果肝癌患者多則該對??象被判定為肝癌,如果非肝癌患者較多則該對象被判定為非肝癌。見圖2.3。??k近鄰法有兩個非常重要的問題需要解決。一是不同的k取值會影響診斷效??能;二是對于需要判定的測試集點,不同距離的訓(xùn)練集點對判定的影響力有所不??同,距離越近,判定的權(quán)重應(yīng)該越大。針對第一個問題可以借助計算機強大的計??算能力,通過窮舉的方式進行解決。針對第二個問題,可以通過核函數(shù)賦予距離??更近的點更大的權(quán)重進行解決,該方法就是加權(quán)k近鄰算法。見圖2.3。??e?Hn??\?①?令)屮???——.L、 ̄???;g\.?y?^?矩形核函數(shù)?=??????%*?yv?/\??仿數(shù)核嘁數(shù)?A期搞成數(shù)??圖2.3?k近鄰算法判定原理(左)
?對象與方法???通過梯度下降的方法多次迭代計算即可估算出自變量的回歸系數(shù)。見圖2.2。???_?5.?■?r?[.....|?.'丨'??I-?/?:|?I??〇?.,??〇?^ ̄ ̄|?1?1?1?1 ̄?!??-4?-2?0?2?4??圖2.2?Sigmoid函數(shù)圖像(左)和梯度下降算法模式圖(右)??2.3.2加權(quán)k近鄰算法原理??k近鄰算法思想非常樸素。首先將訓(xùn)練集的觀察對象依據(jù)其變量值投射到高??維空間,每個觀察對象就是高維空間中的一個點。觀察對象之間的變量屬性越相??似,這些點的空間距離就會越近。因此相似的觀察對象在高維空間中表現(xiàn)出一定??的空間聚集性。在本次研究中,當將模型應(yīng)用于測試集時,實際上是將測試集中??的每一個觀察對象依據(jù)其變量信息(向量)投射到由訓(xùn)練集構(gòu)成的高維空間圖上。??選取距離每一個測試集觀察對象最近的k個點,k個點中如果肝癌患者多則該對??象被判定為肝癌,如果非肝癌患者較多則該對象被判定為非肝癌。見圖2.3。??k近鄰法有兩個非常重要的問題需要解決。一是不同的k取值會影響診斷效??能;二是對于需要判定的測試集點,不同距離的訓(xùn)練集點對判定的影響力有所不??同,距離越近,判定的權(quán)重應(yīng)該越大。針對第一個問題可以借助計算機強大的計??算能力,通過窮舉的方式進行解決。針對第二個問題,可以通過核函數(shù)賦予距離??更近的點更大的權(quán)重進行解決,該方法就是加權(quán)k近鄰算法。見圖2.3。??e?Hn??\?①?令)屮???——.L、 ̄???;g\.?y?^?矩形核函數(shù)?=??????%*?yv?/\??仿數(shù)核嘁數(shù)?A期搞成數(shù)??圖2.3?k近鄰算法判定原理(左)
本文編號:3064382
【文章來源】:鄭州大學(xué)河南省 211工程院校
【文章頁數(shù)】:75 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2.1研宄流程圖??6??
?對象與方法???通過梯度下降的方法多次迭代計算即可估算出自變量的回歸系數(shù)。見圖2.2。???_?5.?■?r?[.....|?.'丨'??I-?/?:|?I??〇?.,??〇?^ ̄ ̄|?1?1?1?1 ̄?!??-4?-2?0?2?4??圖2.2?Sigmoid函數(shù)圖像(左)和梯度下降算法模式圖(右)??2.3.2加權(quán)k近鄰算法原理??k近鄰算法思想非常樸素。首先將訓(xùn)練集的觀察對象依據(jù)其變量值投射到高??維空間,每個觀察對象就是高維空間中的一個點。觀察對象之間的變量屬性越相??似,這些點的空間距離就會越近。因此相似的觀察對象在高維空間中表現(xiàn)出一定??的空間聚集性。在本次研究中,當將模型應(yīng)用于測試集時,實際上是將測試集中??的每一個觀察對象依據(jù)其變量信息(向量)投射到由訓(xùn)練集構(gòu)成的高維空間圖上。??選取距離每一個測試集觀察對象最近的k個點,k個點中如果肝癌患者多則該對??象被判定為肝癌,如果非肝癌患者較多則該對象被判定為非肝癌。見圖2.3。??k近鄰法有兩個非常重要的問題需要解決。一是不同的k取值會影響診斷效??能;二是對于需要判定的測試集點,不同距離的訓(xùn)練集點對判定的影響力有所不??同,距離越近,判定的權(quán)重應(yīng)該越大。針對第一個問題可以借助計算機強大的計??算能力,通過窮舉的方式進行解決。針對第二個問題,可以通過核函數(shù)賦予距離??更近的點更大的權(quán)重進行解決,該方法就是加權(quán)k近鄰算法。見圖2.3。??e?Hn??\?①?令)屮???——.L、 ̄???;g\.?y?^?矩形核函數(shù)?=??????%*?yv?/\??仿數(shù)核嘁數(shù)?A期搞成數(shù)??圖2.3?k近鄰算法判定原理(左)
?對象與方法???通過梯度下降的方法多次迭代計算即可估算出自變量的回歸系數(shù)。見圖2.2。???_?5.?■?r?[.....|?.'丨'??I-?/?:|?I??〇?.,??〇?^ ̄ ̄|?1?1?1?1 ̄?!??-4?-2?0?2?4??圖2.2?Sigmoid函數(shù)圖像(左)和梯度下降算法模式圖(右)??2.3.2加權(quán)k近鄰算法原理??k近鄰算法思想非常樸素。首先將訓(xùn)練集的觀察對象依據(jù)其變量值投射到高??維空間,每個觀察對象就是高維空間中的一個點。觀察對象之間的變量屬性越相??似,這些點的空間距離就會越近。因此相似的觀察對象在高維空間中表現(xiàn)出一定??的空間聚集性。在本次研究中,當將模型應(yīng)用于測試集時,實際上是將測試集中??的每一個觀察對象依據(jù)其變量信息(向量)投射到由訓(xùn)練集構(gòu)成的高維空間圖上。??選取距離每一個測試集觀察對象最近的k個點,k個點中如果肝癌患者多則該對??象被判定為肝癌,如果非肝癌患者較多則該對象被判定為非肝癌。見圖2.3。??k近鄰法有兩個非常重要的問題需要解決。一是不同的k取值會影響診斷效??能;二是對于需要判定的測試集點,不同距離的訓(xùn)練集點對判定的影響力有所不??同,距離越近,判定的權(quán)重應(yīng)該越大。針對第一個問題可以借助計算機強大的計??算能力,通過窮舉的方式進行解決。針對第二個問題,可以通過核函數(shù)賦予距離??更近的點更大的權(quán)重進行解決,該方法就是加權(quán)k近鄰算法。見圖2.3。??e?Hn??\?①?令)屮???——.L、 ̄???;g\.?y?^?矩形核函數(shù)?=??????%*?yv?/\??仿數(shù)核嘁數(shù)?A期搞成數(shù)??圖2.3?k近鄰算法判定原理(左)
本文編號:3064382
本文鏈接:http://sikaile.net/yixuelunwen/zlx/3064382.html
最近更新
教材專著