機(jī)器學(xué)習(xí)算法在肌少癥診斷中的應(yīng)用
發(fā)布時(shí)間:2021-08-11 16:07
近年來智慧醫(yī)療飛速發(fā)展,利用人工智能技術(shù)輔助醫(yī)療診斷已經(jīng)成為趨勢,國內(nèi)外對機(jī)器學(xué)習(xí)輔助醫(yī)療的研究的也越發(fā)成熟,許多關(guān)于疾病的機(jī)器學(xué)習(xí)預(yù)診模型都已建立。采用機(jī)器學(xué)習(xí)算法來輔助醫(yī)生進(jìn)行診斷,將會(huì)很大程度上提高診斷的科學(xué)性,也能有效地克服僅憑醫(yī)生經(jīng)驗(yàn)來診斷的主觀性問題,還從一定程度上減輕了醫(yī)生的負(fù)擔(dān)。針對以上研究背景,本文依托于實(shí)驗(yàn)室研究項(xiàng)目,對肌少癥這一疾病進(jìn)行研究,建立一個(gè)適用于肌少癥診斷的機(jī)器學(xué)習(xí)模型。本文在第二、第三章中對相關(guān)的理論基礎(chǔ)進(jìn)行的詳細(xì)的闡述,主要包括數(shù)據(jù)的處理、模型的評價(jià)以及算法介紹幾個(gè)方面。對機(jī)器學(xué)習(xí)算法的選擇上,本文采用支持向量機(jī)(SVM)、隨機(jī)森林(RF)、XGBoost和CatBoost四種算法進(jìn)行對比研究,對于模型的評價(jià)指標(biāo),本文選擇了準(zhǔn)確率、精確率、召回率和F1值四個(gè)指標(biāo)。值得一提的是,本文中的肌少癥數(shù)據(jù)除了包含一些門診數(shù)據(jù)之外,也包含了一些行為數(shù)據(jù),在第四章中從特征的相關(guān)性研究和機(jī)器學(xué)習(xí)算法給出的重要程度排序兩方面論證了這些行為特征對預(yù)診模型建立的重要性,從醫(yī)學(xué)診療上看也豐富了患者的數(shù)據(jù)類型。本文在研究的過程中還強(qiáng)調(diào)了分類問題中類別均衡對算法訓(xùn)練的重要性,并...
【文章來源】:華中師范大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁數(shù)】:52 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖1:?smote模擬生成樣本圖??
碩士學(xué)位論文??MASTER'S?THESIS??3.2?RF(Random?Forest)??隨機(jī)森林(RF)是機(jī)器學(xué)習(xí)中的一種集成算法,它的思想源于Bagging算法,??Bagging的特點(diǎn)是隨機(jī)釆樣,每次都從訓(xùn)練集里有放回地采集固定個(gè)數(shù)的樣本。??對于Bagging算法,一般隨機(jī)采集樣本個(gè)數(shù)和訓(xùn)練集樣本個(gè)數(shù)一樣,對每次采集??好的樣本建立一個(gè)模型作為弱學(xué)習(xí)器,采用投票法則選擇票數(shù)最多的類別作為最??終的輸出結(jié)果。形象表示如下圖:??采樣糶1?mu.?弱學(xué)習(xí)器1?\???采樣集2?訓(xùn)練?弱學(xué)習(xí)器2????M個(gè)樣本?'?1?強(qiáng)學(xué)習(xí)器??\樣?i?丨?略y/????采樣集T?訓(xùn)練?弱學(xué)器T?/??圖2:?Bagging算法流程圖??RF是Bagging算法的進(jìn)化版,它進(jìn)行了以下兩點(diǎn)改進(jìn)。????Bagging沒有明確規(guī)定的弱學(xué)習(xí)器,RF使用CART決策樹W作為弱學(xué)習(xí)器,??不同于ID3與C4.5,它采用基尼指數(shù)來選擇最優(yōu)的節(jié)點(diǎn)特征,并且CART是??二分決策樹,可用于處理分類和回歸問題;???在使用CART決策樹的基礎(chǔ)上,RF對決策樹的建立做了改進(jìn),對于普通的決??策樹,會(huì)從節(jié)點(diǎn)上的所有的n個(gè)特征中選擇一個(gè)最優(yōu)的特征作為決策樹的左??右子樹劃分節(jié)點(diǎn),但是RF通過隨機(jī)選擇節(jié)點(diǎn)上的一部分特征,這個(gè)數(shù)字通??常小于n,假設(shè)為nsub,然后在這些隨機(jī)選擇的nsub個(gè)樣本特征中,選擇一個(gè)??最優(yōu)的特征來作為決策樹的左右子樹劃分節(jié)點(diǎn),這樣進(jìn)一步增強(qiáng)了模型的泛??化能力。??RF的算法過程總結(jié)如下:??15??
率表現(xiàn)來更新訓(xùn)練樣本的權(quán)重,使得??第一個(gè)弱學(xué)習(xí)器學(xué)習(xí)誤差率高的訓(xùn)練樣本點(diǎn)的權(quán)重變高,便于在第二個(gè)弱學(xué)習(xí)器??中進(jìn)行針對性優(yōu)化,如此重復(fù)進(jìn)行,直到達(dá)到事先給定的迭代次數(shù)T,最終將T個(gè)??弱學(xué)習(xí)器通過集合策略進(jìn)行整合,得到最終的強(qiáng)學(xué)習(xí)器,如下圖所示:??(>^Dl)?|帶權(quán)市D1|?|弱學(xué)習(xí)器1??^?訓(xùn)練染??;?\??/?^?\??M個(gè)樣本訓(xùn)職?卜學(xué)習(xí)叫強(qiáng)學(xué)二m??\:?。?T^ri:??I:?ifl?/??廠?An?1?/??(u^)?^|DT?^?|弱學(xué)習(xí)器T??圖3:?Boosting算法流程圖??16??
【參考文獻(xiàn)】:
期刊論文
[1]基于機(jī)器學(xué)習(xí)的神經(jīng)精神疾病輔助診斷研究進(jìn)展[J]. 雷炳業(yè),潘嘉瑜,吳逢春,陸小兵,寧玉萍,陳軍,吳凱. 中國醫(yī)學(xué)物理學(xué)雜志. 2020(02)
[2]老年人肌少癥的成因、評估及應(yīng)對[J]. 王坤,羅炯,劉立,歐陽一毅. 中國組織工程研究. 2019(11)
[3]基于改進(jìn)神經(jīng)網(wǎng)絡(luò)的糖尿病生化指標(biāo)值預(yù)測[J]. 陳德華,洪靈濤,潘喬. 微型機(jī)與應(yīng)用. 2017(05)
[4]武漢地區(qū)中老年男性肌肉減少癥與骨密度的相關(guān)性[J]. 帥波,沈霖,楊艷萍,馬陳,徐曉娟,呂林,夏雪. 中華骨質(zhì)疏松和骨礦鹽疾病雜志. 2016(03)
[5]維生素D在骨代謝異常治療中的多效性[J]. 費(fèi)錦萍,郭利明. 現(xiàn)代實(shí)用醫(yī)學(xué). 2015(12)
[6]北京高齡老年男性骨骼肌含量減少與行走功能的相關(guān)性研究[J]. 張穎,胡亦新,范利,張曼秀,孫靜,韓曉琦,馬曉娜,董宏艷,李梅. 中華保健醫(yī)學(xué)雜志. 2014(06)
[7]采用不同標(biāo)準(zhǔn)對北京社區(qū)男性老年肌少癥檢出率比較的研究[J]. 李梅,胡亦新,董宏艷,張穎,范利,張曼秀,孫靜,韓曉琦,劉云霞,馬曉娜. 中華保健醫(yī)學(xué)雜志. 2014(06)
[8]國際體力活動(dòng)問卷中體力活動(dòng)水平的計(jì)算方法[J]. 樊萌語,呂筠,何平平. 中華流行病學(xué)雜志. 2014 (08)
碩士論文
[1]社區(qū)居民糖尿病風(fēng)險(xiǎn)預(yù)測系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 苗豐順.中國科學(xué)院大學(xué)(中國科學(xué)院沈陽計(jì)算技術(shù)研究所) 2019
[2]加權(quán)樣本分類算法設(shè)計(jì)和基于加法邏輯回歸模型的Boosting算法設(shè)計(jì)[D]. 王超.華中師范大學(xué) 2019
[3]老年2型糖尿病合并骨質(zhì)疏松癥與肌少癥的相關(guān)性及影響因素的研究[D]. 肖娜.川北醫(yī)學(xué)院 2019
[4]重慶市主城區(qū)中老年體檢人群肌肉減少癥患病率調(diào)查及危險(xiǎn)因素分析[D]. 劉利利.重慶醫(yī)科大學(xué) 2019
[5]基于BP神經(jīng)網(wǎng)絡(luò)的心血管病預(yù)測系統(tǒng)的研究與實(shí)現(xiàn)[D]. 李小敏.寧夏大學(xué) 2018
本文編號:3336467
【文章來源】:華中師范大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁數(shù)】:52 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖1:?smote模擬生成樣本圖??
碩士學(xué)位論文??MASTER'S?THESIS??3.2?RF(Random?Forest)??隨機(jī)森林(RF)是機(jī)器學(xué)習(xí)中的一種集成算法,它的思想源于Bagging算法,??Bagging的特點(diǎn)是隨機(jī)釆樣,每次都從訓(xùn)練集里有放回地采集固定個(gè)數(shù)的樣本。??對于Bagging算法,一般隨機(jī)采集樣本個(gè)數(shù)和訓(xùn)練集樣本個(gè)數(shù)一樣,對每次采集??好的樣本建立一個(gè)模型作為弱學(xué)習(xí)器,采用投票法則選擇票數(shù)最多的類別作為最??終的輸出結(jié)果。形象表示如下圖:??采樣糶1?mu.?弱學(xué)習(xí)器1?\???采樣集2?訓(xùn)練?弱學(xué)習(xí)器2????M個(gè)樣本?'?1?強(qiáng)學(xué)習(xí)器??\樣?i?丨?略y/????采樣集T?訓(xùn)練?弱學(xué)器T?/??圖2:?Bagging算法流程圖??RF是Bagging算法的進(jìn)化版,它進(jìn)行了以下兩點(diǎn)改進(jìn)。????Bagging沒有明確規(guī)定的弱學(xué)習(xí)器,RF使用CART決策樹W作為弱學(xué)習(xí)器,??不同于ID3與C4.5,它采用基尼指數(shù)來選擇最優(yōu)的節(jié)點(diǎn)特征,并且CART是??二分決策樹,可用于處理分類和回歸問題;???在使用CART決策樹的基礎(chǔ)上,RF對決策樹的建立做了改進(jìn),對于普通的決??策樹,會(huì)從節(jié)點(diǎn)上的所有的n個(gè)特征中選擇一個(gè)最優(yōu)的特征作為決策樹的左??右子樹劃分節(jié)點(diǎn),但是RF通過隨機(jī)選擇節(jié)點(diǎn)上的一部分特征,這個(gè)數(shù)字通??常小于n,假設(shè)為nsub,然后在這些隨機(jī)選擇的nsub個(gè)樣本特征中,選擇一個(gè)??最優(yōu)的特征來作為決策樹的左右子樹劃分節(jié)點(diǎn),這樣進(jìn)一步增強(qiáng)了模型的泛??化能力。??RF的算法過程總結(jié)如下:??15??
率表現(xiàn)來更新訓(xùn)練樣本的權(quán)重,使得??第一個(gè)弱學(xué)習(xí)器學(xué)習(xí)誤差率高的訓(xùn)練樣本點(diǎn)的權(quán)重變高,便于在第二個(gè)弱學(xué)習(xí)器??中進(jìn)行針對性優(yōu)化,如此重復(fù)進(jìn)行,直到達(dá)到事先給定的迭代次數(shù)T,最終將T個(gè)??弱學(xué)習(xí)器通過集合策略進(jìn)行整合,得到最終的強(qiáng)學(xué)習(xí)器,如下圖所示:??(>^Dl)?|帶權(quán)市D1|?|弱學(xué)習(xí)器1??^?訓(xùn)練染??;?\??/?^?\??M個(gè)樣本訓(xùn)職?卜學(xué)習(xí)叫強(qiáng)學(xué)二m??\:?。?T^ri:??I:?ifl?/??廠?An?1?/??(u^)?^|DT?^?|弱學(xué)習(xí)器T??圖3:?Boosting算法流程圖??16??
【參考文獻(xiàn)】:
期刊論文
[1]基于機(jī)器學(xué)習(xí)的神經(jīng)精神疾病輔助診斷研究進(jìn)展[J]. 雷炳業(yè),潘嘉瑜,吳逢春,陸小兵,寧玉萍,陳軍,吳凱. 中國醫(yī)學(xué)物理學(xué)雜志. 2020(02)
[2]老年人肌少癥的成因、評估及應(yīng)對[J]. 王坤,羅炯,劉立,歐陽一毅. 中國組織工程研究. 2019(11)
[3]基于改進(jìn)神經(jīng)網(wǎng)絡(luò)的糖尿病生化指標(biāo)值預(yù)測[J]. 陳德華,洪靈濤,潘喬. 微型機(jī)與應(yīng)用. 2017(05)
[4]武漢地區(qū)中老年男性肌肉減少癥與骨密度的相關(guān)性[J]. 帥波,沈霖,楊艷萍,馬陳,徐曉娟,呂林,夏雪. 中華骨質(zhì)疏松和骨礦鹽疾病雜志. 2016(03)
[5]維生素D在骨代謝異常治療中的多效性[J]. 費(fèi)錦萍,郭利明. 現(xiàn)代實(shí)用醫(yī)學(xué). 2015(12)
[6]北京高齡老年男性骨骼肌含量減少與行走功能的相關(guān)性研究[J]. 張穎,胡亦新,范利,張曼秀,孫靜,韓曉琦,馬曉娜,董宏艷,李梅. 中華保健醫(yī)學(xué)雜志. 2014(06)
[7]采用不同標(biāo)準(zhǔn)對北京社區(qū)男性老年肌少癥檢出率比較的研究[J]. 李梅,胡亦新,董宏艷,張穎,范利,張曼秀,孫靜,韓曉琦,劉云霞,馬曉娜. 中華保健醫(yī)學(xué)雜志. 2014(06)
[8]國際體力活動(dòng)問卷中體力活動(dòng)水平的計(jì)算方法[J]. 樊萌語,呂筠,何平平. 中華流行病學(xué)雜志. 2014 (08)
碩士論文
[1]社區(qū)居民糖尿病風(fēng)險(xiǎn)預(yù)測系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D]. 苗豐順.中國科學(xué)院大學(xué)(中國科學(xué)院沈陽計(jì)算技術(shù)研究所) 2019
[2]加權(quán)樣本分類算法設(shè)計(jì)和基于加法邏輯回歸模型的Boosting算法設(shè)計(jì)[D]. 王超.華中師范大學(xué) 2019
[3]老年2型糖尿病合并骨質(zhì)疏松癥與肌少癥的相關(guān)性及影響因素的研究[D]. 肖娜.川北醫(yī)學(xué)院 2019
[4]重慶市主城區(qū)中老年體檢人群肌肉減少癥患病率調(diào)查及危險(xiǎn)因素分析[D]. 劉利利.重慶醫(yī)科大學(xué) 2019
[5]基于BP神經(jīng)網(wǎng)絡(luò)的心血管病預(yù)測系統(tǒng)的研究與實(shí)現(xiàn)[D]. 李小敏.寧夏大學(xué) 2018
本文編號:3336467
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3336467.html
最近更新
教材專著