機器學(xué)習(xí)算法在肌少癥診斷中的應(yīng)用
發(fā)布時間:2021-08-11 16:07
近年來智慧醫(yī)療飛速發(fā)展,利用人工智能技術(shù)輔助醫(yī)療診斷已經(jīng)成為趨勢,國內(nèi)外對機器學(xué)習(xí)輔助醫(yī)療的研究的也越發(fā)成熟,許多關(guān)于疾病的機器學(xué)習(xí)預(yù)診模型都已建立。采用機器學(xué)習(xí)算法來輔助醫(yī)生進行診斷,將會很大程度上提高診斷的科學(xué)性,也能有效地克服僅憑醫(yī)生經(jīng)驗來診斷的主觀性問題,還從一定程度上減輕了醫(yī)生的負(fù)擔(dān)。針對以上研究背景,本文依托于實驗室研究項目,對肌少癥這一疾病進行研究,建立一個適用于肌少癥診斷的機器學(xué)習(xí)模型。本文在第二、第三章中對相關(guān)的理論基礎(chǔ)進行的詳細(xì)的闡述,主要包括數(shù)據(jù)的處理、模型的評價以及算法介紹幾個方面。對機器學(xué)習(xí)算法的選擇上,本文采用支持向量機(SVM)、隨機森林(RF)、XGBoost和CatBoost四種算法進行對比研究,對于模型的評價指標(biāo),本文選擇了準(zhǔn)確率、精確率、召回率和F1值四個指標(biāo)。值得一提的是,本文中的肌少癥數(shù)據(jù)除了包含一些門診數(shù)據(jù)之外,也包含了一些行為數(shù)據(jù),在第四章中從特征的相關(guān)性研究和機器學(xué)習(xí)算法給出的重要程度排序兩方面論證了這些行為特征對預(yù)診模型建立的重要性,從醫(yī)學(xué)診療上看也豐富了患者的數(shù)據(jù)類型。本文在研究的過程中還強調(diào)了分類問題中類別均衡對算法訓(xùn)練的重要性,并...
【文章來源】:華中師范大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁數(shù)】:52 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖1:?smote模擬生成樣本圖??
碩士學(xué)位論文??MASTER'S?THESIS??3.2?RF(Random?Forest)??隨機森林(RF)是機器學(xué)習(xí)中的一種集成算法,它的思想源于Bagging算法,??Bagging的特點是隨機釆樣,每次都從訓(xùn)練集里有放回地采集固定個數(shù)的樣本。??對于Bagging算法,一般隨機采集樣本個數(shù)和訓(xùn)練集樣本個數(shù)一樣,對每次采集??好的樣本建立一個模型作為弱學(xué)習(xí)器,采用投票法則選擇票數(shù)最多的類別作為最??終的輸出結(jié)果。形象表示如下圖:??采樣糶1?mu.?弱學(xué)習(xí)器1?\???采樣集2?訓(xùn)練?弱學(xué)習(xí)器2????M個樣本?'?1?強學(xué)習(xí)器??\樣?i?丨?略y/????采樣集T?訓(xùn)練?弱學(xué)器T?/??圖2:?Bagging算法流程圖??RF是Bagging算法的進化版,它進行了以下兩點改進。????Bagging沒有明確規(guī)定的弱學(xué)習(xí)器,RF使用CART決策樹W作為弱學(xué)習(xí)器,??不同于ID3與C4.5,它采用基尼指數(shù)來選擇最優(yōu)的節(jié)點特征,并且CART是??二分決策樹,可用于處理分類和回歸問題;???在使用CART決策樹的基礎(chǔ)上,RF對決策樹的建立做了改進,對于普通的決??策樹,會從節(jié)點上的所有的n個特征中選擇一個最優(yōu)的特征作為決策樹的左??右子樹劃分節(jié)點,但是RF通過隨機選擇節(jié)點上的一部分特征,這個數(shù)字通??常小于n,假設(shè)為nsub,然后在這些隨機選擇的nsub個樣本特征中,選擇一個??最優(yōu)的特征來作為決策樹的左右子樹劃分節(jié)點,這樣進一步增強了模型的泛??化能力。??RF的算法過程總結(jié)如下:??15??
率表現(xiàn)來更新訓(xùn)練樣本的權(quán)重,使得??第一個弱學(xué)習(xí)器學(xué)習(xí)誤差率高的訓(xùn)練樣本點的權(quán)重變高,便于在第二個弱學(xué)習(xí)器??中進行針對性優(yōu)化,如此重復(fù)進行,直到達到事先給定的迭代次數(shù)T,最終將T個??弱學(xué)習(xí)器通過集合策略進行整合,得到最終的強學(xué)習(xí)器,如下圖所示:??(>^Dl)?|帶權(quán)市D1|?|弱學(xué)習(xí)器1??^?訓(xùn)練染??;?\??/?^?\??M個樣本訓(xùn)職?卜學(xué)習(xí)叫強學(xué)二m??\:?。蓿浚裕蓿颍椋??I:?ifl?/??廠?An?1?/??(u^)?^|DT?^?|弱學(xué)習(xí)器T??圖3:?Boosting算法流程圖??16??
【參考文獻】:
期刊論文
[1]基于機器學(xué)習(xí)的神經(jīng)精神疾病輔助診斷研究進展[J]. 雷炳業(yè),潘嘉瑜,吳逢春,陸小兵,寧玉萍,陳軍,吳凱. 中國醫(yī)學(xué)物理學(xué)雜志. 2020(02)
[2]老年人肌少癥的成因、評估及應(yīng)對[J]. 王坤,羅炯,劉立,歐陽一毅. 中國組織工程研究. 2019(11)
[3]基于改進神經(jīng)網(wǎng)絡(luò)的糖尿病生化指標(biāo)值預(yù)測[J]. 陳德華,洪靈濤,潘喬. 微型機與應(yīng)用. 2017(05)
[4]武漢地區(qū)中老年男性肌肉減少癥與骨密度的相關(guān)性[J]. 帥波,沈霖,楊艷萍,馬陳,徐曉娟,呂林,夏雪. 中華骨質(zhì)疏松和骨礦鹽疾病雜志. 2016(03)
[5]維生素D在骨代謝異常治療中的多效性[J]. 費錦萍,郭利明. 現(xiàn)代實用醫(yī)學(xué). 2015(12)
[6]北京高齡老年男性骨骼肌含量減少與行走功能的相關(guān)性研究[J]. 張穎,胡亦新,范利,張曼秀,孫靜,韓曉琦,馬曉娜,董宏艷,李梅. 中華保健醫(yī)學(xué)雜志. 2014(06)
[7]采用不同標(biāo)準(zhǔn)對北京社區(qū)男性老年肌少癥檢出率比較的研究[J]. 李梅,胡亦新,董宏艷,張穎,范利,張曼秀,孫靜,韓曉琦,劉云霞,馬曉娜. 中華保健醫(yī)學(xué)雜志. 2014(06)
[8]國際體力活動問卷中體力活動水平的計算方法[J]. 樊萌語,呂筠,何平平. 中華流行病學(xué)雜志. 2014 (08)
碩士論文
[1]社區(qū)居民糖尿病風(fēng)險預(yù)測系統(tǒng)的設(shè)計與實現(xiàn)[D]. 苗豐順.中國科學(xué)院大學(xué)(中國科學(xué)院沈陽計算技術(shù)研究所) 2019
[2]加權(quán)樣本分類算法設(shè)計和基于加法邏輯回歸模型的Boosting算法設(shè)計[D]. 王超.華中師范大學(xué) 2019
[3]老年2型糖尿病合并骨質(zhì)疏松癥與肌少癥的相關(guān)性及影響因素的研究[D]. 肖娜.川北醫(yī)學(xué)院 2019
[4]重慶市主城區(qū)中老年體檢人群肌肉減少癥患病率調(diào)查及危險因素分析[D]. 劉利利.重慶醫(yī)科大學(xué) 2019
[5]基于BP神經(jīng)網(wǎng)絡(luò)的心血管病預(yù)測系統(tǒng)的研究與實現(xiàn)[D]. 李小敏.寧夏大學(xué) 2018
本文編號:3336467
【文章來源】:華中師范大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁數(shù)】:52 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖1:?smote模擬生成樣本圖??
碩士學(xué)位論文??MASTER'S?THESIS??3.2?RF(Random?Forest)??隨機森林(RF)是機器學(xué)習(xí)中的一種集成算法,它的思想源于Bagging算法,??Bagging的特點是隨機釆樣,每次都從訓(xùn)練集里有放回地采集固定個數(shù)的樣本。??對于Bagging算法,一般隨機采集樣本個數(shù)和訓(xùn)練集樣本個數(shù)一樣,對每次采集??好的樣本建立一個模型作為弱學(xué)習(xí)器,采用投票法則選擇票數(shù)最多的類別作為最??終的輸出結(jié)果。形象表示如下圖:??采樣糶1?mu.?弱學(xué)習(xí)器1?\???采樣集2?訓(xùn)練?弱學(xué)習(xí)器2????M個樣本?'?1?強學(xué)習(xí)器??\樣?i?丨?略y/????采樣集T?訓(xùn)練?弱學(xué)器T?/??圖2:?Bagging算法流程圖??RF是Bagging算法的進化版,它進行了以下兩點改進。????Bagging沒有明確規(guī)定的弱學(xué)習(xí)器,RF使用CART決策樹W作為弱學(xué)習(xí)器,??不同于ID3與C4.5,它采用基尼指數(shù)來選擇最優(yōu)的節(jié)點特征,并且CART是??二分決策樹,可用于處理分類和回歸問題;???在使用CART決策樹的基礎(chǔ)上,RF對決策樹的建立做了改進,對于普通的決??策樹,會從節(jié)點上的所有的n個特征中選擇一個最優(yōu)的特征作為決策樹的左??右子樹劃分節(jié)點,但是RF通過隨機選擇節(jié)點上的一部分特征,這個數(shù)字通??常小于n,假設(shè)為nsub,然后在這些隨機選擇的nsub個樣本特征中,選擇一個??最優(yōu)的特征來作為決策樹的左右子樹劃分節(jié)點,這樣進一步增強了模型的泛??化能力。??RF的算法過程總結(jié)如下:??15??
率表現(xiàn)來更新訓(xùn)練樣本的權(quán)重,使得??第一個弱學(xué)習(xí)器學(xué)習(xí)誤差率高的訓(xùn)練樣本點的權(quán)重變高,便于在第二個弱學(xué)習(xí)器??中進行針對性優(yōu)化,如此重復(fù)進行,直到達到事先給定的迭代次數(shù)T,最終將T個??弱學(xué)習(xí)器通過集合策略進行整合,得到最終的強學(xué)習(xí)器,如下圖所示:??(>^Dl)?|帶權(quán)市D1|?|弱學(xué)習(xí)器1??^?訓(xùn)練染??;?\??/?^?\??M個樣本訓(xùn)職?卜學(xué)習(xí)叫強學(xué)二m??\:?。蓿浚裕蓿颍椋??I:?ifl?/??廠?An?1?/??(u^)?^|DT?^?|弱學(xué)習(xí)器T??圖3:?Boosting算法流程圖??16??
【參考文獻】:
期刊論文
[1]基于機器學(xué)習(xí)的神經(jīng)精神疾病輔助診斷研究進展[J]. 雷炳業(yè),潘嘉瑜,吳逢春,陸小兵,寧玉萍,陳軍,吳凱. 中國醫(yī)學(xué)物理學(xué)雜志. 2020(02)
[2]老年人肌少癥的成因、評估及應(yīng)對[J]. 王坤,羅炯,劉立,歐陽一毅. 中國組織工程研究. 2019(11)
[3]基于改進神經(jīng)網(wǎng)絡(luò)的糖尿病生化指標(biāo)值預(yù)測[J]. 陳德華,洪靈濤,潘喬. 微型機與應(yīng)用. 2017(05)
[4]武漢地區(qū)中老年男性肌肉減少癥與骨密度的相關(guān)性[J]. 帥波,沈霖,楊艷萍,馬陳,徐曉娟,呂林,夏雪. 中華骨質(zhì)疏松和骨礦鹽疾病雜志. 2016(03)
[5]維生素D在骨代謝異常治療中的多效性[J]. 費錦萍,郭利明. 現(xiàn)代實用醫(yī)學(xué). 2015(12)
[6]北京高齡老年男性骨骼肌含量減少與行走功能的相關(guān)性研究[J]. 張穎,胡亦新,范利,張曼秀,孫靜,韓曉琦,馬曉娜,董宏艷,李梅. 中華保健醫(yī)學(xué)雜志. 2014(06)
[7]采用不同標(biāo)準(zhǔn)對北京社區(qū)男性老年肌少癥檢出率比較的研究[J]. 李梅,胡亦新,董宏艷,張穎,范利,張曼秀,孫靜,韓曉琦,劉云霞,馬曉娜. 中華保健醫(yī)學(xué)雜志. 2014(06)
[8]國際體力活動問卷中體力活動水平的計算方法[J]. 樊萌語,呂筠,何平平. 中華流行病學(xué)雜志. 2014 (08)
碩士論文
[1]社區(qū)居民糖尿病風(fēng)險預(yù)測系統(tǒng)的設(shè)計與實現(xiàn)[D]. 苗豐順.中國科學(xué)院大學(xué)(中國科學(xué)院沈陽計算技術(shù)研究所) 2019
[2]加權(quán)樣本分類算法設(shè)計和基于加法邏輯回歸模型的Boosting算法設(shè)計[D]. 王超.華中師范大學(xué) 2019
[3]老年2型糖尿病合并骨質(zhì)疏松癥與肌少癥的相關(guān)性及影響因素的研究[D]. 肖娜.川北醫(yī)學(xué)院 2019
[4]重慶市主城區(qū)中老年體檢人群肌肉減少癥患病率調(diào)查及危險因素分析[D]. 劉利利.重慶醫(yī)科大學(xué) 2019
[5]基于BP神經(jīng)網(wǎng)絡(luò)的心血管病預(yù)測系統(tǒng)的研究與實現(xiàn)[D]. 李小敏.寧夏大學(xué) 2018
本文編號:3336467
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3336467.html
最近更新
教材專著