基于集成學(xué)習(xí)的乳腺癌分類研究
發(fā)布時(shí)間:2021-03-31 04:21
目的由于傳統(tǒng)機(jī)器學(xué)習(xí)算法的分類能力較低,不足以輔助臨床診斷,本研究將分類功能強(qiáng)大的集成學(xué)習(xí)與醫(yī)療診斷相結(jié)合,提高診斷準(zhǔn)確率和召回率。方法研究應(yīng)用集成學(xué)習(xí)的隨機(jī)森林算法和Xgboost算法來(lái)提高模型準(zhǔn)確率和召回率,并利用交叉驗(yàn)證和網(wǎng)格搜索提高模型擬合能力。結(jié)果通過(guò)對(duì)比隨機(jī)森林模型、Xgboost模型和傳統(tǒng)機(jī)器學(xué)習(xí)的決策樹(shù)模型,研究得出,集成學(xué)習(xí)極大地提高了乳腺癌診斷的準(zhǔn)確率和召回率,準(zhǔn)確率從0.92提高至0.96,召回率從0.90提高至0.97和0.99。結(jié)論將集成學(xué)習(xí)算法與實(shí)際醫(yī)療診斷技術(shù)相結(jié)合具有實(shí)際的研究意義,可以進(jìn)一步將兩種領(lǐng)域相結(jié)合,以提高醫(yī)療診斷的效率和準(zhǔn)確率。
【文章來(lái)源】:中國(guó)醫(yī)療設(shè)備. 2020,35(12)
【文章頁(yè)數(shù)】:4 頁(yè)
【部分圖文】:
決策樹(shù)結(jié)構(gòu)
隨機(jī)森林是1995年由貝爾實(shí)驗(yàn)室的Tin Kam Ho提出的[12],該模型是根據(jù)多個(gè)決策樹(shù)分類器的輸出,采用投票取眾數(shù)的方法進(jìn)行決策[13,14],其模型結(jié)構(gòu)如圖2所示,第一層是弱分類器,每個(gè)弱分類器都根據(jù)數(shù)據(jù)做出自己的判斷,最后采取投票選擇投票最多的結(jié)果作為真實(shí)輸出結(jié)果。此項(xiàng)目模型利用了10折交叉驗(yàn)證和網(wǎng)格搜索等方法優(yōu)化模型,提高模型泛化能力和準(zhǔn)確度。n折交叉驗(yàn)證就是在訓(xùn)練模型時(shí)將訓(xùn)練樣本分成n份,其中的1份保留作為驗(yàn)證模型的數(shù)據(jù),其余的n-1個(gè)樣本用來(lái)訓(xùn)練,交叉驗(yàn)證重復(fù)n次,最終每個(gè)子樣本都驗(yàn)證一次,然后將n次的結(jié)果平均得到一個(gè)單一的估測(cè)值,可以防止模型過(guò)擬合,提高模型的泛化能力。
Xgboost結(jié)構(gòu)
【參考文獻(xiàn)】:
期刊論文
[1]集成學(xué)習(xí)在糖尿病預(yù)測(cè)中的應(yīng)用[J]. 張玉璽,賀松,尤思?jí)? 智能計(jì)算機(jī)與應(yīng)用. 2019(05)
[2]改進(jìn)隨機(jī)森林算法綜述[J]. 孫明喆,畢瑤家,孫馳. 現(xiàn)代信息科技. 2019(20)
[3]基于XGBoost算法的風(fēng)機(jī)葉片結(jié)冰狀態(tài)評(píng)測(cè)[J]. 李大中,王超,李穎宇. 電力科學(xué)與工程. 2019(09)
[4]基于主動(dòng)集成學(xué)習(xí)的中醫(yī)智能診斷模型及構(gòu)建方法[J]. 任雪,郭艷. 中國(guó)循證醫(yī)學(xué)雜志. 2019(09)
[5]基于卷積神經(jīng)網(wǎng)絡(luò)和集成學(xué)習(xí)的阿爾茨海默癥早期診斷[J]. 曾安,賈龍飛,潘丹,Song Xiaowei. 生物醫(yī)學(xué)工程學(xué)雜志. 2019(05)
[6]隨機(jī)森林算法研究綜述[J]. 呂紅燕,馮倩. 河北省科學(xué)院學(xué)報(bào). 2019(03)
[7]基于XGBoost的特征選擇算法[J]. 李占山,劉兆賡. 通信學(xué)報(bào). 2019(10)
[8]集成學(xué)習(xí)方法研究[J]. 周鋼,郭福亮. 計(jì)算技術(shù)與自動(dòng)化. 2018(04)
[9]集成學(xué)習(xí)方法:研究綜述[J]. 徐繼偉,楊云. 云南大學(xué)學(xué)報(bào)(自然科學(xué)版). 2018(06)
博士論文
[1]基于集成學(xué)習(xí)的工業(yè)過(guò)程監(jiān)測(cè)[D]. 劉玥.浙江大學(xué) 2019
本文編號(hào):3110780
【文章來(lái)源】:中國(guó)醫(yī)療設(shè)備. 2020,35(12)
【文章頁(yè)數(shù)】:4 頁(yè)
【部分圖文】:
決策樹(shù)結(jié)構(gòu)
隨機(jī)森林是1995年由貝爾實(shí)驗(yàn)室的Tin Kam Ho提出的[12],該模型是根據(jù)多個(gè)決策樹(shù)分類器的輸出,采用投票取眾數(shù)的方法進(jìn)行決策[13,14],其模型結(jié)構(gòu)如圖2所示,第一層是弱分類器,每個(gè)弱分類器都根據(jù)數(shù)據(jù)做出自己的判斷,最后采取投票選擇投票最多的結(jié)果作為真實(shí)輸出結(jié)果。此項(xiàng)目模型利用了10折交叉驗(yàn)證和網(wǎng)格搜索等方法優(yōu)化模型,提高模型泛化能力和準(zhǔn)確度。n折交叉驗(yàn)證就是在訓(xùn)練模型時(shí)將訓(xùn)練樣本分成n份,其中的1份保留作為驗(yàn)證模型的數(shù)據(jù),其余的n-1個(gè)樣本用來(lái)訓(xùn)練,交叉驗(yàn)證重復(fù)n次,最終每個(gè)子樣本都驗(yàn)證一次,然后將n次的結(jié)果平均得到一個(gè)單一的估測(cè)值,可以防止模型過(guò)擬合,提高模型的泛化能力。
Xgboost結(jié)構(gòu)
【參考文獻(xiàn)】:
期刊論文
[1]集成學(xué)習(xí)在糖尿病預(yù)測(cè)中的應(yīng)用[J]. 張玉璽,賀松,尤思?jí)? 智能計(jì)算機(jī)與應(yīng)用. 2019(05)
[2]改進(jìn)隨機(jī)森林算法綜述[J]. 孫明喆,畢瑤家,孫馳. 現(xiàn)代信息科技. 2019(20)
[3]基于XGBoost算法的風(fēng)機(jī)葉片結(jié)冰狀態(tài)評(píng)測(cè)[J]. 李大中,王超,李穎宇. 電力科學(xué)與工程. 2019(09)
[4]基于主動(dòng)集成學(xué)習(xí)的中醫(yī)智能診斷模型及構(gòu)建方法[J]. 任雪,郭艷. 中國(guó)循證醫(yī)學(xué)雜志. 2019(09)
[5]基于卷積神經(jīng)網(wǎng)絡(luò)和集成學(xué)習(xí)的阿爾茨海默癥早期診斷[J]. 曾安,賈龍飛,潘丹,Song Xiaowei. 生物醫(yī)學(xué)工程學(xué)雜志. 2019(05)
[6]隨機(jī)森林算法研究綜述[J]. 呂紅燕,馮倩. 河北省科學(xué)院學(xué)報(bào). 2019(03)
[7]基于XGBoost的特征選擇算法[J]. 李占山,劉兆賡. 通信學(xué)報(bào). 2019(10)
[8]集成學(xué)習(xí)方法研究[J]. 周鋼,郭福亮. 計(jì)算技術(shù)與自動(dòng)化. 2018(04)
[9]集成學(xué)習(xí)方法:研究綜述[J]. 徐繼偉,楊云. 云南大學(xué)學(xué)報(bào)(自然科學(xué)版). 2018(06)
博士論文
[1]基于集成學(xué)習(xí)的工業(yè)過(guò)程監(jiān)測(cè)[D]. 劉玥.浙江大學(xué) 2019
本文編號(hào):3110780
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3110780.html
最近更新
教材專著