基于特征選擇的結(jié)直腸癌預測模型研究
發(fā)布時間:2021-02-06 04:12
結(jié)直腸癌(colorectal cancer,CRC)是消化系統(tǒng)中最容易發(fā)作的癌癥之一,據(jù)統(tǒng)計,世界上每年患該病的人數(shù)多達120萬,死于該病的人數(shù)大約占據(jù)了患者人數(shù)的一半,高達60萬人,不僅使人類的健康受到嚴重的威脅,而且使國民經(jīng)濟也遭受了巨大的損失。目前幾種方法能夠幫助醫(yī)務(wù)人員對結(jié)直腸癌進行診斷,它們是:X線檢查、血清癌胚抗原、B超掃描、內(nèi)鏡檢查等,這些無疑對結(jié)直腸癌的診斷起到很大作用,但是這些方法都依賴于醫(yī)生的經(jīng)驗,難以確保準確性,同時也增加了醫(yī)務(wù)人員的工作強度。針對以上結(jié)直腸癌診斷方法的局限性,融入機器學習算法的預測模型逐步成為研究的熱點。機器學習算法在疾病預測領(lǐng)域的智能性表現(xiàn)為主動地對醫(yī)療數(shù)據(jù)進行學習,更重要的是根據(jù)構(gòu)建的多個模型做出最終的決策,對提高疾病診斷的準確性、實時性,減輕醫(yī)務(wù)人員的工作強度具有重大意義。盡管如此,單一的機器學習算法對不同的數(shù)據(jù)分類預測時未必都能得到可觀的效果,必須綜合考慮多種技術(shù)的融合和優(yōu)化。目前,利用機器學習算法對結(jié)直腸癌進行預測主要存在疾病特征因素冗余、特征選取不當、分類器選擇不當以及數(shù)據(jù)樣本不平衡等問題,導致一些機器學習算法在診斷結(jié)直腸癌的過程中...
【文章來源】:山東師范大學山東省
【文章頁數(shù)】:51 頁
【學位級別】:碩士
【部分圖文】:
ROC曲線示意圖
(b) 多項式核函數(shù)全局特性 圖 2-3 不同核函數(shù)尋優(yōu)特性數(shù)的局部特性, =0.1,0.2,0.3,0.4,0. 試點較遠的樣本受函數(shù)的影響較小2-3(b)表示多項式的全局特性,d=不同時,仍存在很大影響,這說明2-3(c)是混合核函數(shù)的綜合特性,2-3 中不同核函數(shù)性能的比較,我性與多項式核函數(shù)的全局性能,從器學習和數(shù)據(jù)科學中最為廣泛使用隨機森林是由若干個決策樹通過組
icutes 1.086 0.394 7.586 1 0.006eroidetes 1.702 0.531 10.028 1 0.001 1.220 0.502 6.187 1 0.0400.942 0.395 5.692 1 0.017tant -17.756 3.802 21.814 1 0.000特征選取結(jié)果于說明二元分類器系統(tǒng)的診斷能力,隨著 ROC 曲線接近左疾病診斷的效果越好。在 3.5.1 節(jié)中,我們利用二元 Logisroidetes,BIM 和 age 四種因素與結(jié)直腸有關(guān),但是,究竟是組合因素對于該病診斷效果好,我們利用 ROC 曲線進ogistic 回歸模型的 ROC 曲線。表 3-2 中列出了單因素和組C 值。由圖 3-2 和表 3-2 可以看出,F(xiàn)irmicutes,Bacteroidet 為 0.942,比其他單因素的各項指標更接近 1,這說明組合好一些。
【參考文獻】:
期刊論文
[1]不同年齡組的結(jié)直腸癌臨床流行病學分析[J]. 阮麗琴,李太原,周鳳鳳. 實用臨床醫(yī)學. 2016(04)
[2]結(jié)直腸癌的發(fā)生與飲食構(gòu)成因素關(guān)系的研究進展[J]. 宋美璇,李顯蓉. 中國普外基礎(chǔ)與臨床雜志. 2015(09)
[3]MMP7啟動子區(qū)基因多態(tài)性分布與結(jié)直腸癌相關(guān)性的研究[J]. 王琛,黎華,宗亞光,婁喻童,張好剛. 哈爾濱醫(yī)科大學學報. 2015(03)
[4]飲食因素影響結(jié)直腸癌發(fā)生的研究進展[J]. 陳辰,房靜遠. 中華醫(yī)學雜志. 2014 (26)
[5]DR對于肺部小結(jié)節(jié)的檢測ROL分析研究[J]. 楊文芳. 臨床肺科雜志. 2012(10)
[6]結(jié)直腸癌實驗研究現(xiàn)狀及展望[J]. 王磊,宋順心,汪建平. 中華實驗外科雜志. 2013 (03)
碩士論文
[1]RUSBoost算法在不平衡數(shù)據(jù)集上的應(yīng)用[D]. 尹絮童.大連理工大學 2018
[2]面向健康評估的機器學習方法研究與應(yīng)用[D]. 趙家英.電子科技大學 2016
本文編號:3020128
【文章來源】:山東師范大學山東省
【文章頁數(shù)】:51 頁
【學位級別】:碩士
【部分圖文】:
ROC曲線示意圖
(b) 多項式核函數(shù)全局特性 圖 2-3 不同核函數(shù)尋優(yōu)特性數(shù)的局部特性, =0.1,0.2,0.3,0.4,0. 試點較遠的樣本受函數(shù)的影響較小2-3(b)表示多項式的全局特性,d=不同時,仍存在很大影響,這說明2-3(c)是混合核函數(shù)的綜合特性,2-3 中不同核函數(shù)性能的比較,我性與多項式核函數(shù)的全局性能,從器學習和數(shù)據(jù)科學中最為廣泛使用隨機森林是由若干個決策樹通過組
icutes 1.086 0.394 7.586 1 0.006eroidetes 1.702 0.531 10.028 1 0.001 1.220 0.502 6.187 1 0.0400.942 0.395 5.692 1 0.017tant -17.756 3.802 21.814 1 0.000特征選取結(jié)果于說明二元分類器系統(tǒng)的診斷能力,隨著 ROC 曲線接近左疾病診斷的效果越好。在 3.5.1 節(jié)中,我們利用二元 Logisroidetes,BIM 和 age 四種因素與結(jié)直腸有關(guān),但是,究竟是組合因素對于該病診斷效果好,我們利用 ROC 曲線進ogistic 回歸模型的 ROC 曲線。表 3-2 中列出了單因素和組C 值。由圖 3-2 和表 3-2 可以看出,F(xiàn)irmicutes,Bacteroidet 為 0.942,比其他單因素的各項指標更接近 1,這說明組合好一些。
【參考文獻】:
期刊論文
[1]不同年齡組的結(jié)直腸癌臨床流行病學分析[J]. 阮麗琴,李太原,周鳳鳳. 實用臨床醫(yī)學. 2016(04)
[2]結(jié)直腸癌的發(fā)生與飲食構(gòu)成因素關(guān)系的研究進展[J]. 宋美璇,李顯蓉. 中國普外基礎(chǔ)與臨床雜志. 2015(09)
[3]MMP7啟動子區(qū)基因多態(tài)性分布與結(jié)直腸癌相關(guān)性的研究[J]. 王琛,黎華,宗亞光,婁喻童,張好剛. 哈爾濱醫(yī)科大學學報. 2015(03)
[4]飲食因素影響結(jié)直腸癌發(fā)生的研究進展[J]. 陳辰,房靜遠. 中華醫(yī)學雜志. 2014 (26)
[5]DR對于肺部小結(jié)節(jié)的檢測ROL分析研究[J]. 楊文芳. 臨床肺科雜志. 2012(10)
[6]結(jié)直腸癌實驗研究現(xiàn)狀及展望[J]. 王磊,宋順心,汪建平. 中華實驗外科雜志. 2013 (03)
碩士論文
[1]RUSBoost算法在不平衡數(shù)據(jù)集上的應(yīng)用[D]. 尹絮童.大連理工大學 2018
[2]面向健康評估的機器學習方法研究與應(yīng)用[D]. 趙家英.電子科技大學 2016
本文編號:3020128
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3020128.html
最近更新
教材專著