數(shù)據(jù)挖掘在新疆肺結核區(qū)域發(fā)病風險建模與預測中的應用
發(fā)布時間:2021-04-17 11:25
目的采用數(shù)據(jù)挖掘技術與方法構建生態(tài)學因素預測模型,探討其在新疆涂陽肺結核區(qū)域發(fā)病風險(SMR)中的應用價值,為新疆結核病的精準防控提供方法學參考。方法分別采用Lasso和RFE對生態(tài)學指標進行篩選,構建Lasso回歸和SVR模型,對比與評價建模效果。結果新疆西南部地區(qū)涂陽肺結核SMR較高, Lasso和RFE特征選擇結果存在差異,SVR模型預測效果整體上優(yōu)于OLS和Lasso回歸模型,Lasso法結合SVR模型預測效果最優(yōu)。結論依據(jù)不同地區(qū)、不同生態(tài)學現(xiàn)狀SMR水平的差異,針對性地采取肺結核的預防與控制措施,對肺結核疫情的精準防控具有重要的實踐意義。
【文章來源】:現(xiàn)代預防醫(yī)學. 2020,47(04)北大核心
【文章頁數(shù)】:6 頁
【部分圖文】:
Lasso的特征序列圖
相比經(jīng)典線性回歸模型(OLS模型),采用不同特征選擇的SVR回歸與Lasso回歸建模效果評價見表2:對于SVR回歸建模,采用RFE與Lasso特征選擇,效果略有不同,采用Lasso特征選擇的RMSE值、MSE值略低,R2值略高,提示Lasso特征結果略好RFE;對于Lasso回歸建模,RFE與Lasso兩種特征選擇方法建模結果接近。相比OLS回歸模型與Lasso回歸模型,SVR模型的建模效果較優(yōu)。綜合分析,基于Lasso特征選擇SVR回歸建模的效果最優(yōu)。2.3.3 肺結核SMR的區(qū)域預測與殘差分析
基于Lasso特征選擇的SVR與Lasso回歸建模的新疆涂陽肺結核SMR預測值區(qū)域分布結果見圖5和圖6:兩種模型預測值與SMR值(圖1)分布基本一致,均呈現(xiàn)出西南部地區(qū)SMR較高,北部、東部地區(qū)的SMR相對較低的趨勢;SVR與Lasso回歸建模殘差分布圖顯示:兩種模型殘差較大的區(qū)域分布相似,多數(shù)分布在洛浦縣、阿瓦提縣、溫宿縣、尉犁縣、托里縣、沙灣縣、獨山子區(qū),均為SMR高的區(qū)域,但SVR模型的殘差值整體上略小于Lasso回歸模型,提示SVR建模效果略優(yōu)于Lasso建模。3 討論
【參考文獻】:
期刊論文
[1]分位數(shù)回歸模型在新疆涂陽肺結核報告率生態(tài)學影響因素的應用分析[J]. 張偉文,賀湘焱,李奇鳳,木哈達斯·吐爾遜依明,曹明芹. 現(xiàn)代預防醫(yī)學. 2019(03)
[2]空間截面回歸模型在肺結核病社會影響因素生態(tài)學分析中的應用[J]. 饒華祥,徐莉立,蔡芝鋒,李永紅,仇麗霞. 中國衛(wèi)生統(tǒng)計. 2018(05)
[3]基于GIS的青海省結核病時空分布特征研究[J]. 馬永成,王兆芬,李斌,馬斌忠,馬成強,申秀麗,張媛媛,汪海靜,蔣明霞,王衛(wèi)軍. 中華疾病控制雜志. 2018(04)
[4]基于張量的正則化多線性回歸算法及其應用[J]. 路子祥,黃嘉爽,屠黎陽,徐西嘉,張道強. 計算機科學與探索. 2018(07)
[5]支持向量機在傳染病發(fā)病率預測中的應用[J]. 解合川,任欽,曾海燕,張興裕,李曉松. 現(xiàn)代預防醫(yī)學. 2013(22)
本文編號:3143368
【文章來源】:現(xiàn)代預防醫(yī)學. 2020,47(04)北大核心
【文章頁數(shù)】:6 頁
【部分圖文】:
Lasso的特征序列圖
相比經(jīng)典線性回歸模型(OLS模型),采用不同特征選擇的SVR回歸與Lasso回歸建模效果評價見表2:對于SVR回歸建模,采用RFE與Lasso特征選擇,效果略有不同,采用Lasso特征選擇的RMSE值、MSE值略低,R2值略高,提示Lasso特征結果略好RFE;對于Lasso回歸建模,RFE與Lasso兩種特征選擇方法建模結果接近。相比OLS回歸模型與Lasso回歸模型,SVR模型的建模效果較優(yōu)。綜合分析,基于Lasso特征選擇SVR回歸建模的效果最優(yōu)。2.3.3 肺結核SMR的區(qū)域預測與殘差分析
基于Lasso特征選擇的SVR與Lasso回歸建模的新疆涂陽肺結核SMR預測值區(qū)域分布結果見圖5和圖6:兩種模型預測值與SMR值(圖1)分布基本一致,均呈現(xiàn)出西南部地區(qū)SMR較高,北部、東部地區(qū)的SMR相對較低的趨勢;SVR與Lasso回歸建模殘差分布圖顯示:兩種模型殘差較大的區(qū)域分布相似,多數(shù)分布在洛浦縣、阿瓦提縣、溫宿縣、尉犁縣、托里縣、沙灣縣、獨山子區(qū),均為SMR高的區(qū)域,但SVR模型的殘差值整體上略小于Lasso回歸模型,提示SVR建模效果略優(yōu)于Lasso建模。3 討論
【參考文獻】:
期刊論文
[1]分位數(shù)回歸模型在新疆涂陽肺結核報告率生態(tài)學影響因素的應用分析[J]. 張偉文,賀湘焱,李奇鳳,木哈達斯·吐爾遜依明,曹明芹. 現(xiàn)代預防醫(yī)學. 2019(03)
[2]空間截面回歸模型在肺結核病社會影響因素生態(tài)學分析中的應用[J]. 饒華祥,徐莉立,蔡芝鋒,李永紅,仇麗霞. 中國衛(wèi)生統(tǒng)計. 2018(05)
[3]基于GIS的青海省結核病時空分布特征研究[J]. 馬永成,王兆芬,李斌,馬斌忠,馬成強,申秀麗,張媛媛,汪海靜,蔣明霞,王衛(wèi)軍. 中華疾病控制雜志. 2018(04)
[4]基于張量的正則化多線性回歸算法及其應用[J]. 路子祥,黃嘉爽,屠黎陽,徐西嘉,張道強. 計算機科學與探索. 2018(07)
[5]支持向量機在傳染病發(fā)病率預測中的應用[J]. 解合川,任欽,曾海燕,張興裕,李曉松. 現(xiàn)代預防醫(yī)學. 2013(22)
本文編號:3143368
本文鏈接:http://sikaile.net/yixuelunwen/chuanranbingxuelunwen/3143368.html
最近更新
教材專著