數(shù)據(jù)挖掘在新疆肺結(jié)核區(qū)域發(fā)病風(fēng)險(xiǎn)建模與預(yù)測中的應(yīng)用
發(fā)布時(shí)間:2021-04-17 11:25
目的采用數(shù)據(jù)挖掘技術(shù)與方法構(gòu)建生態(tài)學(xué)因素預(yù)測模型,探討其在新疆涂陽肺結(jié)核區(qū)域發(fā)病風(fēng)險(xiǎn)(SMR)中的應(yīng)用價(jià)值,為新疆結(jié)核病的精準(zhǔn)防控提供方法學(xué)參考。方法分別采用Lasso和RFE對生態(tài)學(xué)指標(biāo)進(jìn)行篩選,構(gòu)建Lasso回歸和SVR模型,對比與評價(jià)建模效果。結(jié)果新疆西南部地區(qū)涂陽肺結(jié)核SMR較高, Lasso和RFE特征選擇結(jié)果存在差異,SVR模型預(yù)測效果整體上優(yōu)于OLS和Lasso回歸模型,Lasso法結(jié)合SVR模型預(yù)測效果最優(yōu)。結(jié)論依據(jù)不同地區(qū)、不同生態(tài)學(xué)現(xiàn)狀SMR水平的差異,針對性地采取肺結(jié)核的預(yù)防與控制措施,對肺結(jié)核疫情的精準(zhǔn)防控具有重要的實(shí)踐意義。
【文章來源】:現(xiàn)代預(yù)防醫(yī)學(xué). 2020,47(04)北大核心
【文章頁數(shù)】:6 頁
【部分圖文】:
Lasso的特征序列圖
相比經(jīng)典線性回歸模型(OLS模型),采用不同特征選擇的SVR回歸與Lasso回歸建模效果評價(jià)見表2:對于SVR回歸建模,采用RFE與Lasso特征選擇,效果略有不同,采用Lasso特征選擇的RMSE值、MSE值略低,R2值略高,提示Lasso特征結(jié)果略好RFE;對于Lasso回歸建模,RFE與Lasso兩種特征選擇方法建模結(jié)果接近。相比OLS回歸模型與Lasso回歸模型,SVR模型的建模效果較優(yōu)。綜合分析,基于Lasso特征選擇SVR回歸建模的效果最優(yōu)。2.3.3 肺結(jié)核SMR的區(qū)域預(yù)測與殘差分析
基于Lasso特征選擇的SVR與Lasso回歸建模的新疆涂陽肺結(jié)核SMR預(yù)測值區(qū)域分布結(jié)果見圖5和圖6:兩種模型預(yù)測值與SMR值(圖1)分布基本一致,均呈現(xiàn)出西南部地區(qū)SMR較高,北部、東部地區(qū)的SMR相對較低的趨勢;SVR與Lasso回歸建模殘差分布圖顯示:兩種模型殘差較大的區(qū)域分布相似,多數(shù)分布在洛浦縣、阿瓦提縣、溫宿縣、尉犁縣、托里縣、沙灣縣、獨(dú)山子區(qū),均為SMR高的區(qū)域,但SVR模型的殘差值整體上略小于Lasso回歸模型,提示SVR建模效果略優(yōu)于Lasso建模。3 討論
【參考文獻(xiàn)】:
期刊論文
[1]分位數(shù)回歸模型在新疆涂陽肺結(jié)核報(bào)告率生態(tài)學(xué)影響因素的應(yīng)用分析[J]. 張偉文,賀湘焱,李奇鳳,木哈達(dá)斯·吐爾遜依明,曹明芹. 現(xiàn)代預(yù)防醫(yī)學(xué). 2019(03)
[2]空間截面回歸模型在肺結(jié)核病社會(huì)影響因素生態(tài)學(xué)分析中的應(yīng)用[J]. 饒華祥,徐莉立,蔡芝鋒,李永紅,仇麗霞. 中國衛(wèi)生統(tǒng)計(jì). 2018(05)
[3]基于GIS的青海省結(jié)核病時(shí)空分布特征研究[J]. 馬永成,王兆芬,李斌,馬斌忠,馬成強(qiáng),申秀麗,張媛媛,汪海靜,蔣明霞,王衛(wèi)軍. 中華疾病控制雜志. 2018(04)
[4]基于張量的正則化多線性回歸算法及其應(yīng)用[J]. 路子祥,黃嘉爽,屠黎陽,徐西嘉,張道強(qiáng). 計(jì)算機(jī)科學(xué)與探索. 2018(07)
[5]支持向量機(jī)在傳染病發(fā)病率預(yù)測中的應(yīng)用[J]. 解合川,任欽,曾海燕,張興裕,李曉松. 現(xiàn)代預(yù)防醫(yī)學(xué). 2013(22)
本文編號:3143368
【文章來源】:現(xiàn)代預(yù)防醫(yī)學(xué). 2020,47(04)北大核心
【文章頁數(shù)】:6 頁
【部分圖文】:
Lasso的特征序列圖
相比經(jīng)典線性回歸模型(OLS模型),采用不同特征選擇的SVR回歸與Lasso回歸建模效果評價(jià)見表2:對于SVR回歸建模,采用RFE與Lasso特征選擇,效果略有不同,采用Lasso特征選擇的RMSE值、MSE值略低,R2值略高,提示Lasso特征結(jié)果略好RFE;對于Lasso回歸建模,RFE與Lasso兩種特征選擇方法建模結(jié)果接近。相比OLS回歸模型與Lasso回歸模型,SVR模型的建模效果較優(yōu)。綜合分析,基于Lasso特征選擇SVR回歸建模的效果最優(yōu)。2.3.3 肺結(jié)核SMR的區(qū)域預(yù)測與殘差分析
基于Lasso特征選擇的SVR與Lasso回歸建模的新疆涂陽肺結(jié)核SMR預(yù)測值區(qū)域分布結(jié)果見圖5和圖6:兩種模型預(yù)測值與SMR值(圖1)分布基本一致,均呈現(xiàn)出西南部地區(qū)SMR較高,北部、東部地區(qū)的SMR相對較低的趨勢;SVR與Lasso回歸建模殘差分布圖顯示:兩種模型殘差較大的區(qū)域分布相似,多數(shù)分布在洛浦縣、阿瓦提縣、溫宿縣、尉犁縣、托里縣、沙灣縣、獨(dú)山子區(qū),均為SMR高的區(qū)域,但SVR模型的殘差值整體上略小于Lasso回歸模型,提示SVR建模效果略優(yōu)于Lasso建模。3 討論
【參考文獻(xiàn)】:
期刊論文
[1]分位數(shù)回歸模型在新疆涂陽肺結(jié)核報(bào)告率生態(tài)學(xué)影響因素的應(yīng)用分析[J]. 張偉文,賀湘焱,李奇鳳,木哈達(dá)斯·吐爾遜依明,曹明芹. 現(xiàn)代預(yù)防醫(yī)學(xué). 2019(03)
[2]空間截面回歸模型在肺結(jié)核病社會(huì)影響因素生態(tài)學(xué)分析中的應(yīng)用[J]. 饒華祥,徐莉立,蔡芝鋒,李永紅,仇麗霞. 中國衛(wèi)生統(tǒng)計(jì). 2018(05)
[3]基于GIS的青海省結(jié)核病時(shí)空分布特征研究[J]. 馬永成,王兆芬,李斌,馬斌忠,馬成強(qiáng),申秀麗,張媛媛,汪海靜,蔣明霞,王衛(wèi)軍. 中華疾病控制雜志. 2018(04)
[4]基于張量的正則化多線性回歸算法及其應(yīng)用[J]. 路子祥,黃嘉爽,屠黎陽,徐西嘉,張道強(qiáng). 計(jì)算機(jī)科學(xué)與探索. 2018(07)
[5]支持向量機(jī)在傳染病發(fā)病率預(yù)測中的應(yīng)用[J]. 解合川,任欽,曾海燕,張興裕,李曉松. 現(xiàn)代預(yù)防醫(yī)學(xué). 2013(22)
本文編號:3143368
本文鏈接:http://sikaile.net/yixuelunwen/chuanranbingxuelunwen/3143368.html
最近更新
教材專著