Lasso-Logistic與Group Lasso-Logistic模型在出生缺陷研究中的應(yīng)用
本文關(guān)鍵詞:Lasso-Logistic與Group Lasso-Logistic模型在出生缺陷研究中的應(yīng)用,,由筆耕文化傳播整理發(fā)布。
【摘要】:目的:出生缺陷成因復(fù)雜、病因不明確、影響因素多,并且各影響因素之間關(guān)系復(fù)雜且存在相關(guān)性,而傳統(tǒng)統(tǒng)計(jì)方法因?yàn)樽兞窟^(guò)多而導(dǎo)致估計(jì)偏差,只能達(dá)到變量選擇的部分目標(biāo)。本文將采用基于Lasso、Group Lasso的Logistic回歸變量選擇方法對(duì)出生缺陷影響因素進(jìn)行分析,挖掘影響出生缺陷兒的關(guān)鍵因素,建立出生缺陷患病概率預(yù)測(cè)模型,為出生缺陷的預(yù)防和控制提供更好的指導(dǎo)。方法:本文首先介紹Lasso、Group Lasso基本原理。其中,Group Lasso是對(duì)Lasso方法的延伸,在對(duì)具有多分類的因素進(jìn)行變量選擇時(shí)是以整組為單位進(jìn)行選擇,而不是選擇其中的某個(gè)分類。Group Lasso進(jìn)行整組變量選擇可以更好地解釋和分析所研究的因素。本文以山西省人口計(jì)生委科學(xué)研究所2006-2008年對(duì)山西省6個(gè)縣(市)所有出生兒及其家庭情況問(wèn)卷調(diào)查的數(shù)據(jù)進(jìn)行分析,該調(diào)查共收回有效問(wèn)卷35058份,其中493例為出生缺陷患兒。整理出38個(gè)指標(biāo),以出生缺陷發(fā)生與否為因變量,其他為自變量。對(duì)于具有多個(gè)分類或水平的指標(biāo)設(shè)置虛擬變量,共有37組50個(gè)變量。采用基于Lasso、Group Lasso的Logistic回歸模型方法構(gòu)建出生缺陷患兒發(fā)生概率預(yù)測(cè)模型,評(píng)價(jià)這些模型的預(yù)測(cè)性能。結(jié)果:Lasso和Group Lasso具有較好的變量選擇效果。母親的生育年齡、居住地、家庭人均收入、近親結(jié)婚、有親屬缺陷兒、母親孕早期貧血、有自然流產(chǎn)史、親屬缺陷兒、孕早期感冒、發(fā)熱、服用感冒藥、抗生素、經(jīng)常與寵物接觸、居住周邊有污染源、家人經(jīng)常吸煙、經(jīng)常飲酒等因素對(duì)出生缺陷有重要影響;孕早期常吃肉類、蔬菜、補(bǔ)充葉酸制劑可有效降低出生缺陷的發(fā)生。以TPR、TNR、G-mean、AUC作為評(píng)價(jià)指標(biāo),針對(duì)不平衡分布的出生缺陷數(shù)據(jù),并基于Logistic建立預(yù)測(cè)模型,對(duì)模型預(yù)測(cè)性能進(jìn)行比較,結(jié)果顯示Lasso、Group Lasso的測(cè)試集的預(yù)測(cè)效果都高于全模型logistic和逐步回歸,具有較好的外推能力。結(jié)論:Lasso-Logistic、Group Lasso-Logistic回歸模型可以選擇出可解釋的出生缺陷重要變量,并可以進(jìn)行有效預(yù)測(cè)。Lasso可以選擇比Group Lasso更簡(jiǎn)潔的模型,而Group Lasso-Logistic成組地選擇變量可以更好地解釋和分析所研究的因素,具有更強(qiáng)的實(shí)際應(yīng)用意義。
【關(guān)鍵詞】:出生缺陷 變量選擇 Lasso Group Lasso Logistic回歸模型
【學(xué)位授予單位】:山西醫(yī)科大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:R174
【目錄】:
- 中文摘要5-7
- 英文摘要7-9
- 前言9-13
- 1 模型基本原理與方法13-22
- 1.1 Lasso方法13-17
- 1.2 Group Lasso方法17-20
- 1.3 調(diào)整參數(shù)λ 的選取20
- 1.4 模型評(píng)價(jià)20-22
- 2 實(shí)例分析22-32
- 2.1 研究資料22-25
- 2.2 技術(shù)路線圖25-26
- 2.3 模型分析結(jié)果26-32
- 3 小結(jié)32-33
- 4 討論33-35
- 4.1 本研究的特點(diǎn)33-34
- 4.2 本研究的不足及下一步研究計(jì)劃34-35
- 參考文獻(xiàn)35-39
- 綜述39-46
- 參考文獻(xiàn)43-46
- 致謝46-47
- 在學(xué)期間承擔(dān)/參與的科研課題與研究成果47-48
- 個(gè)人簡(jiǎn)介48
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 廖水珍,姜佩萍;韶關(guān)市出生缺陷監(jiān)測(cè)結(jié)果分析[J];中國(guó)初級(jí)衛(wèi)生保健;2000年02期
2 段宗枝;銅陵市1997~2000年出生缺陷分析[J];安徽預(yù)防醫(yī)學(xué)雜志;2001年06期
3 唐貴忠;我國(guó)人口出生缺陷狀況及干預(yù)措施的分析[J];中國(guó)婦幼保健;2001年07期
4 叢玉英,王茜云,王蔭紅;1998~2000年淄博市出生缺陷相關(guān)因素分析[J];中國(guó)兒童保健雜志;2002年04期
5 龔麗艷,李向東;2001年湖北省出生缺陷資料分析[J];湖北預(yù)防醫(yī)學(xué)雜志;2002年05期
6 朱山林,毛金觀,陳華浙;嘉興市1996~2000年出生缺陷資料分析[J];預(yù)防醫(yī)學(xué)文獻(xiàn)信息;2002年05期
7 賈士美,房興仁;淺談出生缺陷與出生缺陷干預(yù)工程[J];中國(guó)農(nóng)村衛(wèi)生事業(yè)管理;2002年05期
8 崔麗芳;棗莊地區(qū)出生缺陷相關(guān)因素的探討及干預(yù)措施[J];中國(guó)優(yōu)生與遺傳雜志;2002年04期
9 趙慶國(guó),譚曉嫦,田豐蓮,陳勇鋒,姜紅;廣東省出生缺陷變化趨勢(shì)及防治策略選擇[J];中國(guó)初級(jí)衛(wèi)生保健;2002年09期
10 葉榮偉;國(guó)際出生缺陷情報(bào)交換所第30屆年會(huì)召開[J];中國(guó)生育健康雜志;2003年06期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條
1 周麗瓊;賀曉艷;岳佳;楊美英;文玉婷;;通海縣1996~2006年出生缺陷調(diào)查研究[A];玉溪市第十五屆兒科年會(huì)論文集[C];2009年
2 ;山西省出生缺陷現(xiàn)狀、成因及干預(yù)對(duì)策研究(分報(bào)告之一)[A];2009—2010中國(guó)生產(chǎn)力發(fā)展研究報(bào)告[C];2010年
3 謝立春;鐘于玲;劉青玲;馮琪;于紅;夏霽瓊;;深圳市0-5歲兒童出生缺陷調(diào)查分析[A];中國(guó)優(yōu)生科學(xué)協(xié)會(huì)2004年優(yōu)生科學(xué)學(xué)術(shù)交流大會(huì)論文集[C];2004年
4 劉素蘭;李文孝;;降低出生缺陷的干預(yù)措施與效果分析(摘要)[A];中國(guó)優(yōu)生科學(xué)協(xié)會(huì)2004年優(yōu)生科學(xué)學(xué)術(shù)交流大會(huì)論文集[C];2004年
5 趙心亮;魏慶;張蕊;齊巖;宮建國(guó);鐘南;;北京市海淀區(qū)05-07年出生缺陷的調(diào)查[A];中國(guó)優(yōu)生優(yōu)育協(xié)會(huì)第四屆全國(guó)學(xué)術(shù)論文報(bào)告會(huì)暨基因科學(xué)高峰論壇論文專輯[C];2008年
6 胡崇高;;浙江省預(yù)防出生缺陷及殘疾[A];2011中國(guó)婦產(chǎn)科學(xué)術(shù)會(huì)議暨浙江省計(jì)劃生育與生殖醫(yī)學(xué)學(xué)術(shù)年會(huì)暨生殖健康講習(xí)班論文匯編[C];2011年
7 祝軻;任榕娜;;出生缺陷476例臨床分析[A];中華醫(yī)學(xué)會(huì)第十七次全國(guó)兒科學(xué)術(shù)大會(huì)論文匯編(下冊(cè))[C];2012年
8 于俊榮;李斌斌;宋淑秀;孟慶蓮;;河北省0~6歲兒童出生缺陷風(fēng)險(xiǎn)因素調(diào)查與分析[A];中華醫(yī)學(xué)會(huì)第八次全國(guó)計(jì)劃生育學(xué)術(shù)會(huì)議論文匯編[C];2012年
9 鄒鳴飛;孫躍宏;屈煜;錢瑩瑩;蔣燕萍;舒立波;;出生缺陷危險(xiǎn)因素與對(duì)策研究[A];浙江省第二十屆基層衛(wèi)生改革與發(fā)展學(xué)術(shù)會(huì)議大會(huì)論文集[C];2012年
10 邱麗倩;;浙江省預(yù)防出生缺陷策略與前景[A];2013浙江省醫(yī)學(xué)遺傳學(xué)學(xué)術(shù)年會(huì)論文匯編[C];2013年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前10條
1 ;減少出生缺陷 提高人口素質(zhì)[N];家庭醫(yī)生報(bào);2003年
2 鄭曉瑛;出生缺陷急待干預(yù)[N];人民日?qǐng)?bào);2003年
3 高莎;出生缺陷直接影響我國(guó)綜合國(guó)力提升[N];工人日?qǐng)?bào);2007年
4 記者 譚克揚(yáng)邋通訊員 劉后紅 康平 姚家琦;控制出生缺陷提高出生人口素質(zhì)[N];湖南日?qǐng)?bào);2007年
5 魏萍;預(yù)防出生缺陷重點(diǎn)在孕前[N];健康報(bào);2006年
6 魏萍;有出生缺陷要在第一時(shí)間上報(bào)[N];健康報(bào);2007年
7 記者 盧素仙;北京開展預(yù)防出生缺陷宣傳活動(dòng)[N];科技日?qǐng)?bào);2007年
8 盟婦兒工委辦;我盟開展健康寶寶、幸福家庭——預(yù)防出生缺陷系列宣傳活動(dòng)[N];錫林郭勒日?qǐng)?bào);2007年
9 李如一;“預(yù)防出生缺陷”首府開講座[N];伊犁日?qǐng)?bào)(漢);2007年
10 劉翔霄;山西調(diào)查:出生缺陷高發(fā)疑與污染有關(guān)[N];新華每日電訊;2007年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前6條
1 梁菲;酒精導(dǎo)致的精子異常與子代出生缺陷的關(guān)系及機(jī)制研究[D];復(fù)旦大學(xué);2013年
2 劉建瓊;湖北省主要出生缺陷的流行現(xiàn)狀及影響因素研究[D];華中科技大學(xué);2011年
3 張紹強(qiáng);深圳市龍崗區(qū)圍生兒出生缺陷流行狀況及影響因素研究[D];華中科技大學(xué);2010年
4 李昕;基于色譜質(zhì)譜聯(lián)用技術(shù)的出生缺陷代謝組學(xué)和金屬組學(xué)的研究[D];上海交通大學(xué);2010年
5 陳英耀;我國(guó)主要出生缺陷的疾病負(fù)擔(dān)和預(yù)防措施的經(jīng)濟(jì)學(xué)評(píng)價(jià)研究[D];復(fù)旦大學(xué);2006年
6 代禮;出生缺陷家系收集及并指(趾)多指(趾)畸形的HOXD13基因突變分析[D];四川大學(xué);2004年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 羋靜;蚌埠地區(qū)0~5歲兒童出生缺陷的流行病學(xué)研究[D];安徽醫(yī)科大學(xué);2008年
2 繆凡;海島出生缺陷患病及影響因素研究[D];浙江大學(xué);2007年
3 陳鳴鳴;新生兒出生缺陷影響因素及近5年變化趨勢(shì)分析[D];吉林大學(xué);2007年
4 郭瑤琴;基于彈性網(wǎng)絡(luò)的出生缺陷多維地理環(huán)境因子探索分析[D];中國(guó)地質(zhì)大學(xué);2008年
5 修曉燕;福建省出生缺陷特征與變化趨勢(shì)研究[D];福建醫(yī)科大學(xué);2008年
6 祝軻;出生缺陷的臨床研究[D];福建醫(yī)科大學(xué);2012年
7 張海濤;吉林省2003~2008年出生缺陷流行狀況及影響因素研究[D];吉林大學(xué);2013年
8 劉光河;山東省2005~2012年出生缺陷的流行病學(xué)調(diào)查研究[D];泰山醫(yī)學(xué)院;2014年
9 陳靜;滄州地區(qū)新生兒先天性心臟病相關(guān)危險(xiǎn)因素分析[D];河北醫(yī)科大學(xué);2015年
10 尹新娟;鄭州市五種主要出生缺陷影響因素分析及預(yù)測(cè)模型研究[D];鄭州大學(xué);2015年
本文關(guān)鍵詞:Lasso-Logistic與Group Lasso-Logistic模型在出生缺陷研究中的應(yīng)用,由筆耕文化傳播整理發(fā)布。
本文編號(hào):353698
本文鏈接:http://sikaile.net/yixuelunwen/yufangyixuelunwen/353698.html