數(shù)據(jù)缺失及相關(guān)因素對逐步回歸變量篩選的影響
發(fā)布時(shí)間:2021-07-13 01:58
目的:主要研究數(shù)據(jù)缺失對逐步回歸變量篩選的影響;探討不同缺失比例、不同缺失機(jī)制和缺失類型對逐步回歸篩選結(jié)果的影響。附帶驗(yàn)證待選變量之間的相關(guān)系數(shù)、待選變量個(gè)數(shù)、所設(shè)定的模型擬合程度、樣本量(或者EPV)以及逐步回歸變量進(jìn)入和移除的顯著性水平對逐步回歸變量篩選的作用。方法:通過SAS軟件進(jìn)行蒙特卡洛數(shù)據(jù)模擬。設(shè)置真實(shí)模型(分為一般線性模型和probit模型),產(chǎn)生六種不同的數(shù)據(jù)集,包括:完整數(shù)據(jù)、完全隨機(jī)缺失數(shù)據(jù)、線性隨機(jī)缺失數(shù)據(jù)、曲線隨機(jī)缺失數(shù)據(jù)、線性非隨機(jī)缺失數(shù)據(jù)以及曲線非隨機(jī)缺失數(shù)據(jù)。隨后,在所產(chǎn)生的數(shù)據(jù)上進(jìn)行逐步回歸篩選,并記錄篩選結(jié)果用于評估各個(gè)因素的作用。在線性的真實(shí)模型的情況下,我們設(shè)定了五個(gè)評價(jià)指標(biāo)考察不同因素的影響,分別為:1)進(jìn)入模型的真實(shí)變量平均個(gè)數(shù);2)進(jìn)入模型的噪音變量平均個(gè)數(shù);3)綜合指標(biāo)G,衡量真實(shí)變量和噪音變量進(jìn)入模型的綜合情況,G=sensitivity*specificity,此處sensitivity=(被選入模型的真實(shí)變量個(gè)數(shù)/備選的真實(shí)變量的個(gè)數(shù)),specifcity=(1-被選入模型的噪音變量個(gè)數(shù)/備選噪音變量個(gè)數(shù));4)篩選得到真實(shí)模型的比...
【文章來源】:復(fù)旦大學(xué)上海市 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:83 頁
【學(xué)位級別】:碩士
【文章目錄】:
中文摘要
ABSTRACT
第一章 前言
第一節(jié) 案例
第二節(jié) 研究背景
1. 關(guān)于數(shù)據(jù)缺失
2. 關(guān)于變量篩選
3. 缺失情況下的變量篩選方法
第三節(jié) 研究出發(fā)點(diǎn)
第二章 原理和方法
第一節(jié) 關(guān)于逐步回歸
第二節(jié) 關(guān)于模擬研究
第三章 模擬研究
第一節(jié) 模擬研究一:因變量為連續(xù)型結(jié)局變量的線性模型
1. 模型及參數(shù)設(shè)定
2. 完整數(shù)據(jù)的產(chǎn)生方法
3. 缺失的產(chǎn)生
4. 評價(jià)指標(biāo)
5. 變量篩選
6. 模擬結(jié)果
第二節(jié) 模擬研究二:因變量為二分類結(jié)局變量的PROBIT模型
1. 參數(shù)的設(shè)定
2. 模型設(shè)置以及完整數(shù)據(jù)的產(chǎn)生方法
3. 缺失數(shù)據(jù)產(chǎn)生方法
4. 評價(jià)指標(biāo)
5. 變量篩選
6. 模擬結(jié)果
第四章 總結(jié)與討論
第一節(jié) 與以往研究的比較
第二節(jié) 對實(shí)際研究的建議
第三節(jié) 本文的創(chuàng)新之處與局限性
參考文獻(xiàn)
附錄一:綜述
參考文獻(xiàn)
附錄二:碩士期間發(fā)表文章
致謝
本文編號:3281102
【文章來源】:復(fù)旦大學(xué)上海市 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:83 頁
【學(xué)位級別】:碩士
【文章目錄】:
中文摘要
ABSTRACT
第一章 前言
第一節(jié) 案例
第二節(jié) 研究背景
1. 關(guān)于數(shù)據(jù)缺失
2. 關(guān)于變量篩選
3. 缺失情況下的變量篩選方法
第三節(jié) 研究出發(fā)點(diǎn)
第二章 原理和方法
第一節(jié) 關(guān)于逐步回歸
第二節(jié) 關(guān)于模擬研究
第三章 模擬研究
第一節(jié) 模擬研究一:因變量為連續(xù)型結(jié)局變量的線性模型
1. 模型及參數(shù)設(shè)定
2. 完整數(shù)據(jù)的產(chǎn)生方法
3. 缺失的產(chǎn)生
4. 評價(jià)指標(biāo)
5. 變量篩選
6. 模擬結(jié)果
第二節(jié) 模擬研究二:因變量為二分類結(jié)局變量的PROBIT模型
1. 參數(shù)的設(shè)定
2. 模型設(shè)置以及完整數(shù)據(jù)的產(chǎn)生方法
3. 缺失數(shù)據(jù)產(chǎn)生方法
4. 評價(jià)指標(biāo)
5. 變量篩選
6. 模擬結(jié)果
第四章 總結(jié)與討論
第一節(jié) 與以往研究的比較
第二節(jié) 對實(shí)際研究的建議
第三節(jié) 本文的創(chuàng)新之處與局限性
參考文獻(xiàn)
附錄一:綜述
參考文獻(xiàn)
附錄二:碩士期間發(fā)表文章
致謝
本文編號:3281102
本文鏈接:http://sikaile.net/yixuelunwen/liuxingb/3281102.html
最近更新
教材專著