Logistic回歸模型中缺失數(shù)據(jù)的處理
發(fā)布時(shí)間:2017-10-02 20:14
本文關(guān)鍵詞:Logistic回歸模型中缺失數(shù)據(jù)的處理
更多相關(guān)文章: 缺失數(shù)據(jù) 均值插補(bǔ)法 回歸插補(bǔ)法 EM算法
【摘要】:數(shù)據(jù)缺失的問(wèn)題在現(xiàn)在的社會(huì)調(diào)查和實(shí)驗(yàn)研究領(lǐng)域非常常見(jiàn)。缺失數(shù)據(jù)也被稱作不完全數(shù)據(jù),會(huì)給統(tǒng)計(jì)分析帶來(lái)復(fù)雜性,造成統(tǒng)計(jì)偏差,影響調(diào)查結(jié)果。傳統(tǒng)的數(shù)據(jù)缺失處理方法具有局限性,處理技術(shù)的不斷發(fā)展使得應(yīng)用更先進(jìn)方法成為了可能。本文是針對(duì)缺失數(shù)據(jù)的填補(bǔ)方法,通過(guò)參數(shù)估計(jì)的相對(duì)誤差大小和模型擬合效果來(lái)比較三種較為常見(jiàn)的缺失數(shù)據(jù)的處理方法。文章采用的案例是Logistic回歸模型,通過(guò)模擬缺失率為5%,10%,15%,20%,30%,40%,50%的七種隨機(jī)缺失情況,來(lái)比較EM算法、回歸插補(bǔ)法和均值插補(bǔ)法三種處理方法。
【關(guān)鍵詞】:缺失數(shù)據(jù) 均值插補(bǔ)法 回歸插補(bǔ)法 EM算法
【學(xué)位授予單位】:南京大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:C81
【目錄】:
- 摘要5-6
- Abstract6-7
- 第一章 引言7-11
- 1.1 選題背景及研究意義7
- 1.2 國(guó)內(nèi)外研究概況7-9
- 1.2.1 國(guó)外研究概況7-9
- 1.2.2 國(guó)內(nèi)研究概況9
- 1.3 本文的主要內(nèi)容和創(chuàng)新9-11
- 1.3.1 本文的主要內(nèi)容9-10
- 1.3.2 本文的主要?jiǎng)?chuàng)新10-11
- 第二章 缺失數(shù)據(jù)的介紹及處理方法11-22
- 2.1 缺失數(shù)據(jù)的定義11
- 2.2 缺失數(shù)據(jù)產(chǎn)生的原因11-12
- 2.3 缺失數(shù)據(jù)的缺失機(jī)制12-13
- 2.3.1 完全隨機(jī)缺失(MCAR)12
- 2.3.2 隨機(jī)缺失(MAR)12
- 2.3.3 非隨機(jī)缺失(NMAR)12-13
- 2.4 數(shù)據(jù)缺失模式13-15
- 2.5 缺失數(shù)據(jù)處理方法總述15-16
- 2.6 常用統(tǒng)計(jì)方法16-22
- 2.6.1 均值插補(bǔ)法16-17
- 2.6.2 回歸插補(bǔ)法17-18
- 2.6.3 EM算法(期望最大化法)18-20
- 2.6.4 多重插補(bǔ)法20-22
- 第三章 Logistic模型極大似然估計(jì)的EM算法22-25
- 3.1 Logistic回歸模型定義及其性質(zhì)22
- 3.2 Logistic模型的極大似然估計(jì)22-24
- 3.3 不完全數(shù)據(jù)下的Logistic模型24
- 3.4 Logistic模型的EM算法實(shí)現(xiàn)24-25
- 第四章 缺失數(shù)據(jù)不同插補(bǔ)法的實(shí)證分析25-31
- 4.1 樣本選取25-26
- 4.2 完整數(shù)據(jù)集的Logistic回歸26-27
- 4.3 不同缺失率數(shù)據(jù)集的分析27-31
- 4.3.1 缺失率為5%的數(shù)據(jù)集的分析27
- 4.3.2 缺失率為10%的數(shù)據(jù)集的分析27-28
- 4.3.3 缺失率為15%的數(shù)據(jù)集的分析28
- 4.3.4 缺失率為20%的數(shù)據(jù)集的分析28
- 4.3.5 缺失率為30%的數(shù)據(jù)集的分析28-29
- 4.3.6 缺失率為40%的數(shù)據(jù)集的分析29
- 4.3.7 缺失率為50%的數(shù)據(jù)集的分析29-30
- 4.3.8 不同缺失率下方法比較的總結(jié)30-31
- 第五章 全文總結(jié)與展望31-32
- 參考文獻(xiàn)32-33
- 致謝33-34
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 金勇進(jìn);缺失數(shù)據(jù)的加權(quán)調(diào)整(系列之Ⅳ)[J];數(shù)理統(tǒng)計(jì)與管理;2001年05期
2 楊金英;崔朝杰;;圖模型方法用于二值變量相關(guān)性分析中缺失數(shù)據(jù)的估計(jì)[J];中國(guó)衛(wèi)生統(tǒng)計(jì);2012年05期
3 金勇進(jìn);缺失數(shù)據(jù)的偏差校正(系列三)[J];數(shù)理統(tǒng)計(jì)與管理;2001年04期
4 張朝雄;沈e,
本文編號(hào):961584
本文鏈接:http://sikaile.net/shekelunwen/shgj/961584.html
最近更新
教材專著