基于EM算法的缺失數(shù)據(jù)的統(tǒng)計(jì)分析及應(yīng)用
發(fā)布時(shí)間:2017-06-12 12:04
本文關(guān)鍵詞:基于EM算法的缺失數(shù)據(jù)的統(tǒng)計(jì)分析及應(yīng)用,,由筆耕文化傳播整理發(fā)布。
【摘要】:EM是一種專(zhuān)門(mén)用于求解參數(shù)極大似然估計(jì)的迭代算法。特別地,它為有缺失數(shù)據(jù)條件下的參數(shù)估計(jì)提供了一個(gè)標(biāo)準(zhǔn)的理論框架,這里的缺失有以下兩種情況:一種是我們所研究的問(wèn)題中確實(shí)存在數(shù)據(jù)的缺失;另一種是原始數(shù)據(jù)是完全的,但由于似然函數(shù)的求解十分困難,而額外添加一些數(shù)據(jù)就能將原來(lái)十分復(fù)雜的過(guò)程轉(zhuǎn)化成一系列簡(jiǎn)單的似然函數(shù)優(yōu)化問(wèn)題,于是原始數(shù)據(jù)自然就成為了不完全數(shù)據(jù)。由于EM算法具有良好的收斂性和每次迭代都能使似然函數(shù)值單調(diào)不減的優(yōu)良性質(zhì),所以許多與缺失數(shù)據(jù)有關(guān)的問(wèn)題中都會(huì)結(jié)合EM算法來(lái)分析,也難怪有學(xué)者稱(chēng)EM算法和缺失數(shù)據(jù)如同一對(duì)孿生姐妹一般總是如影隨形。本文主要對(duì)EM在含缺失數(shù)據(jù)的統(tǒng)計(jì)分析及應(yīng)用中作了以下幾方面的研究:(1)引言。主要介紹了本文研究的背景、意義以及國(guó)內(nèi)外研究現(xiàn)狀。(2)理論基礎(chǔ)的構(gòu)建部分。首先介紹了缺失數(shù)據(jù)的產(chǎn)生的原因、機(jī)制和模式;其次對(duì)極大似然估計(jì)的理論作了簡(jiǎn)要概述;最后介紹了EM算法的相關(guān)理論,在這一部分中詳述了對(duì)EM算法的幾種解釋,從而加深了對(duì)該算法的理解。(3)EM算法在含缺失數(shù)據(jù)的調(diào)查表中的應(yīng)用。這是EM算法在實(shí)際生活中的一類(lèi)非常重要的應(yīng)用,在這部分中我們首先將該算法應(yīng)用在常見(jiàn)的調(diào)查表中數(shù)據(jù)有缺失的情形,然后以重慶市居民的交通起止點(diǎn)調(diào)查表為例,用EM算法來(lái)補(bǔ)全表中的數(shù)據(jù)并對(duì)其中的參數(shù)進(jìn)行估計(jì),從而很好的展現(xiàn)了該算法的實(shí)用價(jià)值。(4)EM算法在混合模型中的應(yīng)用。在這一部分中我們主要研究了EM算法在二階高斯混合模型和多層混合模型中的應(yīng)用,其中在研究EM算法在二階高斯混合模型中的應(yīng)用時(shí),我們將觀測(cè)數(shù)據(jù)劃分成(X,Y)和整體Y的形式,分別在這兩種形式下給出模型中參數(shù)的估計(jì),并用Matlab軟件進(jìn)行了隨機(jī)數(shù)值模擬;在研究多層混合模型時(shí),我們以二項(xiàng)-泊松多層混合模型為例給出了EM算法在該種模型下的參數(shù)估計(jì),并用具體的實(shí)例來(lái)驗(yàn)證了EM算法在處理這類(lèi)復(fù)雜的混合模型參數(shù)估計(jì)方面的優(yōu)勢(shì),為EM算法在其它復(fù)雜混合模型中的應(yīng)用提供了很好的借鑒。
【關(guān)鍵詞】:EM算法 極大似然估計(jì) 缺失數(shù)據(jù) 混合模型 調(diào)查表
【學(xué)位授予單位】:重慶工商大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類(lèi)號(hào)】:C81
【目錄】:
- 摘要5-6
- ABSTRACT6-8
- 第1章 引言8-14
- 1.1 研究背景和意義8-9
- 1.1.1 研究背景8
- 1.1.2 研究意義8-9
- 1.2 國(guó)內(nèi)外的研究現(xiàn)狀9-12
- 1.2.1 國(guó)外研究現(xiàn)狀9-10
- 1.2.2 國(guó)內(nèi)研究現(xiàn)狀10-12
- 1.3 研究設(shè)計(jì)12-14
- 1.3.1 本文的工作12
- 1.3.2 論文的可能創(chuàng)新之處12-13
- 1.3.3 研究框架13-14
- 第2章 缺失數(shù)據(jù)產(chǎn)生的原因及分類(lèi)14-19
- 2.1 缺失數(shù)據(jù)的定義及其產(chǎn)生原因14-15
- 2.1.1 缺失數(shù)據(jù)的定義14
- 2.1.2 缺失數(shù)據(jù)產(chǎn)生的原因14-15
- 2.2 缺失數(shù)據(jù)的分類(lèi)15-17
- 2.2.1 按照缺失數(shù)據(jù)的機(jī)制分類(lèi)15-16
- 2.2.2 按照缺失數(shù)據(jù)的模式分類(lèi)16-17
- 2.3 缺失數(shù)據(jù)的處理方法17-19
- 第3章 EM算法的相關(guān)理論19-27
- 3.1 EM算法19-23
- 3.1.1 極大似然估計(jì)19
- 3.1.2 完備數(shù)據(jù)集19-20
- 3.1.3 EM算法20-23
- 3.2 EM算法的幾種解釋23-24
- 3.2.1 直觀解釋23
- 3.2.2 下界極大化23-24
- 3.3 EM算法的性質(zhì)24-27
- 第4章 EM算法在調(diào)查表中的應(yīng)用27-32
- 4.1 一個(gè)變量缺失的情形27-28
- 4.2 兩個(gè)變量缺失的情形28-29
- 4.3 實(shí)例分析29-32
- 第5章 EM算法在二階高斯混合模型中的應(yīng)用32-60
- 5.1 EM算法在高斯混合模型中的應(yīng)用32-37
- 5.1.1 高斯混合模型簡(jiǎn)介32-34
- 5.1.2 EM算法高斯混合模型中的參數(shù)估計(jì)34-37
- 5.2 EM算法在數(shù)據(jù)分開(kāi)形式下的二階高斯混合模型中的應(yīng)用37-54
- 5.2.1 總體分布的符號(hào)說(shuō)明37-38
- 5.2.2 分開(kāi)形式下完全數(shù)據(jù)的二階高斯混合模型的參數(shù)估計(jì)38-40
- 5.2.3 分開(kāi)形式下缺失數(shù)據(jù)的二階高斯混合模型的參數(shù)估計(jì)40-53
- 5.2.4 數(shù)值模擬53-54
- 5.3 EM算法在一般形式下的二階高斯混合模型中的應(yīng)用54-60
- 5.3.1 一般形式下完全數(shù)據(jù)的二階高斯混合模型的參數(shù)估計(jì)55-57
- 5.3.2 數(shù)值模擬57-60
- 第6章 EM算法在二項(xiàng)-泊松多層混合模型中的應(yīng)用60-66
- 6.1 EM算法在二項(xiàng)-泊松多層混合模型中的參數(shù)估計(jì)60-63
- 6.2 算法簡(jiǎn)要步驟63
- 6.3 實(shí)例分析63-66
- 第7章 總結(jié)和展望66-68
- 7.1 總結(jié)66-67
- 7.2 展望67-68
- 參考文獻(xiàn)68-72
- 碩士期間發(fā)表的學(xué)術(shù)論文72-73
- 致謝73
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前3條
1 楊明,畢涌,雷英杰;混合Weibull分布參數(shù)估計(jì)的EM算法[J];華北工學(xué)院學(xué)報(bào);2003年05期
2 鐘紹軍;童恒慶;;凸約束廣義線性模型參數(shù)MLE估計(jì)的收斂性研究[J];統(tǒng)計(jì)與決策;2012年04期
3 翟繼友;張鵬;;高斯混合模型參數(shù)估值算法的優(yōu)化[J];計(jì)算機(jī)技術(shù)與發(fā)展;2011年11期
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前2條
1 連軍艷;EM算法及其改進(jìn)在混合模型參數(shù)估計(jì)中的應(yīng)用研究[D];長(zhǎng)安大學(xué);2006年
2 陳文強(qiáng);混合泊松分布模型的參數(shù)估計(jì)問(wèn)題[D];西北大學(xué);2009年
本文關(guān)鍵詞:基于EM算法的缺失數(shù)據(jù)的統(tǒng)計(jì)分析及應(yīng)用,由筆耕文化傳播整理發(fā)布。
本文編號(hào):443977
本文鏈接:http://sikaile.net/shekelunwen/shgj/443977.html
最近更新
教材專(zhuān)著