基于EM算法的缺失數(shù)據(jù)的統(tǒng)計分析及應(yīng)用
發(fā)布時間:2017-06-12 12:04
本文關(guān)鍵詞:基于EM算法的缺失數(shù)據(jù)的統(tǒng)計分析及應(yīng)用,,由筆耕文化傳播整理發(fā)布。
【摘要】:EM是一種專門用于求解參數(shù)極大似然估計的迭代算法。特別地,它為有缺失數(shù)據(jù)條件下的參數(shù)估計提供了一個標準的理論框架,這里的缺失有以下兩種情況:一種是我們所研究的問題中確實存在數(shù)據(jù)的缺失;另一種是原始數(shù)據(jù)是完全的,但由于似然函數(shù)的求解十分困難,而額外添加一些數(shù)據(jù)就能將原來十分復(fù)雜的過程轉(zhuǎn)化成一系列簡單的似然函數(shù)優(yōu)化問題,于是原始數(shù)據(jù)自然就成為了不完全數(shù)據(jù)。由于EM算法具有良好的收斂性和每次迭代都能使似然函數(shù)值單調(diào)不減的優(yōu)良性質(zhì),所以許多與缺失數(shù)據(jù)有關(guān)的問題中都會結(jié)合EM算法來分析,也難怪有學(xué)者稱EM算法和缺失數(shù)據(jù)如同一對孿生姐妹一般總是如影隨形。本文主要對EM在含缺失數(shù)據(jù)的統(tǒng)計分析及應(yīng)用中作了以下幾方面的研究:(1)引言。主要介紹了本文研究的背景、意義以及國內(nèi)外研究現(xiàn)狀。(2)理論基礎(chǔ)的構(gòu)建部分。首先介紹了缺失數(shù)據(jù)的產(chǎn)生的原因、機制和模式;其次對極大似然估計的理論作了簡要概述;最后介紹了EM算法的相關(guān)理論,在這一部分中詳述了對EM算法的幾種解釋,從而加深了對該算法的理解。(3)EM算法在含缺失數(shù)據(jù)的調(diào)查表中的應(yīng)用。這是EM算法在實際生活中的一類非常重要的應(yīng)用,在這部分中我們首先將該算法應(yīng)用在常見的調(diào)查表中數(shù)據(jù)有缺失的情形,然后以重慶市居民的交通起止點調(diào)查表為例,用EM算法來補全表中的數(shù)據(jù)并對其中的參數(shù)進行估計,從而很好的展現(xiàn)了該算法的實用價值。(4)EM算法在混合模型中的應(yīng)用。在這一部分中我們主要研究了EM算法在二階高斯混合模型和多層混合模型中的應(yīng)用,其中在研究EM算法在二階高斯混合模型中的應(yīng)用時,我們將觀測數(shù)據(jù)劃分成(X,Y)和整體Y的形式,分別在這兩種形式下給出模型中參數(shù)的估計,并用Matlab軟件進行了隨機數(shù)值模擬;在研究多層混合模型時,我們以二項-泊松多層混合模型為例給出了EM算法在該種模型下的參數(shù)估計,并用具體的實例來驗證了EM算法在處理這類復(fù)雜的混合模型參數(shù)估計方面的優(yōu)勢,為EM算法在其它復(fù)雜混合模型中的應(yīng)用提供了很好的借鑒。
【關(guān)鍵詞】:EM算法 極大似然估計 缺失數(shù)據(jù) 混合模型 調(diào)查表
【學(xué)位授予單位】:重慶工商大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:C81
【目錄】:
- 摘要5-6
- ABSTRACT6-8
- 第1章 引言8-14
- 1.1 研究背景和意義8-9
- 1.1.1 研究背景8
- 1.1.2 研究意義8-9
- 1.2 國內(nèi)外的研究現(xiàn)狀9-12
- 1.2.1 國外研究現(xiàn)狀9-10
- 1.2.2 國內(nèi)研究現(xiàn)狀10-12
- 1.3 研究設(shè)計12-14
- 1.3.1 本文的工作12
- 1.3.2 論文的可能創(chuàng)新之處12-13
- 1.3.3 研究框架13-14
- 第2章 缺失數(shù)據(jù)產(chǎn)生的原因及分類14-19
- 2.1 缺失數(shù)據(jù)的定義及其產(chǎn)生原因14-15
- 2.1.1 缺失數(shù)據(jù)的定義14
- 2.1.2 缺失數(shù)據(jù)產(chǎn)生的原因14-15
- 2.2 缺失數(shù)據(jù)的分類15-17
- 2.2.1 按照缺失數(shù)據(jù)的機制分類15-16
- 2.2.2 按照缺失數(shù)據(jù)的模式分類16-17
- 2.3 缺失數(shù)據(jù)的處理方法17-19
- 第3章 EM算法的相關(guān)理論19-27
- 3.1 EM算法19-23
- 3.1.1 極大似然估計19
- 3.1.2 完備數(shù)據(jù)集19-20
- 3.1.3 EM算法20-23
- 3.2 EM算法的幾種解釋23-24
- 3.2.1 直觀解釋23
- 3.2.2 下界極大化23-24
- 3.3 EM算法的性質(zhì)24-27
- 第4章 EM算法在調(diào)查表中的應(yīng)用27-32
- 4.1 一個變量缺失的情形27-28
- 4.2 兩個變量缺失的情形28-29
- 4.3 實例分析29-32
- 第5章 EM算法在二階高斯混合模型中的應(yīng)用32-60
- 5.1 EM算法在高斯混合模型中的應(yīng)用32-37
- 5.1.1 高斯混合模型簡介32-34
- 5.1.2 EM算法高斯混合模型中的參數(shù)估計34-37
- 5.2 EM算法在數(shù)據(jù)分開形式下的二階高斯混合模型中的應(yīng)用37-54
- 5.2.1 總體分布的符號說明37-38
- 5.2.2 分開形式下完全數(shù)據(jù)的二階高斯混合模型的參數(shù)估計38-40
- 5.2.3 分開形式下缺失數(shù)據(jù)的二階高斯混合模型的參數(shù)估計40-53
- 5.2.4 數(shù)值模擬53-54
- 5.3 EM算法在一般形式下的二階高斯混合模型中的應(yīng)用54-60
- 5.3.1 一般形式下完全數(shù)據(jù)的二階高斯混合模型的參數(shù)估計55-57
- 5.3.2 數(shù)值模擬57-60
- 第6章 EM算法在二項-泊松多層混合模型中的應(yīng)用60-66
- 6.1 EM算法在二項-泊松多層混合模型中的參數(shù)估計60-63
- 6.2 算法簡要步驟63
- 6.3 實例分析63-66
- 第7章 總結(jié)和展望66-68
- 7.1 總結(jié)66-67
- 7.2 展望67-68
- 參考文獻68-72
- 碩士期間發(fā)表的學(xué)術(shù)論文72-73
- 致謝73
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前3條
1 楊明,畢涌,雷英杰;混合Weibull分布參數(shù)估計的EM算法[J];華北工學(xué)院學(xué)報;2003年05期
2 鐘紹軍;童恒慶;;凸約束廣義線性模型參數(shù)MLE估計的收斂性研究[J];統(tǒng)計與決策;2012年04期
3 翟繼友;張鵬;;高斯混合模型參數(shù)估值算法的優(yōu)化[J];計算機技術(shù)與發(fā)展;2011年11期
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前2條
1 連軍艷;EM算法及其改進在混合模型參數(shù)估計中的應(yīng)用研究[D];長安大學(xué);2006年
2 陳文強;混合泊松分布模型的參數(shù)估計問題[D];西北大學(xué);2009年
本文關(guān)鍵詞:基于EM算法的缺失數(shù)據(jù)的統(tǒng)計分析及應(yīng)用,由筆耕文化傳播整理發(fā)布。
本文編號:443977
本文鏈接:http://sikaile.net/shekelunwen/shgj/443977.html
最近更新
教材專著