【摘要】:針對(duì)連續(xù)型數(shù)據(jù)中經(jīng)常呈現(xiàn)的重尾現(xiàn)象以及計(jì)數(shù)時(shí)間序列數(shù)據(jù)的過(guò)度擴(kuò)散等情況,本文討論了若干有關(guān)的統(tǒng)計(jì)模型及其參數(shù)估計(jì)問(wèn)題,涉及尺度混合正態(tài)回歸模型、截尾學(xué)生t回歸模型、混合負(fù)二項(xiàng)整值A(chǔ)RCH模型、Neyman-A型整值GARCH模型,發(fā)展了相應(yīng)的非迭代貝葉斯后驗(yàn)抽樣算法、EM算法等。得到了有關(guān)模型平穩(wěn)性的充要條件及模型選擇策略。與傳統(tǒng)模型和算法相比,所考慮模型和算法在模擬和實(shí)例分析中都有滿(mǎn)意的表現(xiàn),在經(jīng)濟(jì)、醫(yī)學(xué)等領(lǐng)域有較好的應(yīng)用。1.尺度混合正態(tài)線性回歸模型的非迭代貝葉斯抽樣算法尺度混合正態(tài)(SMN)分布為一類(lèi)重尾分布族,由于其穩(wěn)健性,當(dāng)數(shù)據(jù)中有異常值時(shí),常用其替代正態(tài)分布。關(guān)于SMN線性回歸及相關(guān)模型的統(tǒng)計(jì)推斷,文獻(xiàn)中有基于期望最大化(EM)算法的最大似然估計(jì)和基于馬氏鏈蒙特卡洛(MCMC)抽樣的貝葉斯推斷。例如,Andrews(1974)、Dempster(1980)以及Lange(1993)發(fā)展了 SMN分布的(EM)算法,并討論了它們?cè)诜(wěn)健回歸中的應(yīng)用。Fernndez and Steel(2000)討論了 SMN 線性回歸下的 MCMC)算法,Abanto-Valle et al.(2010)則從貝葉斯的角度分析了 SMN隨機(jī)波動(dòng)性模型。Rosa et al.(2003,2004)將SMN線性回歸模型推廣到SMN線性混合效應(yīng)模型,并進(jìn)行了貝葉斯推斷。Garay et al.(2015,2017)將SMN回歸模型推廣到截尾的情形,并討論了相應(yīng)的EM算法和MCMC算法。由于其靈活性和易實(shí)施性,Gibbs抽樣和其他MCMC抽樣算法被廣泛用于貝葉斯統(tǒng)計(jì)推斷,但這些迭代抽樣算法有其缺陷,實(shí)際應(yīng)用中容易被忽視。其一,由迭代的MCMC抽樣產(chǎn)生的樣本很難做到獨(dú)立;其二,很難確信迭代終止時(shí)抽取的馬氏鏈?zhǔn)欠襁_(dá)到收斂。Tan et al.(2003)提出了一種缺失數(shù)據(jù)結(jié)構(gòu)下基于逆貝葉斯公式(IBF)的非迭代抽樣算法,該算法可從后驗(yàn)分布中產(chǎn)生(近似)獨(dú)立同分布(i.i.d.)的樣本,所得樣本可直接用于貝葉斯統(tǒng)計(jì)推斷,從而避免了 Gibbs抽樣的缺點(diǎn)。受Tan et al.(2003)啟發(fā),在第一章中,我們將非迭代抽樣算法的思想應(yīng)用到SMN回歸模型中去,發(fā)展了非迭代貝葉斯后驗(yàn)抽樣算法。該算法把SMN回歸模型的穩(wěn)健性與非迭代抽樣的計(jì)算有效性結(jié)合起來(lái),能夠獲得來(lái)自參數(shù)后驗(yàn)分布的獨(dú)立同分布的樣本,從而避免了迭代的Gibbs抽樣算法的收斂性診斷問(wèn)題。我們通過(guò)模擬來(lái)研究算法的表現(xiàn),并用該后驗(yàn)樣本進(jìn)行模型選擇和影響分析。最后,用該策略分析美國(guó)長(zhǎng)期國(guó)債價(jià)格數(shù)據(jù)集,得到了有意思的結(jié)果。與正態(tài)回歸及迭代的Gibbbs抽樣相比,我們的策略在模擬和應(yīng)用中表現(xiàn)都很好。2.截尾學(xué)生t線性回歸模型的非迭代貝葉斯抽樣算法截尾學(xué)生t回歸模型((CTR)在處理異常數(shù)據(jù)時(shí)比截尾正態(tài)回歸模型更穩(wěn)健。第二章中,我們?cè)谪惾~斯框架下,發(fā)展了處理截尾學(xué)生t回歸的非迭代抽樣算法。算法的核心在于學(xué)生t分布的分層表示和截尾數(shù)據(jù)的缺失數(shù)據(jù)結(jié)構(gòu)使得CTR模型很自然具有蒙特卡洛EM(MCEM)結(jié)構(gòu)。首先,將觀測(cè)數(shù)據(jù)添加兩類(lèi)潛變量數(shù)據(jù),一類(lèi)是將學(xué)生t分布表示成正態(tài)分布的混合表示的混合變量,另一類(lèi)是截尾下的缺失數(shù)據(jù),從而獲得MCEM結(jié)構(gòu)下的添加條件預(yù)測(cè)分布。然后,應(yīng)用EM算法獲得后驗(yàn)眾數(shù),用其得到最佳重點(diǎn)抽樣密度,使得目標(biāo)后驗(yàn)密度和重點(diǎn)抽樣密度間的覆蓋區(qū)域足夠大。最后,兩次應(yīng)用IBF算法和抽樣/重點(diǎn)再抽樣(SIR)算法,獲得來(lái)自觀測(cè)后驗(yàn)分布的近似獨(dú)立同分布的樣本。該樣本也被用在模型選擇和影響診斷上,能夠選擇最佳的自由度,并識(shí)別潛在的異常值。我們通過(guò)模擬來(lái)研究CTR算法下的IBF算法的表現(xiàn),并用該策略分析了兩個(gè)截尾數(shù)據(jù)集,一個(gè)是左截尾的工資率數(shù)據(jù),另一個(gè)是右截尾的絕緣壽命數(shù)據(jù),發(fā)現(xiàn)所用策略比通常的截尾正態(tài)線性模型和Gibbs抽樣要有效。3.基于混合負(fù)二項(xiàng)分布的整值廣義自回歸條件異方差模型的統(tǒng)計(jì)推斷為處理過(guò)度分散和多峰的計(jì)數(shù)時(shí)間序列,本章中我們建立了基于負(fù)二項(xiàng)分布的混合整值自回歸條件異方差模型。該模型有多個(gè)平穩(wěn)或非平穩(wěn)的整值自回歸條件異方差過(guò)程構(gòu)成,其中每個(gè)混合過(guò)程都有著負(fù)二項(xiàng)的條件邊際分布。相對(duì)單個(gè)負(fù)二項(xiàng)整值自回歸條件異方差模型而言,混合模型不僅僅可以處理過(guò)度分散,還能較好的處理多峰和具有分平穩(wěn)混合過(guò)程。我們給出了模型具有一二階平穩(wěn)解的充分必要條件,也推導(dǎo)了模型的自協(xié)方差函數(shù)以及自相關(guān)系數(shù)的遞推關(guān)系。充分利用模型中的混合性,發(fā)展了基于EM算法的最大似然法的參數(shù)估計(jì)。我們通過(guò)模擬研究了估計(jì)的表現(xiàn)。最后,通過(guò)三種模型選擇方式:AIC、BIC和MRC,對(duì)實(shí)際數(shù)據(jù)建立模型進(jìn)行實(shí)證分析。4.A-型Neyman整值廣義自回歸條件異方差模型的統(tǒng)計(jì)推斷第四章中,我們討論一類(lèi)特殊的復(fù)合泊松整值廣義自回歸條件異方差模型--A-型Neyman整值廣義自回歸條件異方差模型。對(duì)于一般的A-型Neyman整值廣義自回歸條件異方差模型,導(dǎo)出了其一二階平穩(wěn)性條件。我們也特別給出了自協(xié)方差函數(shù)與自相關(guān)系數(shù)的遞推關(guān)系,它們可以用來(lái)做部分模型的Yule-Warlker估計(jì)。對(duì)于模型參數(shù)的估計(jì)問(wèn)題,我們考慮了三種估計(jì)方法:Yule-Warler估計(jì)(YW),條件最小二乘估計(jì)(CLS)和最大似然估計(jì)(MLE)。由于A-型Neyman分布的概率分布律的復(fù)雜性,極大似然方法中借助于EM算法來(lái)最大化似然函數(shù)。模擬結(jié)果發(fā)現(xiàn),總體上三種估計(jì)方法表現(xiàn)都不錯(cuò),尤其是當(dāng)樣本量增加時(shí)。最后,我們對(duì)彎曲桿菌感染的病例的計(jì)數(shù)數(shù)據(jù)進(jìn)行實(shí)證分析,通過(guò)AIC和BIC準(zhǔn)則選擇了A-型Neyman整值自回歸(NTA-INARCH)模型,并對(duì)數(shù)據(jù)做了擬合與殘差診斷。
【學(xué)位授予單位】:山東大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2018
【分類(lèi)號(hào)】:O212
【圖文】:
圖1.1:基于100個(gè)模擬樣本的DIC值.逡逑

逡逑其中y為bid邋price,邋z為coupon邋rate.圖1.2是添加了估計(jì)的最小二乘回歸直線(黑線)逡逑的35個(gè)點(diǎn)的散點(diǎn)圖,易見(jiàn)該擬合直線不能很好地描述數(shù)據(jù)。很明顯,左側(cè)的三個(gè)點(diǎn)孤立逡逑出來(lái),使得最小二乘直線從大部分點(diǎn)中偏離出來(lái)并向這三個(gè)點(diǎn)靠攏,可見(jiàn)若用一更加陡逡逑哨的回歸直線來(lái)描述該數(shù)據(jù)效果會(huì)更好些。為了更好地理解這幾個(gè)點(diǎn)的效應(yīng),下面計(jì)算逡逑標(biāo)準(zhǔn)化殘差和杠桿值。點(diǎn)4、13和35所對(duì)應(yīng)的杠桿值分別為0.153,邋0.218和0.187,均比逡逑閾值0.11(4/35邋=邋0.11)大,也比其它點(diǎn)的杠桿值大很多,故點(diǎn)4、13和35均為高杠桿逡逑點(diǎn)。點(diǎn)13和35對(duì)應(yīng)的標(biāo)準(zhǔn)化殘差為2.848和2.394,均比2大,點(diǎn)4對(duì)應(yīng)的值為1.838,接逡逑近于2,故點(diǎn)13和15為異常點(diǎn),點(diǎn)13為可能的異常點(diǎn)。圖1.3(左)是標(biāo)準(zhǔn)化殘差對(duì)擬逡逑合值的殘差圖

^邐4.790邐4.794邐0.118邐0,396邐4.702邐4.730邐0.128邐0.419逡逑下面我們基于后驗(yàn)樣本計(jì)算四種模型下的K-L擴(kuò)散測(cè)度,用來(lái)決定哪些點(diǎn)是強(qiáng)影響逡逑點(diǎn)。圖1.4是四種模型下對(duì)應(yīng)的35個(gè)點(diǎn)的瓦豎線圖,很明顯,在正態(tài)模型下,邐點(diǎn)4、13和35被識(shí)別為高影響點(diǎn),而在其他三種SMN模型下未發(fā)現(xiàn)任何高影響點(diǎn),這說(shuō)逡逑明SMN分布對(duì)高影響觀測(cè)或異常值不敏感。為了選擇最合適的模型,表1.7計(jì)算了四種逡逑模型下的各種模型選擇測(cè)度,其中粗體數(shù)字對(duì)應(yīng)該準(zhǔn)則下的最優(yōu)模型?梢(jiàn)各種模型選逡逑擇測(cè)度在三種重尾SMN模型下對(duì)應(yīng)取值相差不大,但與正態(tài)結(jié)果相比,均有顯著改善。逡逑粗體數(shù)字告訴我們各種測(cè)度均支持自由度為1的學(xué)生t回歸為最優(yōu)模型。最后,我們?cè)阱义蠄D1.2中添加了由Student邋t(l)模型所得的回歸直線(紅色),其中成=58.133,瓦=逡逑4.771
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 鄭克旺;;一類(lèi)發(fā)展型方程迭代型橫向算法[J];河北化工學(xué)院學(xué)報(bào);1988年01期
2 石瑛;虞鎮(zhèn)國(guó);;兩部迭代方式及其在能源與環(huán)境系統(tǒng)分析中的應(yīng)用[J];數(shù)量經(jīng)濟(jì)技術(shù)經(jīng)濟(jì)研究;1992年05期
3 于純妍;趙猛;宋梅萍;李森;王玉磊;;基于目標(biāo)約束與譜空迭代的高光譜圖像分類(lèi)方法[J];光學(xué)學(xué)報(bào);2018年06期
4 張凱;于宏毅;胡峗鵬;沈智翔;;基于EM-SBL迭代的稀疏SIMO信道頻域盲均衡算法[J];電子學(xué)報(bào);2018年02期
5 葉峰,邵之江,梁昔明,錢(qián)積新;Lagrange乘子初始值和罰因子迭代方式的研究[J];廈門(mén)大學(xué)學(xué)報(bào)(自然科學(xué)版);2001年S1期
6 黃銳;桑農(nóng);劉樂(lè)元;羅大鵬;唐奇伶;;一種增量迭代方式下的特征向量聚類(lèi)方法[J];模式識(shí)別與人工智能;2010年03期
7 梅雪艷;;低密度奇偶校驗(yàn)碼及其應(yīng)用前景[J];兵工自動(dòng)化;2006年02期
8 于春陽(yáng),汪文秉;應(yīng)用空域分解法分析復(fù)雜目標(biāo)的散射特性[J];電波科學(xué)學(xué)報(bào);1995年03期
9 孔垂柳;;基于迭代法的VC++教學(xué)探索[J];廣西輕工業(yè);2009年03期
10 ;AVEVA和ETAP簽署協(xié)議加強(qiáng)合作[J];機(jī)電設(shè)備;2014年04期
相關(guān)重要報(bào)紙文章 前1條
1 本報(bào)駐北美特約記者 孫力夫;在加拿大親歷iPhone5S首次發(fā)售[N];電腦報(bào);2013年
相關(guān)博士學(xué)位論文 前2條
1 袁海靜;穩(wěn)健回歸模型的非迭代抽樣算法與計(jì)數(shù)時(shí)間序列模型的統(tǒng)計(jì)推斷[D];山東大學(xué);2018年
2 別志松;基于因子圖的迭代接收機(jī)設(shè)計(jì)與優(yōu)化[D];北京郵電大學(xué);2007年
相關(guān)碩士學(xué)位論文 前4條
1 吾雨森;面向GPU集群領(lǐng)域的關(guān)鍵算法研究和實(shí)現(xiàn)[D];杭州電子科技大學(xué);2017年
2 劉栻栻;面向5G的稀疏碼分多址技術(shù)研究[D];電子科技大學(xué);2017年
3 張晗;稀疏碼多址系統(tǒng)低復(fù)雜度檢測(cè)研究[D];哈爾濱工業(yè)大學(xué);2017年
4 龔明葦;大規(guī)模MIMO系統(tǒng)中低復(fù)雜度的上行信號(hào)檢測(cè)算法的研究[D];重慶郵電大學(xué);2017年
本文編號(hào):
2772607
本文鏈接:http://sikaile.net/kejilunwen/yysx/2772607.html