天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于非凸懲罰似然法的穩(wěn)健回歸和離群值檢測研究

發(fā)布時間:2020-11-01 00:18
   目前最常用的普通最小二乘估計通過極小化離差平方和,尋找最佳的參數(shù)估計值,這可以得到一個比較理想的結(jié)果。但現(xiàn)實統(tǒng)計數(shù)據(jù)中普遍存在離群值,最小二乘回歸方法并不能準(zhǔn)確進(jìn)行統(tǒng)計分析。甚至只要有一個離群值,都會負(fù)面干擾到估計結(jié)果的精確性。而能保證高崩潰點(diǎn)和高有效性的穩(wěn)健回歸方法就顯示出重要的現(xiàn)實意義。本文使用的基于懲罰似然的穩(wěn)健回歸方法在常規(guī)的線性回歸模型中加入一個均值漂移參數(shù),使用正則化方法將該參數(shù)稀疏化。通過測試發(fā)現(xiàn),使用非凸懲罰可以更好地處理高杠桿離群值,而一個觀測值是不是離群值就等同于檢驗均值漂移參數(shù)是否非0,之后在因變量中減去確定的均值漂移參數(shù),使用最小二乘法得到對回歸參數(shù)的估計。本文使用M、S、JD三個指標(biāo)綜合評價各方法在識別離群值方面的表現(xiàn),使用均方參數(shù)誤差來評價估計模型對真實模型的擬合效果。通過將表現(xiàn)更為優(yōu)秀的基于非凸懲罰似然的穩(wěn)健回歸方法與REWLS估計、MM估計對比,發(fā)現(xiàn)基于非凸懲罰似然的穩(wěn)健回歸的確在穩(wěn)健性和離群值檢測能力上具有更好的性質(zhì),崩潰點(diǎn)更高,可以解決一個或多個高杠桿離群值存在時,常用的穩(wěn)健回歸方法效果不佳的問題。該方法在模擬測試中獲得了更為可靠的結(jié)果,同時本文也對其中存在的問題進(jìn)行了討論。本文將初步測算基于懲罰似然的穩(wěn)健回歸方法的經(jīng)驗崩潰點(diǎn)和有效性,進(jìn)一步完善該方法。本文還嘗試使用穩(wěn)健馬氏距離分別結(jié)合REWLS估計、MM估計的殘差進(jìn)行離群值探測,發(fā)現(xiàn)這樣的做法在淹沒效應(yīng)上表現(xiàn)更好,可以糾正少部分估計本身的錯誤識別,并且崩潰點(diǎn)要稍高一些。
【學(xué)位單位】:江西財經(jīng)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位年份】:2020
【中圖分類】:O212.1;C815
【部分圖文】:

離群值,杠桿


基于非凸懲罰似然法的穩(wěn)健回歸和離群值檢測研究12在這里我們設(shè)置一個真實模型y=2x+1,通過rnorm函數(shù)隨機(jī)生成50個數(shù)據(jù),之后將第一個數(shù)據(jù)替換成(-8,8),顯然這是一個有害的高杠桿離群值,觀察前后最小二乘擬合曲線的變化。其中虛線為沒有離群值存在時的擬合曲線,實線為加入(-8,8)這一個離群值之后的擬合曲線。顯而易見,一個高杠桿離群值就使得擬合曲線大幅偏離了總體趨勢,精確性嚴(yán)重下降。此時使用car包中的outlierTest函數(shù)可以非常輕易地通過學(xué)生化殘差把這一個離群值識別出來,進(jìn)一步可以結(jié)合帽子矩陣對杠桿效應(yīng)或者說某一點(diǎn)的影響力進(jìn)行評價,定義如下。對于k-1個自變量X1,X2,…Xk-1和因變量y,假設(shè)他們之間存在的關(guān)系如下。y=β0+β11+β22++βk11+ε(2.6)由最小二乘法計算使目標(biāo)函數(shù)最小化的β,目標(biāo)函數(shù)如下。Q(β)=||y-xβ||2(2.7)對目標(biāo)函數(shù)Q(β)中的β求偏導(dǎo),并令其為0,則可得到方程組如下。XTXβ=XTY(2.8)這個方程也被稱為正則方程,其有且僅有一個解的充分必要條件是XTX的秩等于k。此時得到方程組的唯一的解。β=(XTX)1XTY(2.9)圖2-1高杠桿離群值對OLS的影響

殘差圖,帽子,殘差,帽子矩陣


2理論基礎(chǔ)13所以有y=xβ=x(XTX)1XTY=HY。β表示自變量,ε表示隨機(jī)誤差,e=y-表示模型2.1的殘差,ri=√1被稱為學(xué)生化殘差。得到帽子矩陣H,H=H(X)=X(XTX)1X。令hi是H對角線元素,則有如下公式。hi=1n+(xix)2∑(xix)n2i=1,i=1,2,3,....,n(2.10)hi表示第i個觀測值的帽子值,可以用來代表第i個觀測值的權(quán)勢,帽子矩陣在回歸診斷,殘差分析中有著較為廣泛的運(yùn)用,討論帽子矩陣中元素的性質(zhì)非常重要。此時使用influencePlot函數(shù)繪圖。第一個數(shù)據(jù)已被標(biāo)記出來,是高杠桿點(diǎn),但處在坐標(biāo)軸下方的第44個數(shù)據(jù)也被標(biāo)出,實際上它是個正常值,所以此時已經(jīng)出現(xiàn)了一定程度的淹沒效應(yīng)。我們還可以使用Cook距離來評價點(diǎn)對系數(shù)的影響程度大小,公式如下。=22(1)2(2.11)圖2-2標(biāo)準(zhǔn)化殘差與帽子值

基于非凸懲罰似然法的穩(wěn)健回歸和離群值檢測研究


庫克距離
【參考文獻(xiàn)】

相關(guān)期刊論文 前8條

1 尚華;張貝貝;紀(jì)宏;;一種新的基于回歸分析的異常值檢測[J];河南大學(xué)學(xué)報(自然科學(xué)版);2015年06期

2 崔立功;;基于M估計的線性回歸模型的統(tǒng)計診斷[J];牡丹江師范學(xué)院學(xué)報(自然科學(xué)版);2014年04期

3 姜佃高;張娟娟;葛永慧;;穩(wěn)健估計方法在多元線性回歸中的有效性研究[J];統(tǒng)計與決策;2014年18期

4 戴前偉;江沸菠;董莉;;基于漢南-奎因信息準(zhǔn)則的電阻率層析成像徑向基神經(jīng)網(wǎng)絡(luò)反演[J];地球物理學(xué)報;2014年04期

5 李揚(yáng);曾憲斌;;面板數(shù)據(jù)模型的懲罰似然變量選擇方法研究[J];統(tǒng)計研究;2014年03期

6 盧二坡;黃炳藝;;基于穩(wěn)健MM估計的統(tǒng)計數(shù)據(jù)質(zhì)量評估方法[J];統(tǒng)計研究;2010年12期

7 鮑彥平;王彤;何大衛(wèi);;基于秩次的R類穩(wěn)健回歸[J];中國衛(wèi)生統(tǒng)計;2007年06期

8 王斌會,陳一非;基于穩(wěn)健馬氏距離的多元異常值檢測[J];統(tǒng)計與決策;2005年06期


相關(guān)博士學(xué)位論文 前2條

1 勾建偉;懲罰回歸方法的研究及其在后全基因關(guān)聯(lián)研究中的應(yīng)用[D];南京醫(yī)科大學(xué);2014年

2 王彤;線性回歸模型的穩(wěn)健估計及多個異常點(diǎn)診斷方法研究[D];第四軍醫(yī)大學(xué);2000年


相關(guān)碩士學(xué)位論文 前4條

1 毛瀝悅;部分線性模型和廣義線性模型的懲罰經(jīng)驗似然[D];陜西師范大學(xué);2018年

2 崔芳;計量經(jīng)濟(jì)建模中的穩(wěn)健回歸方法及其應(yīng)用研究[D];山東財經(jīng)大學(xué);2015年

3 原少斌;回歸分析中異常值診斷方法的比較研究[D];蘭州商學(xué)院;2014年

4 王海娜;線性回歸模型的若干穩(wěn)健估計方法及應(yīng)用實例[D];山東大學(xué);2013年



本文編號:2864728

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/benkebiyelunwen/2864728.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶c942a***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com