統(tǒng)計(jì)數(shù)據(jù)異常值診斷方法及應(yīng)用
發(fā)布時(shí)間:2017-04-28 05:05
本文關(guān)鍵詞:統(tǒng)計(jì)數(shù)據(jù)異常值診斷方法及應(yīng)用,由筆耕文化傳播整理發(fā)布。
【摘要】:運(yùn)用統(tǒng)計(jì)數(shù)據(jù)分析與預(yù)測國家經(jīng)濟(jì)特征及走勢(shì)已是眾多專家學(xué)者乃至業(yè)余人士的慣用方法,然而隨著信息化的深入發(fā)展,人們對(duì)數(shù)據(jù)質(zhì)量提出了越來越高的要求,新的數(shù)據(jù)質(zhì)量診斷理論應(yīng)運(yùn)而生,方法越趨完善,其中對(duì)異常值的識(shí)別與處理是數(shù)據(jù)質(zhì)量診斷過程中一個(gè)不可忽略的問題。本文主要從回歸模型和殘差分布兩個(gè)方面討論異常值的識(shí)別問題,通過對(duì)某一模型或概率分布下各種檢驗(yàn)統(tǒng)計(jì)量的總結(jié)和比較,得出檢驗(yàn)假設(shè)條件下異常值的最優(yōu)方法,并運(yùn)用該方法來檢驗(yàn)我國一些宏觀統(tǒng)計(jì)指標(biāo)數(shù)據(jù)是否存在異常。 在常規(guī)回歸模型中,異常值是指對(duì)既定模型偏離較大的數(shù)據(jù)點(diǎn)。通過建立數(shù)據(jù)刪除模型來分析某一數(shù)據(jù)點(diǎn)對(duì)回歸分析的影響,如果該點(diǎn)對(duì)回歸方程估計(jì)量的影響超過臨界值,那么就判定該點(diǎn)為異常值。隨著經(jīng)濟(jì)現(xiàn)象之間的關(guān)系越來越復(fù)雜,很少單純地存在簡單線性關(guān)系,于是本文在總結(jié)前人關(guān)于參數(shù)與非參數(shù)模型下異常值檢驗(yàn)的經(jīng)典研究基礎(chǔ)上,把相應(yīng)方法拓展到半變系數(shù)模型中,并利用該方法以具體模型開展實(shí)際應(yīng)用分析。 在樣本統(tǒng)計(jì)數(shù)據(jù)中,異常值是指與數(shù)據(jù)集的主體并非來自同一分布的點(diǎn),即與大部分?jǐn)?shù)據(jù)不服從同一樣本分布的點(diǎn)。盡管目前各國學(xué)者對(duì)正態(tài)分布、指數(shù)分布、極值分布、威布爾分布等分布下異常值的識(shí)別問題都做出了杰出貢獻(xiàn)。在總結(jié)非正態(tài)分布下異常值檢驗(yàn)問題的基礎(chǔ)上,本文針對(duì)Ⅰ型極值分布提出能在任何情況下都避免屏蔽效應(yīng)的新的統(tǒng)計(jì)量——F’型統(tǒng)計(jì)量;其次,概括了正態(tài)分布下異常值的各種檢驗(yàn)統(tǒng)計(jì)量與檢驗(yàn)方法,并借助“相對(duì)統(tǒng)計(jì)量”的概念對(duì)正態(tài)分布下三種常用的檢驗(yàn)統(tǒng)計(jì)量進(jìn)行了檢驗(yàn)功效的比較。 最后,在總結(jié)和評(píng)價(jià)本文主要結(jié)論及貢獻(xiàn)的基礎(chǔ)上,對(duì)異常值診斷的未來發(fā)展方向做了一些展望。
【關(guān)鍵詞】:統(tǒng)計(jì)數(shù)據(jù) 異常值診斷 回歸模型 殘差分布
【學(xué)位授予單位】:浙江工商大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2011
【分類號(hào)】:F222
【目錄】:
- 摘要2-4
- ABSTRACT4-6
- 目錄6-8
- 第一章 導(dǎo)論8-19
- 第一節(jié) 研究背景及選題意義8-10
- 一、研究背景8
- 二、理論和現(xiàn)實(shí)意義8-10
- 第二節(jié) 文獻(xiàn)綜述10-15
- 一、異常值的含義10-11
- 二、異常值產(chǎn)生的原因11
- 三、異常值的診斷方法11-15
- 第三節(jié) 研究思路及主要內(nèi)容15-17
- 一、研究思路16-17
- 二、主要內(nèi)容17
- 第四節(jié) 研究方法與創(chuàng)新之處17-19
- 一、研究方法17-18
- 二、創(chuàng)新之處18-19
- 第二章 回歸模型下異常值診斷的方法及應(yīng)用19-39
- 第一節(jié) 常規(guī)回歸模型下的異常值檢驗(yàn)19-25
- 一、參數(shù)回歸模型下異常值的檢驗(yàn)20-22
- 二、半?yún)?shù)回歸模型下異常值的檢驗(yàn)22-25
- 第二節(jié) 基于半變系數(shù)模型的異常值檢驗(yàn)25-29
- 一、半變系數(shù)模型的提出25-26
- 二、PLS估計(jì)26-27
- 三、帶寬h和模型依賴變量d以及階數(shù)p、q的選擇27
- 四、基于半變系數(shù)模型下數(shù)據(jù)刪除模型的廣義Cook距離27-29
- 第三節(jié) 基于回歸模型的GDP增速的異常值檢驗(yàn)29-39
- 一、變量選取及來源30
- 二、模型構(gòu)建30-32
- 三、應(yīng)用分析32-39
- 第三章 基于殘差分布的異常值分析39-64
- 第一節(jié) 非正態(tài)分布下異常值檢驗(yàn)統(tǒng)計(jì)量39-52
- 一、極值分布與Weibull分布下異常值檢驗(yàn)統(tǒng)計(jì)量39-48
- 二、指數(shù)分布下異常值檢驗(yàn)統(tǒng)計(jì)量48-49
- 三、其它分布49-50
- 四、非正態(tài)分布下異常值診斷方法的應(yīng)用50-52
- 第二節(jié) 正態(tài)分布下異常值檢驗(yàn)52-57
- 一、正態(tài)分布下異常值檢驗(yàn)統(tǒng)計(jì)量52-56
- 二、可以轉(zhuǎn)化為正態(tài)分布的異常值檢驗(yàn)方法56-57
- 第三節(jié) 正態(tài)分布下幾種檢驗(yàn)統(tǒng)計(jì)量的比較57-64
- 一、三種檢驗(yàn)方法的比較57-60
- 二、真實(shí)統(tǒng)計(jì)數(shù)據(jù)質(zhì)量的診斷60-62
- 三、假定異常值下的檢驗(yàn)功效比較62-64
- 第四章 總結(jié)與展望64-67
- 一、總結(jié)與評(píng)價(jià)64-65
- 二、展望65-67
- 參考文獻(xiàn)67-72
- 附錄72-77
- 致謝77-78
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 李云飛,黃繼偉,朱宏;雙參數(shù)指數(shù)分布異常數(shù)據(jù)的檢驗(yàn)[J];電子科技大學(xué)學(xué)報(bào);2005年01期
2 朱宏;Ⅰ型極值分布樣本多個(gè)異常值的檢驗(yàn)[J];地質(zhì)科技管理;1994年03期
3 曾林蕊,朱仲義,茆詩松;半?yún)?shù)廣義線性模型的影響分析與異常點(diǎn)檢驗(yàn)[J];高校應(yīng)用數(shù)學(xué)學(xué)報(bào)A輯(中文版);2004年03期
4 張嶸;陳川楊;;Ⅰ型極值分布下異常值檢驗(yàn)的最優(yōu)統(tǒng)計(jì)量[J];科技信息(學(xué)術(shù)研究);2008年25期
5 李云飛;;指數(shù)分布多個(gè)異常數(shù)據(jù)的檢驗(yàn)[J];內(nèi)江師范學(xué)院學(xué)報(bào);2008年04期
6 陳川楊;朱t,
本文編號(hào):332145
本文鏈接:http://sikaile.net/jingjilunwen/jiliangjingjilunwen/332145.html
最近更新
教材專著