稀疏性假定下兩個(gè)高維相關(guān)性矩陣的相等性檢驗(yàn)
發(fā)布時(shí)間:2024-02-24 16:24
隨著計(jì)算機(jī)科學(xué)的發(fā)展,我們獲取數(shù)據(jù)的能力越來越強(qiáng),數(shù)據(jù)的獲取場景越來越多樣化,導(dǎo)致了數(shù)據(jù)的維度和數(shù)據(jù)量不斷大幅度增加,產(chǎn)生了大量的高維數(shù)據(jù)問題。這樣的高維數(shù)據(jù)在基因,金融,互聯(lián)網(wǎng)領(lǐng)域出現(xiàn)得越來越多。例如:在蛋白質(zhì)的分類問題中,我們往往是通過對蛋白質(zhì)的基因?qū)M(jìn)行測序,從而根據(jù)不同蛋白質(zhì)所蘊(yùn)含的不同的基因?qū)韰^(qū)分不同種類的蛋白質(zhì)。但是在實(shí)際操作過程中,由于基因測序的成本非常高,導(dǎo)致我們的樣本量(n)非常少,但是每個(gè)樣本所蘊(yùn)含的基因?qū)?p)卻是成千上萬,這就產(chǎn)生了一個(gè)“小n大p”的問題。對于這樣的“小n大p”問題,經(jīng)典的統(tǒng)計(jì)方法往往會失效或者犯第一類錯(cuò)誤(原假設(shè)為真的情況下拒絕原假設(shè))的概率很大。產(chǎn)生這一現(xiàn)象的原因可以從隨機(jī)矩陣領(lǐng)域中的Mar?henko-Pastur分布的分布行為中看出:在高維數(shù)據(jù)的情形下,樣本協(xié)方差矩陣所對應(yīng)的特征值的波動開始和總體協(xié)方差矩陣所對應(yīng)的特征值的波動發(fā)生顯著性的偏差,這使得樣本協(xié)方差矩陣不再是總體協(xié)方差矩陣的有效估計(jì),自然的,高維情形下,樣本相關(guān)性矩陣也不再是總體相關(guān)性矩陣的可靠估計(jì)了。這一事實(shí)導(dǎo)致許多經(jīng)典的統(tǒng)計(jì)方法在高維數(shù)據(jù)的情形下表現(xiàn)非常糟糕,在高維統(tǒng)計(jì)檢...
【文章頁數(shù)】:61 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
Chapter 1 Introduction
1.1 Background and Significance
1.2 Literature Review
1.3 Our Work
Chapter 2 Limiting Null Distribution of the Test Statistic
2.1 Sparse Settings and Moment Conditions
2.2 Main Result
2.3 Power and Optimality
2.4 Methodology
2.4.1 Limiting Null Distribution of the Test Statistic
2.4.2 Distribution-free Case
Chapter 3 Simulation Studies
Chapter 4 Lemmas and Proofs
4.1 Guassian Approximation
4.2 Consistency of the Normalized Term
4.3 Proof of Theorem 2.1
4.4 Proof of Theorem 2.2
4.5 Proof of Lemma 4.2
4.6 Proof of Lemma 4.3
結(jié)論
Conclusions
References
Appendix A Simulations for Gamma Distribution Case
Acknowledgements
本文編號:3909286
【文章頁數(shù)】:61 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
Chapter 1 Introduction
1.1 Background and Significance
1.2 Literature Review
1.3 Our Work
Chapter 2 Limiting Null Distribution of the Test Statistic
2.1 Sparse Settings and Moment Conditions
2.2 Main Result
2.3 Power and Optimality
2.4 Methodology
2.4.1 Limiting Null Distribution of the Test Statistic
2.4.2 Distribution-free Case
Chapter 3 Simulation Studies
Chapter 4 Lemmas and Proofs
4.1 Guassian Approximation
4.2 Consistency of the Normalized Term
4.3 Proof of Theorem 2.1
4.4 Proof of Theorem 2.2
4.5 Proof of Lemma 4.2
4.6 Proof of Lemma 4.3
結(jié)論
Conclusions
References
Appendix A Simulations for Gamma Distribution Case
Acknowledgements
本文編號:3909286
本文鏈接:http://sikaile.net/kejilunwen/yysx/3909286.html
最近更新
教材專著