協(xié)方差矩陣的幾何型收縮估計(jì)及其應(yīng)用
發(fā)布時(shí)間:2020-10-17 12:19
協(xié)方差矩陣不僅刻畫(huà)了各變量的離散程度,還刻畫(huà)了變量間的線(xiàn)性相依關(guān)系,在多元統(tǒng)計(jì)分析中占據(jù)著重要的地位。例如,在總體主成分分析(或因子分析)中,根據(jù)協(xié)方差矩陣的特征根大小來(lái)挑選重要的主成分(或主要因子);在線(xiàn)性判別分析(LDA)中,判別函數(shù)包含有協(xié)方差矩陣;在探索性的數(shù)據(jù)分析和檢驗(yàn)中,變量間的獨(dú)立性和條件獨(dú)立性關(guān)系采用協(xié)方差矩陣來(lái)度量;在置信區(qū)間的構(gòu)建中也包含協(xié)方差矩陣。因此,對(duì)協(xié)方差矩陣的估計(jì)是一個(gè)非常重要的問(wèn)題。眾所周知,當(dāng)總體的維數(shù)p很小時(shí),樣本協(xié)方差矩陣是總體協(xié)方差矩陣的優(yōu)良估計(jì)(如相合估計(jì),無(wú)偏估計(jì),一致估計(jì)等)。但是隨著總體的維數(shù)p逐漸增大,樣本協(xié)方差矩陣變得越來(lái)越不穩(wěn)定,樣本協(xié)方差矩陣的最小特征根比總體協(xié)方差矩陣的最小特征根小得多,而最大特征根則大得多。其次,隨著P逐漸增大,總體協(xié)方差矩陣的待估參數(shù)增加得很快(參數(shù)為O(p2)個(gè))。待估參數(shù)增加,干擾的信息過(guò)多,導(dǎo)致估計(jì)誤差的增大。這樣,隨著p的增大,樣本協(xié)方差矩陣不再是總體協(xié)方差矩陣的良好估計(jì)。特別地,當(dāng)總體的維數(shù)P大于樣本的容量n,即pn時(shí)(此時(shí)對(duì)應(yīng)的協(xié)方差矩陣的估計(jì)稱(chēng)為高維協(xié)方差矩陣估計(jì)),樣本協(xié)方差矩陣是奇異的。通常,在理論研究和實(shí)際應(yīng)用中,我們假設(shè)總體協(xié)方差矩陣是正定矩陣,這樣,用一個(gè)奇異的矩陣來(lái)作為一個(gè)正定矩陣的估計(jì)明顯是不合適的?傊,尋找高維協(xié)方差矩陣的優(yōu)良估計(jì)在現(xiàn)代統(tǒng)計(jì)學(xué)中具有重要的理論意義和實(shí)踐意義。高維總體協(xié)方差矩陣的估計(jì)問(wèn)題是現(xiàn)代統(tǒng)計(jì)學(xué)中的核心問(wèn)題,也是一個(gè)十分具有挑戰(zhàn)意義的問(wèn)題。近十多年來(lái)許多學(xué)者都致力于改善高維總體協(xié)方差矩陣的估計(jì),提出了許多估計(jì)方法。常見(jiàn)的方法有正則化方法,收縮方法,在估計(jì)總體協(xié)方差矩陣時(shí)引入某種模型來(lái)描述變量之間的相關(guān)關(guān)系等方法。盡管這些特定方法具有很多優(yōu)良性質(zhì),但是同時(shí)也存在著明顯的缺陷。例如,banding方法和thresholding方法無(wú)法保持估計(jì)矩陣的正定性;tapering方法和thresholding方法在處理正定矩陣時(shí)計(jì)算非常復(fù)雜;對(duì)于存在先驗(yàn)結(jié)構(gòu)的總體協(xié)方差矩陣,正則化方法和收縮方法都可能會(huì)改變?cè)芯仃嚨慕Y(jié)構(gòu);引入某種模型來(lái)描述變量的關(guān)系則因?yàn)榧僭O(shè)性太強(qiáng)而存在應(yīng)用上的局限性。本文在Tong和Wang(2007)的基礎(chǔ)上,系統(tǒng)地研究了一種新的估計(jì)總體協(xié)方差矩陣的方法—幾何型收縮估計(jì)。該方法可以將banding方法,tapering方法,thresholding方法和算術(shù)型收縮估計(jì)統(tǒng)一到一種統(tǒng)一的框架進(jìn)行研究。同時(shí),得到的最終估計(jì)矩陣具有計(jì)算簡(jiǎn)單,保持正定性,保持先驗(yàn)結(jié)構(gòu)等良好性質(zhì)。本文研究高維總體協(xié)方差矩陣的幾何型收縮估計(jì)及其在判別分析和資產(chǎn)投資組合中的應(yīng)用。具體研究?jī)?nèi)容如下。第一章闡述本文的研究背景,綜述高維協(xié)方差矩陣估計(jì)的研究歷史和現(xiàn)狀,并給出本文的研究?jī)?nèi)容。第二章給出本文所需的一些基礎(chǔ)知識(shí)。涵蓋以下三個(gè)方面的內(nèi)容:首先是對(duì)幾何平均值和算術(shù)平均值進(jìn)行概述;其次是給出兩個(gè)矩陣同時(shí)對(duì)角化的條件;最后介紹Hadamard積的符號(hào)表示及其性質(zhì)。第三章研究對(duì)角型總體協(xié)方差矩陣∑ = diag(al1,…,σpp)的幾何型收縮估計(jì)。首先,在最小化Log-Euclidean平方損失函數(shù)下得到最優(yōu)收縮參數(shù)。其次,研究?jī)煞N具體的目標(biāo)矩陣下幾何型收縮估計(jì)量和最優(yōu)收縮參數(shù)的極限性質(zhì)。其三,通過(guò)模擬驗(yàn)證幾何型收縮估計(jì)的優(yōu)良性。最后,通過(guò)傳染病的數(shù)據(jù)進(jìn)行實(shí)證分析。第四章研究一般正定的總體協(xié)方差矩陣∑=(σij)p×p 的幾何型收縮估計(jì)。當(dāng)pn時(shí),由于樣本協(xié)方差矩陣S不再是正定矩陣。我們對(duì)樣本協(xié)方差矩陣施加一個(gè)擾動(dòng)使之成為正定矩陣,然后構(gòu)造出對(duì)應(yīng)的幾何型收縮估計(jì),并在最小化Log-Euclidean平方損失函數(shù)下算出最優(yōu)收縮參數(shù)。最后通過(guò)模擬來(lái)驗(yàn)證估計(jì)矩陣的優(yōu)良性。第五章研究具有某些給定結(jié)構(gòu)的正定的總體協(xié)方差矩陣∑ =(σij)p×p的幾何型收縮估計(jì)。首先,在Hadamard積框架下提出帶結(jié)構(gòu)的協(xié)方差矩陣的幾何型收縮估計(jì)量。其次,給出常見(jiàn)的目標(biāo)矩陣。然后,在最小化Log-Euclidean平方損失函數(shù)下推導(dǎo)出最優(yōu)收縮參數(shù)。最后通過(guò)模擬來(lái)驗(yàn)證估計(jì)矩陣的優(yōu)良性。第六章研究對(duì)角型協(xié)方差矩陣的幾何型收縮估計(jì)量在對(duì)角判別分析中的應(yīng)用。首先介紹對(duì)角判別分析(DLDA)和二次判別分析(DQDA)的理論,然后將對(duì)角型總體協(xié)方差矩陣的幾何型收縮估計(jì)量應(yīng)用到對(duì)角判別分析(DLDA)和二次判別分析(DQDA)中,得到幾何收縮對(duì)角判別分析方法(GDLDA)和幾何收縮二次判別分析方法(GDQDA)。其次通過(guò)模擬分析,比較各種判別分析方法的優(yōu)劣。最后應(yīng)用colon基因數(shù)據(jù)驗(yàn)證各個(gè)判別分析方法的誤判率。模擬和實(shí)證的結(jié)果表明,GDLDA和GDQDA在絕大部分情況下誤判率最低。第七章研究一般正定的總體協(xié)方差矩陣的幾何型收縮估計(jì)量在投資組合中的應(yīng)用。首先對(duì)最小方差投資組合(GMVP)理論部分進(jìn)行介紹,并利用一般正定的總體協(xié)方差矩陣的幾何型收縮估計(jì)量得到投資組合的最優(yōu)權(quán)重的解析解。其次,利用CSMAR下載的2015-2016年上證A股的數(shù)據(jù),計(jì)算由算術(shù)收縮估計(jì),幾何收縮估計(jì)和樣本協(xié)方差得到的投資組合的最優(yōu)權(quán)重。將等權(quán)組合的收益作為基準(zhǔn)值,比較各個(gè)投資組合的期望收益與基準(zhǔn)值之間的差異。實(shí)證結(jié)果表明,幾何型收縮估計(jì)在投資組合中更為有效。第八章為全文的主要結(jié)論和展望。歸納本文的主要工作和主要結(jié)論,并對(duì)未來(lái)研究進(jìn)行展望。
【學(xué)位單位】:浙江工商大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位年份】:2018
【中圖分類(lèi)】:O212.4
【部分圖文】:
樣本容量固定時(shí),平均絕對(duì)誤差關(guān)于樣本維數(shù)變化的趨勢(shì)則在圖??4.1-4.4中。取樣本容量rz?=?10情況來(lái)觀察平均絕對(duì)誤差關(guān)于樣本維數(shù)變化的趨??勢(shì)圖,具體結(jié)果展示在圖4.1中。將三個(gè)平均誤差分開(kāi)來(lái)看,其具體圖表展示為??圖42-4.4。從圖中可知,的值在逐漸減小,而M兒&和卻趨于穩(wěn)??定,其他的樣本容量情況也是如此。由此可知,本文提出的幾何型收縮估計(jì)量??隨著樣本維數(shù)的增加效果會(huì)越來(lái)越好。即在總體協(xié)方差矩陣為良態(tài)情形下,??的表現(xiàn)最優(yōu)。??0???WE.3??-??T-??0??3??????〇?q?_??(0?r-??n<?B?8?5?1?1??c?W??S?°"??q?|?_?t?|??°?n?i?i?i?I??100?200?300?400?500??Sample?Dimension?p??圖4.1情形A下平均絕對(duì)誤差隨樣本維數(shù)的變化趨勢(shì)圖??從收縮參數(shù)來(lái)看,兩個(gè)收縮參數(shù)都比較小,幾何型最優(yōu)收縮參數(shù)接近0。幾??何型收縮估計(jì)量公G接近為S?+?W,其平均絕對(duì)誤差最小。這說(shuō)明增加了擾動(dòng)參??54??
圖4.2?隨樣本維數(shù)變化圖??
?500??Sample?Size??圖4.2?隨樣本維數(shù)變化圖??-?|?一隊(duì);??P:\??s?S?_?"?,??〇? ̄I?I?I?I?I ̄??100?200?300?400?500?
【參考文獻(xiàn)】
本文編號(hào):2844766
【學(xué)位單位】:浙江工商大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位年份】:2018
【中圖分類(lèi)】:O212.4
【部分圖文】:
樣本容量固定時(shí),平均絕對(duì)誤差關(guān)于樣本維數(shù)變化的趨勢(shì)則在圖??4.1-4.4中。取樣本容量rz?=?10情況來(lái)觀察平均絕對(duì)誤差關(guān)于樣本維數(shù)變化的趨??勢(shì)圖,具體結(jié)果展示在圖4.1中。將三個(gè)平均誤差分開(kāi)來(lái)看,其具體圖表展示為??圖42-4.4。從圖中可知,的值在逐漸減小,而M兒&和卻趨于穩(wěn)??定,其他的樣本容量情況也是如此。由此可知,本文提出的幾何型收縮估計(jì)量??隨著樣本維數(shù)的增加效果會(huì)越來(lái)越好。即在總體協(xié)方差矩陣為良態(tài)情形下,??的表現(xiàn)最優(yōu)。??0???WE.3??-??T-??0??3??????〇?q?_??(0?r-??n<?B?8?5?1?1??c?W??S?°"??q?|?_?t?|??°?n?i?i?i?I??100?200?300?400?500??Sample?Dimension?p??圖4.1情形A下平均絕對(duì)誤差隨樣本維數(shù)的變化趨勢(shì)圖??從收縮參數(shù)來(lái)看,兩個(gè)收縮參數(shù)都比較小,幾何型最優(yōu)收縮參數(shù)接近0。幾??何型收縮估計(jì)量公G接近為S?+?W,其平均絕對(duì)誤差最小。這說(shuō)明增加了擾動(dòng)參??54??
圖4.2?隨樣本維數(shù)變化圖??
?500??Sample?Size??圖4.2?隨樣本維數(shù)變化圖??-?|?一隊(duì);??P:\??s?S?_?"?,??〇? ̄I?I?I?I?I ̄??100?200?300?400?500?
【參考文獻(xiàn)】
相關(guān)期刊論文 前1條
1 劉金;唐權(quán)華;余志斌;金煒東;;基于三維直方圖降維和重建的快速最小誤差閾值法[J];電子與信息學(xué)報(bào);2014年08期
本文編號(hào):2844766
本文鏈接:http://sikaile.net/kejilunwen/yysx/2844766.html
最近更新
教材專(zhuān)著