具有信息復(fù)雜性的自適應(yīng)多元時間序列建模及其在金融數(shù)據(jù)中的應(yīng)用
發(fā)布時間:2020-08-31 13:45
VAR/VARX多元時間序列分析方法應(yīng)用廣泛,諸如應(yīng)用于醫(yī)藥、金融、數(shù)據(jù)挖掘等領(lǐng)域。生產(chǎn)過程中同時多個變量發(fā)生的情況下會產(chǎn)生多元時間序列,因此不能僅僅分析單變量時間序列,需要同時分析多個變量之間的依賴關(guān)系。VARX模型允許存在內(nèi)生和外生變量,而VAR模型僅允許存在內(nèi)生變量。VAR/VARX包含多個變量,這些變量通過普通最小二乘或廣義最小二乘回歸方法建模,或者通過彈性網(wǎng)、Lasso VAR或稀疏VAR模型等數(shù)據(jù)挖掘技術(shù)建立模型。建模出現(xiàn)飽和/非限制模型的成本較高,特別是相對于大樣本外預(yù)測更加明顯,因此在預(yù)測未來值時,由于使用了變量的所有過去值,因此從時間跨度到樣本充足性方面均提出了很高的挑戰(zhàn)。模型擬合錯誤會導(dǎo)致模型設(shè)定錯誤出現(xiàn)偏差,目前大多通過P值或信息準則進行模型選擇。如果VAR模型添加的參數(shù)較少,可能會導(dǎo)致參數(shù)估計量有偏或者低估真實的數(shù)據(jù);如果為了提高該模型解釋數(shù)據(jù)的能力,在模型中添加過多的參數(shù),那么信息標準值最終會降低,但方差進而會增加并且導(dǎo)致數(shù)據(jù)的過度擬合。因此信息準則對偏差和方差之間進行了平衡。Akaike信息準則已經(jīng)被廣泛使用,并且?guī)缀醣黄毡檎J為是最佳模型選擇標準。該準則基于兩個重要組成部分,它們衡量擬合模型與原始數(shù)據(jù)之間的擬合偏差,并懲罰偏差以實現(xiàn)模型簡化的原則,而不考慮添加更多參數(shù)所帶來的復(fù)雜性問題。因此,為了解決這一信息準則的缺陷,學(xué)界引入了 Bozdogan的信息復(fù)雜性(ICOMP)準則,通過懲罰模型的復(fù)雜性而不是計算懲罰參數(shù)的數(shù)量,以降低過度擬合數(shù)據(jù)的風(fēng)險來彌補Akaike信息準則的缺陷。Bozdogan通過推廣van Emden(1971)的熵或基于互信息的協(xié)方差復(fù)雜性指數(shù)來推動復(fù)雜性的度量,通過增加缺少擬合項(或兩次負對數(shù)似然)來懲罰對數(shù)似然函數(shù),通過加上一個懲罰項,懲罰增加的自由參數(shù)的復(fù)雜性(Bozdogan,2000)。ICOMP加強了模型解釋數(shù)據(jù)的能力和模型復(fù)雜性之間的權(quán)衡,即模型擬合偏誤和模型復(fù)雜性之間進行權(quán)衡,擬合偏差隨著VAR/VARX的變量數(shù)增加而減少。但另一方面,模型的復(fù)雜性增加,因此應(yīng)該在減少基礎(chǔ)數(shù)據(jù)過度擬合的準則中添加復(fù)雜度的懲罰項。飽和VAR/VARX導(dǎo)致嚴重的過度參數(shù)化,因此變量選擇長期以來一直是高維模型中的一個棘手問題,因為降維主要目標是在最大信息中找到最佳相關(guān)變量子集,以在多變量時間序列預(yù)測中獲得高精度。伴隨可變子集選擇的不同模型評估技術(shù)已被廣泛用于從VAR/VARX模型中檢測和去除冗余不必要變量,因此在競爭模型組合中選擇最合適的近似子集模型是主要方法。假設(shè)存在d個變量,那么應(yīng)該估計2d(dk+1)個VAR模型對應(yīng)不同的變量組合和截距,其中d是變量的數(shù)量,p是潛在的VAR模型的滯后數(shù)。因此選擇最優(yōu)的模型通過以最簡單的方式解釋數(shù)據(jù)并消除所有不必要的變量是主要目標之一,因為這些冗余變量會將噪聲添加到其他重要的必要變量并降低自由度。模型評估標準是競爭模型的品質(zhì)因數(shù)或績效衡量標準。如果我們打算在可變子集選擇之前繼續(xù)擬合整個不受限制的VAR模型,那么估計2d(dk+1)會消耗大量的資源,從而消除“維度的詛咒”。針對以上問題,本文應(yīng)用一種混合自適應(yīng)多變量序列模型,該模型規(guī)避了向量自回歸模型(VAR)的一些缺陷,基于稀疏主成分分析和多元最小二乘回歸的數(shù)據(jù)處理方法,解決了模型內(nèi)生性和非線性的情況,使用Coupla概率主成分分析方法進行降維。論文在不同的協(xié)方差結(jié)構(gòu)下進行蒙特卡洛模擬,分析不同信息準則選擇模型的有效性;運用信息理論復(fù)雜性度量(ICOMP)準則、稀疏主成分分析法以及在高斯誤差分布下的多元正態(tài)回歸模型構(gòu)建智能的統(tǒng)計建模程序,建立了方便使用的三維混合方法。第一章是導(dǎo)言。介紹論文的研究背景和意義,研究框架和方法,文章的創(chuàng)新點和文獻綜述。第二章研究了多元高斯向量自回歸(VAR)模型具有多種協(xié)方差結(jié)構(gòu)情況下信息選擇準則的有效性?紤]了模型誤差項方差具有異質(zhì)性和相關(guān)性結(jié)構(gòu),選擇真實VAR模型中的滯后數(shù)。第二章進行了大量的蒙特卡羅模擬,研究估計逆Fisher信息矩陣(IFIM)的Akaike信息準則(AIC),Schwarz的貝葉斯準則(SBC)、Bozdogan的熵方法和ICOMP方法在不同情景和不同樣本量下模型選擇情況。結(jié)果顯示了 ICOMP準則比其他傳統(tǒng)信息準則對高維時間序列數(shù)據(jù)更加有效。此外,第二章提供了一個使用多元時間序列的實證例子,該研究使用VAR模型考慮了國內(nèi)生產(chǎn)總值與貨幣供應(yīng)量和國庫券(三個月T-bill率)所顯示的貨幣政策變量之間的相互依賴關(guān)系。它顯示實際GDP和M1增加導(dǎo)致利率略有下降,貨幣供應(yīng)量與以GDP衡量的經(jīng)濟增長之間存在顯著的長期關(guān)系。并且在計算脈沖響應(yīng)函數(shù)(IRF)和預(yù)測誤差方差分解(FEVD)之后,從而可以注意到本文所使用的VAR模型是穩(wěn)定的。第二個實證例子使用了相依回歸或VAR(0)的資本資產(chǎn)定價模型,表明了除了GOOG之外,所有使用的資產(chǎn)都與市場顯著相關(guān)。第三章考慮了向量自回歸模型的混合方法。允許模型中含有內(nèi)生和外生變量,從而使用多變量OLS回歸,Tibshirani(1996)提出了用稀疏主成分分析(SPCA)方法降維以提高準確預(yù)測效果。我們首先使用SPCA作為我們的預(yù)處理方法來降維并且選擇特征,而不是用于滯后階選擇。本文構(gòu)建了一種易于使用的三向混合方法,通過基于復(fù)雜度的信息理論度量(ICOMP)標準的巧妙統(tǒng)計建模程序與稀疏主成分分析和具有高斯誤差分布的多元正態(tài)回歸模型相結(jié)合。在選擇最佳VARX滯后參數(shù)時遵循Bozdogan的熵或信息理論測量估計的反Fisher信息矩陣(IFIM)的復(fù)雜度ICOMP標準,蒙特卡羅模擬顯示中該標準優(yōu)于傳統(tǒng)信息標準。論文使用稀疏主成分分析(SPCA)作為最新的最精確的選擇模型,減少了標準普爾500多變量時間序列的維數(shù),并選擇了屬于六個行業(yè)的37種股票的最佳子集。此外,應(yīng)用VARX模型來預(yù)測構(gòu)建的投資組合的價格變動,其中標準普爾500指數(shù)被視為VARX模型的外生回歸量;我們將單變量自回歸分布滯后模型ADL應(yīng)用于的房地產(chǎn)住房價格,闡明房地產(chǎn)泡沫的成因以及如何使用自回歸(AR)和自回歸分布滯后(ADL)模型來解決它。VARX在均方根誤差(RMSE)標準方面優(yōu)于ARX模型。第四章估計了四種不同股票收益價格之間的非線性相關(guān)性。使用copula模型來研究變量之間的依賴關(guān)系結(jié)構(gòu),Copula模型增強了降維能力并捕獲了模型中的厚尾性,其中高斯假設(shè)未能解釋尾部依賴性。通過考慮這些變量的聯(lián)合和邊際分布,將感興趣的原始變量映射到更易于管理的變量,然后獲得這些變量之間的相關(guān)結(jié)構(gòu)。我們使用一致信息復(fù)雜度(CICOMP)標準以及其他AIC信息準則,應(yīng)用于幾個Copula模型擬合股票收益價格數(shù)據(jù)集的組合中,以選擇最佳的Copula函數(shù)模型。在正確指定擬合模型的情況下,CICOMP主導(dǎo)了 AIC類型標準。第五章是全文的研究結(jié)論及對未來研究的展望。本論文的主要創(chuàng)新為:首次采用基于多變量OLS-VARX回歸模型和信息復(fù)雜度ICOMP準則及SPCA混合參數(shù)方法進行參數(shù)降維和樣本外預(yù)測。在正態(tài)分布假設(shè)下,SPCA方法結(jié)合信息復(fù)雜度ICOMP準則將用于降維和模型選擇,因此在擬合和選擇500 SP500股票價格的最優(yōu)子集VARX前提下,分析得到VARX優(yōu)于ARX模型,進而預(yù)測未來值;首次研究了不同協(xié)方差結(jié)構(gòu)下的VAR/VARX模型中,信息復(fù)雜度ICOMP模型選擇標準優(yōu)于其他常規(guī)標準的效果;首次使用ICOMP作為選擇最佳擬合Copula的模型選擇標準,來將copula模型的非線性依賴性捕獲到股票收益組合中。
【學(xué)位單位】:山東大學(xué)
【學(xué)位級別】:博士
【學(xué)位年份】:2019
【中圖分類】:F224;F831.51
本文編號:2808884
【學(xué)位單位】:山東大學(xué)
【學(xué)位級別】:博士
【學(xué)位年份】:2019
【中圖分類】:F224;F831.51
本文編號:2808884
本文鏈接:http://sikaile.net/jingjifazhanlunwen/2808884.html
最近更新
教材專著