左截斷數(shù)據(jù)下條件分位數(shù)和線性模型的估計以及變量選擇
發(fā)布時間:2020-02-29 04:39
【摘要】:在數(shù)據(jù)分析中,我們常常碰到右刪失或者左截斷數(shù)據(jù)問題,它們在生存分析、醫(yī)學統(tǒng)計、天文學、經濟學以及工程可靠性統(tǒng)計中具有重要應用。過去的大部分文獻討論的是右刪失數(shù)據(jù),而近十幾年來左截斷數(shù)據(jù)越來越受到大家的關注。左截斷數(shù)據(jù)下,有很多文獻都構造了條件分布函數(shù)、條件分位數(shù)和回歸函數(shù)的估計量,建立了它們的大樣本性質。本文在左截斷數(shù)據(jù)下,分別研究了條件分位數(shù)的估計方法和線性回歸模型中的參數(shù)估計和變量選擇方法,以便進一步補充和完善相關的方法和理論。具體涉及以下幾個方面。本文的第二章在左截斷獨立數(shù)據(jù)下,構造了條件分布函數(shù)、條件概率密度函數(shù)和條件分位數(shù)函數(shù)的加權雙核局部線性估計量,建立了這些估計量的漸近正態(tài)性。YuJones(1998)構造了條件分布函數(shù)的雙核局部線性(DKLL)估計量,并在完全數(shù)據(jù)下,研究了條件分位數(shù)的雙核局部線性(DKLL)估計量的大樣本性質。由于雙核局部線性DKLL估計方法是用局部線性方法得到的,因此它和核估計方法Nadaraya-Watson(N-W)相比,具有一些局部多項式估計方法的良好的性質,比如邊界點估計上的自動調節(jié)等特性。然而,到目前為止,即使對獨立樣本,也沒有看到相關文獻在左截斷數(shù)據(jù)下,研究條件分布函數(shù)和條件分位數(shù)的雙核局部線性DKLL估計量,因此受YuJones(1998)文章的啟發(fā),本論文的第二章在左截斷獨立樣本下,利用雙核局部線性方法構造了條件分布函數(shù)、條件概率密度函數(shù)和條件分位數(shù)的非參估計量,進而建立了它們的漸近正態(tài)性質。在左截斷獨立數(shù)據(jù)下,設{(Xk,Yk,Tk,),k≥ 1}來自總體(X,Y,T)的一列隨機向量,這里T為截斷變量。我們假設T和(X,Y)是相互獨立的,并且T有連續(xù)的分布函數(shù)。在左截斷模型中,對于i= 1,2,...,N,生存時間Yi被截斷變量Ti干擾,當Yi ≥ Ti時,Yi和Ti都能觀察到,而當YiTi時,Yi和Ti都不能觀察到。由于截斷的發(fā)生,N是未知的,n是實際觀察到的樣本容量,設θ = P(Y ≥T)表示隨機變量Y被觀測到的概率。根據(jù)YuJones提出的條件分布函數(shù)的雙核局部線性估計方法,我們知道F(y|x)的WDKLL估計量Fh1,h2(y|x)=β0是下列優(yōu)化問題的解從而ζp(x)的加權雙核局部線性估計量為通過代數(shù)化簡,得進而條件概率密度函數(shù)f(y|x)的估計為其中于是我們可以分別建立Fh1,h2(y|x),fh1,h2(y|x),ξp,n(x)的漸近正態(tài)性,即此外,有限樣本下的數(shù)值模擬得出的結論也與我們的理論結果一致。第二章的結果已發(fā)表于《Communications in Statistics-Theory and Methods》。左截斷獨立樣本的假設在某些情況下可能是合理的,例如,生存分析中的數(shù)據(jù)來自一個互不相干的群體時。然而,在生存分析中,我們碰到的數(shù)據(jù)結構很多是相依的。例如,從從家庭成員中采取的樣本數(shù)據(jù),還有對同一個體反復地測量得到的樣本數(shù)據(jù),更常見的是隨著時間記錄獲取的樣本數(shù)據(jù),集群內部個體的壽命通常也是相關的(見KangKoehler(1997),Cai et al(2000))。由此可見,在相依假設下,研究左截斷模型的統(tǒng)計推斷問題有著十分深刻的理論和實際意義。本論文的第三章在左截斷數(shù)據(jù)下,利用雙核局部線性估計方法構造了條件分布函數(shù),條件分位數(shù)的WKDLL估計量,并且在觀察樣本為α混合序列的情況下,利用混合序列的相關概率不等式和Bernstein分塊方法,建立上述估計量的漸近正態(tài)性質,得到Fh1,h2(y|x),ξp,n(x)的如下結果此外,有限樣本下的數(shù)值模擬結果顯示,我們的估計比一般的核估計更好,從而也證實了我們方法的有效性。第三章的內容已投稿到《數(shù)學學報》(中文版),目前在審稿中。分位數(shù)回歸方法最初由KoenkerBassett(1978)提出,之后在計量經濟學、社會科學以及生物醫(yī)藥等各個領域中都有廣泛的應用。Koenker(2005)的專著對QR方法進行了詳細的討論。QR方法的不足之處是估計的效率有時會很低,于是ZouYuan(2008)在線性模型的背景下,提出了綜合不同點處的分位數(shù)的復合分位數(shù)回歸(CQR)方法,來估計線性模型的系數(shù)。CQR方法一方面繼承了QR方法的穩(wěn)健性,另一方面顯著的改進了QR估計的效率,是一種有效且穩(wěn)健的參數(shù)估計方法。近年來,國內外關于QR和CQR方法的研究非常熱門。但是,就我們所知,很少有文獻研究左截斷數(shù)據(jù)下的復合分位數(shù)問題。受ZouYuan(2008)文章的啟發(fā),本文的第四章在左截斷數(shù)據(jù)下,構造了線性回歸模型的回歸系數(shù)的復合分位數(shù)估計量,然后我們利用適應性Lasso懲罰方法,來建立穩(wěn)健的模型,從而得到適應性Lasso懲罰復合分位數(shù)回歸估計量的Oracle性質。在左截斷數(shù)據(jù)下,我們考慮下面的線性回歸模型:其中X是一個p ×1的協(xié)變量隨機向量,β是p ×1的未知參數(shù)的向量,ε是一個隨機誤差項,它與協(xié)變量X是相互獨立。則回歸系數(shù)β的復合分位數(shù)估計量βCQR是下列優(yōu)化問題的解基于參數(shù)的復合分位數(shù)回歸估計βCQR,結合適應性的lasso懲罰函數(shù)來進行變量選擇和參數(shù)估計,則適應性的lasso懲罰復合分位數(shù)回歸估計可以記作βACQR,它是下列優(yōu)化問題的解在一定的條件下,我們建立了βCQR的漸近性質并且建立了βACQR的收斂速度和Oracle性質((?)-相合性)(?)(變量選擇相合性)(?)(漸近正態(tài)性)(?)最后,我們通過有限樣本下的數(shù)值模擬研究,展示了我們提出的方法的優(yōu)點。第四章的內容已投稿到《Statistical Papers》,已經小修,等待接受。由于左截斷數(shù)據(jù)及其他不完全數(shù)據(jù)下還有許多統(tǒng)計推斷問題等待我們進一步探討和研究。本文的第五章對未來的工作做了如下的展望。一、左截斷相依數(shù)據(jù)下線性回歸模型和半參數(shù)變系數(shù)部分線性模型的復合分位數(shù)回歸問題;二、左截斷右刪失同時發(fā)生數(shù)據(jù)下條件分布函數(shù)和條件分位數(shù)的雙核局部線性估計,以及分位數(shù)回歸問題。
【圖文】:
§3.4.2正態(tài)性驗證逡逑在這一小節(jié)中,我們通過正態(tài)Q-Q圖來比較兩個估計量的漸近正態(tài)性效果。在逡逑圖3.3中,取P邋=邋0.5,邋0邋?邋60%以及n邋=邋500,在:r邋=邋1和p邋=邋0.5下,分別畫出N-W估逡逑計量以及WDKLL估計量的正態(tài)Q-Q圖;在圖3.4中,。疱澹藉澹埃岛停铄澹藉澹担埃埃謩e逡逑在6/邋30%和。90%下,畫出了邋6.5(1)的WDKLL估計量的正態(tài)Q-Q圖;圖3.5中,逡逑取P邋=邋0.5和0邋60%,分別在n邋=邋200和=邋800下,畫出了N希擔ǎ保┑模祝模耍蹋坦厘義霞屏康惱眩淹跡煌跡常常跡常抵械氖荻際腔冢灣澹藉澹擔埃暗鬧馗礎e義洗油跡常撤⑾鄭諳嗤南亂約埃邢攏祝模耍蹋坦蘭屏康慕ソ緣膩義閑Ч齲危墜蘭屏康慕ソ緣男Ч;从哇E常床荒芽闖觶保釹嗤保霸藉義洗,,WDKLL固m屏康慕ソ緣男Ч膠;从哇E常悼闖觶繃夏客保祝模耍蹋坦厘義霞屏康慕ソ孕Ч孀牛鈐醬,效果阅z謾e義希矗靛義
本文編號:2583662
【圖文】:
§3.4.2正態(tài)性驗證逡逑在這一小節(jié)中,我們通過正態(tài)Q-Q圖來比較兩個估計量的漸近正態(tài)性效果。在逡逑圖3.3中,取P邋=邋0.5,邋0邋?邋60%以及n邋=邋500,在:r邋=邋1和p邋=邋0.5下,分別畫出N-W估逡逑計量以及WDKLL估計量的正態(tài)Q-Q圖;在圖3.4中,。疱澹藉澹埃岛停铄澹藉澹担埃埃謩e逡逑在6/邋30%和。90%下,畫出了邋6.5(1)的WDKLL估計量的正態(tài)Q-Q圖;圖3.5中,逡逑取P邋=邋0.5和0邋60%,分別在n邋=邋200和=邋800下,畫出了N希擔ǎ保┑模祝模耍蹋坦厘義霞屏康惱眩淹跡煌跡常常跡常抵械氖荻際腔冢灣澹藉澹擔埃暗鬧馗礎e義洗油跡常撤⑾鄭諳嗤南亂約埃邢攏祝模耍蹋坦蘭屏康慕ソ緣膩義閑Ч齲危墜蘭屏康慕ソ緣男Ч;从哇E常床荒芽闖觶保釹嗤保霸藉義洗,,WDKLL固m屏康慕ソ緣男Ч膠;从哇E常悼闖觶繃夏客保祝模耍蹋坦厘義霞屏康慕ソ孕Ч孀牛鈐醬,效果阅z謾e義希矗靛義
本文編號:2583662
本文鏈接:http://sikaile.net/shoufeilunwen/jckxbs/2583662.html
最近更新
教材專著