大規(guī)模數(shù)據(jù)下基于充分降維的Leverage重要性抽樣方法
發(fā)布時間:2021-02-21 08:40
隨著信息技術(shù)的飛速發(fā)展,大規(guī)模數(shù)據(jù)在短時間內(nèi)搜集并儲存下來,為分析決策提供了巨大的信息量,也給統(tǒng)計建模帶來了一定難度。對于樣本容量大、變量個數(shù)少的數(shù)據(jù),Leverage重要性抽樣是一個簡便可行的方法。本文發(fā)現(xiàn),該方法中度量樣本重要性的Leverage分數(shù)與因變量無關(guān),而且在維度較大的情形下對樣本沒有區(qū)分程度,使得估計結(jié)果較差。為了同時考慮因變量和維度的影響,本文提出了基于充分降維的Leverage重要性抽樣方法。該方法以不損失信息為前提,在充分降維的空間內(nèi)重新計算Leverage分數(shù),使得抽樣更具有代表性。模擬數(shù)據(jù)分析顯示,在樣本容量較大的復雜數(shù)據(jù)中,相比于原始的Leverage重要性抽樣方法,本文提出的方法可以降低估計的均方誤差。三個實際數(shù)據(jù)也證實了該方法的可行性和有效性。
【文章來源】:統(tǒng)計研究. 2020,37(03)北大核心CSSCI
【文章頁數(shù)】:15 頁
本文編號:3044112
【文章來源】:統(tǒng)計研究. 2020,37(03)北大核心CSSCI
【文章頁數(shù)】:15 頁
本文編號:3044112
本文鏈接:http://sikaile.net/guanlilunwen/tongjijuecelunwen/3044112.html
最近更新
教材專著