大數(shù)據(jù)下Leverage重要性抽樣方法的穩(wěn)健改進(jìn)
本文關(guān)鍵詞:大數(shù)據(jù)下Leverage重要性抽樣方法的穩(wěn)健改進(jìn)
更多相關(guān)文章: 大數(shù)據(jù) 重要性抽樣 異質(zhì)性問(wèn)題 協(xié)方差矩陣
【摘要】:大數(shù)據(jù)以其巨大的樣本容量或超高的變量維度使得直接計(jì)算變得不再可能,如何有效地抽取一個(gè)合適的計(jì)算樣本是值得思考的問(wèn)題。本文借鑒Leverage重要性抽樣的思想,提出了兩種穩(wěn)健的改進(jìn)抽樣算法,不僅有效地抽取了代表性高的計(jì)算樣本進(jìn)行回歸估計(jì),還規(guī)避了方差大和異質(zhì)性導(dǎo)致協(xié)方差矩陣估計(jì)不準(zhǔn)的問(wèn)題。模擬數(shù)據(jù)的分析顯示,相比于Ma(2015)的方法,本文提出的方法具有更為優(yōu)良的估計(jì)結(jié)果。
【作者單位】: 對(duì)外經(jīng)濟(jì)貿(mào)易大學(xué)統(tǒng)計(jì)學(xué)院;對(duì)外經(jīng)濟(jì)貿(mào)易大學(xué)大數(shù)據(jù)與風(fēng)險(xiǎn)管理研究中心;中國(guó)人民大學(xué)統(tǒng)計(jì)學(xué)院;中國(guó)人民大學(xué)應(yīng)用統(tǒng)計(jì)研究中心;
【關(guān)鍵詞】: 大數(shù)據(jù) 重要性抽樣 異質(zhì)性問(wèn)題 協(xié)方差矩陣
【基金】:對(duì)外經(jīng)濟(jì)貿(mào)易大學(xué)學(xué)科建設(shè)專項(xiàng)經(jīng)費(fèi)“大數(shù)據(jù)下Leverage重要性抽樣方法的穩(wěn)健改進(jìn)”(XK2016107) 對(duì)外經(jīng)濟(jì)貿(mào)易大學(xué)中央高;究蒲袠I(yè)務(wù)費(fèi)專項(xiàng)資金資助“高維成分?jǐn)?shù)據(jù)的稀硫分類算法及應(yīng)用”(15QD15) 對(duì)外經(jīng)濟(jì)貿(mào)易大學(xué)中國(guó)企業(yè)“走出去”協(xié)同創(chuàng)新中心科研項(xiàng)目“大數(shù)據(jù)與投資選點(diǎn)”(201504YY006A)資助
【分類號(hào)】:F224
【正文快照】: 一、引言 隨著數(shù)據(jù)采集技術(shù)的不斷增強(qiáng)和儲(chǔ)存成本的不斷降低,數(shù)據(jù)量正在以級(jí)數(shù)方式增長(zhǎng)并被人們儲(chǔ)存,大數(shù)據(jù)以前所未有的方式影響并改變著我們的工作和生活。 數(shù)據(jù)量大是大數(shù)據(jù)的首要特征。如果我們?cè)噲D利用全部數(shù)據(jù)研究解釋變量和響應(yīng)變量之間的關(guān)系,并進(jìn)行樣本預(yù)測(cè),那么巨
【參考文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前1條
1 Jianqing Fan;Fang Han;Han Liu;;Challenges of Big Data analysis[J];National Science Review;2014年02期
【共引文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前9條
1 秦磊;熊巍;田茂再;;大數(shù)據(jù)下Leverage重要性抽樣方法的穩(wěn)健改進(jìn)[J];統(tǒng)計(jì)研究;2016年08期
2 陳夏;閆莉;;廣義線性模型的大樣本理論及其研究進(jìn)展[J];陜西師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2016年03期
3 王東雨;宇文姝麗;;國(guó)外精準(zhǔn)醫(yī)療研究可視化分析及啟示[J];醫(yī)學(xué)信息學(xué)雜志;2016年01期
4 孟潤(rùn)堂;羅藝;宇傳華;邱杰;周達(dá);;健康大數(shù)據(jù)在公共衛(wèi)生領(lǐng)域中的應(yīng)用與挑戰(zhàn)[J];中國(guó)全科醫(yī)學(xué);2015年35期
5 馬雙鴿;王小燕;方匡南;;大數(shù)據(jù)的整合分析方法[J];統(tǒng)計(jì)研究;2015年11期
6 錢宇華;成紅紅;梁新彥;王建新;;大數(shù)據(jù)關(guān)聯(lián)關(guān)系度量研究綜述[J];數(shù)據(jù)采集與處理;2015年06期
7 李生慧;徐志偉;鄭志杰;;對(duì)醫(yī)學(xué)信息大數(shù)據(jù)趨勢(shì)下醫(yī)學(xué)統(tǒng)計(jì)學(xué)教學(xué)的幾點(diǎn)思考[J];新校園(上旬);2015年10期
8 LIU JingYuan;ZHONG Wei;LI RunZe;;A selective overview of feature screening for ultrahigh-dimensional data[J];Science China(Mathematics);2015年10期
9 梁吉業(yè);馮晨嬌;宋鵬;;大數(shù)據(jù)相關(guān)分析綜述[J];計(jì)算機(jī)學(xué)報(bào);2016年01期
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前3條
1 陳守東;易曉n,
本文編號(hào):825287
本文鏈接:http://sikaile.net/jingjilunwen/hongguanjingjilunwen/825287.html