基于損失函數(shù)的抽樣方法比較研究
發(fā)布時(shí)間:2020-12-30 03:46
隨著數(shù)據(jù)集種類的復(fù)雜化,涌現(xiàn)出來(lái)多種不同于傳統(tǒng)的抽樣方法。因此評(píng)價(jià)不同的抽樣方法顯得尤為重要,但是目前大多數(shù)文獻(xiàn)都是對(duì)抽樣估計(jì)量的穩(wěn)健性進(jìn)行評(píng)價(jià),該方法得到的估計(jì)量只能使得估計(jì)量與真值的差異保持穩(wěn)定,至于該估計(jì)量帶來(lái)的精確的損失值是不得而知的,只能在日常生產(chǎn)中進(jìn)行經(jīng)驗(yàn)積累,是否存在一個(gè)估計(jì)量會(huì)使得損失值減少也是不得而知的。本篇文章引入損失函數(shù)來(lái)評(píng)價(jià)不同的抽樣方法,將損失函數(shù)最小化設(shè)定為目標(biāo)函數(shù),根據(jù)已有的樣本信息,得到新的估計(jì)量。在使用損失函數(shù)評(píng)價(jià)抽樣方法的過(guò)程中,逐步放寬假設(shè)使得該方法在實(shí)際生產(chǎn)中也能進(jìn)行應(yīng)用。首先假設(shè)總體分布是已知的包括分布中的參數(shù),這樣可以精確的計(jì)算出估計(jì)量與真實(shí)值之間的損失;但是在實(shí)際生產(chǎn)中是不可能得到總體分布的參數(shù)值的,因此將假設(shè)放寬到總體分布已知但是參數(shù)未知的情況;最后則為了提高估計(jì)量的精度通過(guò)多次抽樣計(jì)算平均損失,來(lái)衡量該估計(jì)量的保守性。根據(jù)目前抽樣方法的分類選取了等概率抽樣,不等概率抽樣,非概率抽樣和機(jī)器抽樣。同時(shí)選取了常用的四類損失函數(shù),包括:絕對(duì)值損失函數(shù),平方損失函數(shù),逆正態(tài)損失函數(shù)和逆Gamma損失函數(shù)。采用以上損失函數(shù)來(lái)衡量估計(jì)量帶來(lái)的損失值,...
【文章來(lái)源】:山西財(cái)經(jīng)大學(xué)山西省
【文章頁(yè)數(shù)】:64 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
積分損失函數(shù)
山西財(cái)經(jīng)大學(xué)碩士學(xué)位論文不等概率抽樣外,其余的樣本分布全部位于總體分布下方的,基本上樣本分布與總體分布重合,也就是說(shuō)各類方法的信息損失全部集中表現(xiàn)在分布的頂部。整體上看簡(jiǎn)單隨機(jī)抽樣的概率密度與總體概率密度相近,重合面積較大;當(dāng)樣本量為 210 時(shí),PaiPS 抽樣的概率密度函數(shù)與總體概率密度相差較大,因此重合面積是相對(duì)于其他兩種抽樣方法中最小的;此外隨著樣本量的增加,重合面積也逐漸增加,在樣本量為 1500 時(shí),樣本分布和總體的概率密度基本重合,配額抽樣的重合面積相對(duì)而言較小。圖 4.5 為自助法在概率抽樣下的樣本分布,由于刀切法是在原有樣本下輪流剔除一個(gè)樣本計(jì)算均值,因此其樣本分布應(yīng)與原始樣本相同,在這里不重復(fù)作圖。
山西財(cái)經(jīng)大學(xué)碩士學(xué)位論文不等概率抽樣外,其余的樣本分布全部位于總體分布下方的,基本上樣本分布與總體分布重合,也就是說(shuō)各類方法的信息損失全部集中表現(xiàn)在分布的頂部。整體上看簡(jiǎn)單隨機(jī)抽樣的概率密度與總體概率密度相近,重合面積較大;當(dāng)樣本量為 210 時(shí),PaiPS 抽樣的概率密度函數(shù)與總體概率密度相差較大,因此重合面積是相對(duì)于其他兩種抽樣方法中最小的;此外隨著樣本量的增加,重合面積也逐漸增加,在樣本量為 1500 時(shí),樣本分布和總體的概率密度基本重合,配額抽樣的重合面積相對(duì)而言較小。圖 4.5 為自助法在概率抽樣下的樣本分布,由于刀切法是在原有樣本下輪流剔除一個(gè)樣本計(jì)算均值,因此其樣本分布應(yīng)與原始樣本相同,在這里不重復(fù)作圖。
【參考文獻(xiàn)】:
期刊論文
[1]Mlinex損失函數(shù)下艾拉姆咖分布的Bayes估計(jì)[J]. 范梓淼,周菊玲. 統(tǒng)計(jì)與決策. 2017(07)
[2]逆指數(shù)分布參數(shù)估計(jì)的損失函數(shù)和風(fēng)險(xiǎn)函數(shù)的Bayes推斷[J]. 陽(yáng)連武. 宜春學(xué)院學(xué)報(bào). 2016(12)
[3]住戶調(diào)查中戶內(nèi)樣本抽樣方法的比較研究[J]. 呂萍. 數(shù)理統(tǒng)計(jì)與管理. 2016(01)
[4]基于指數(shù)損失函數(shù)的參數(shù)設(shè)計(jì)[J]. 文平,賈達(dá)明. 常州工學(xué)院學(xué)報(bào). 2015(Z1)
[5]有輔助信息下總體均值的一類新比估計(jì)量[J]. 薛雨霞,閆在在. 內(nèi)蒙古工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版). 2015(01)
[6]連續(xù)性抽樣調(diào)查中總體均值的估計(jì)[J]. 高莉菁. 統(tǒng)計(jì)與決策. 2015(01)
[7]比估計(jì)方法下Eichhorn and Hayre模型的參數(shù)估計(jì)[J]. 劉媛媛,呂雄,白樹葉,曹學(xué)勤,李樹華. 內(nèi)蒙古師范大學(xué)學(xué)報(bào)(自然科學(xué)漢文版). 2014(06)
[8]在線社交媒體數(shù)據(jù)抽樣方法的比較研究[J]. 崔穎安,李雪,王志曉,張德運(yùn). 計(jì)算機(jī)學(xué)報(bào). 2014(08)
[9]PPS和簡(jiǎn)單隨機(jī)抽樣估計(jì)效率的實(shí)證檢驗(yàn)[J]. 周慶元. 統(tǒng)計(jì)與決策. 2014(01)
[10]非抽樣誤差視角下普查涵蓋誤差及其模型研究[J]. 陶然. 統(tǒng)計(jì)研究. 2012(12)
博士論文
[1]復(fù)雜數(shù)據(jù)的統(tǒng)計(jì)推斷:時(shí)間序列、抽樣和函數(shù)型數(shù)據(jù)[D]. 王江艷.蘇州大學(xué) 2016
碩士論文
[1]機(jī)器學(xué)習(xí)中損失函數(shù)問(wèn)題研究[D]. 蘇美紅.西北大學(xué) 2015
[2]在半?yún)?shù)密度函數(shù)比模型下關(guān)于兩總體均值差檢驗(yàn)的研究[D]. 方芳.南京財(cái)經(jīng)大學(xué) 2014
[3]Jackknife估計(jì)與Bootstrap估計(jì)的理論與應(yīng)用[D]. 王娟.揚(yáng)州大學(xué) 2007
[4]幾類分布的參數(shù)估計(jì)的損失函數(shù)和風(fēng)險(xiǎn)函數(shù)的Bayes推斷[D]. 桑紅芳.中南大學(xué) 2006
本文編號(hào):2946922
【文章來(lái)源】:山西財(cái)經(jīng)大學(xué)山西省
【文章頁(yè)數(shù)】:64 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
積分損失函數(shù)
山西財(cái)經(jīng)大學(xué)碩士學(xué)位論文不等概率抽樣外,其余的樣本分布全部位于總體分布下方的,基本上樣本分布與總體分布重合,也就是說(shuō)各類方法的信息損失全部集中表現(xiàn)在分布的頂部。整體上看簡(jiǎn)單隨機(jī)抽樣的概率密度與總體概率密度相近,重合面積較大;當(dāng)樣本量為 210 時(shí),PaiPS 抽樣的概率密度函數(shù)與總體概率密度相差較大,因此重合面積是相對(duì)于其他兩種抽樣方法中最小的;此外隨著樣本量的增加,重合面積也逐漸增加,在樣本量為 1500 時(shí),樣本分布和總體的概率密度基本重合,配額抽樣的重合面積相對(duì)而言較小。圖 4.5 為自助法在概率抽樣下的樣本分布,由于刀切法是在原有樣本下輪流剔除一個(gè)樣本計(jì)算均值,因此其樣本分布應(yīng)與原始樣本相同,在這里不重復(fù)作圖。
山西財(cái)經(jīng)大學(xué)碩士學(xué)位論文不等概率抽樣外,其余的樣本分布全部位于總體分布下方的,基本上樣本分布與總體分布重合,也就是說(shuō)各類方法的信息損失全部集中表現(xiàn)在分布的頂部。整體上看簡(jiǎn)單隨機(jī)抽樣的概率密度與總體概率密度相近,重合面積較大;當(dāng)樣本量為 210 時(shí),PaiPS 抽樣的概率密度函數(shù)與總體概率密度相差較大,因此重合面積是相對(duì)于其他兩種抽樣方法中最小的;此外隨著樣本量的增加,重合面積也逐漸增加,在樣本量為 1500 時(shí),樣本分布和總體的概率密度基本重合,配額抽樣的重合面積相對(duì)而言較小。圖 4.5 為自助法在概率抽樣下的樣本分布,由于刀切法是在原有樣本下輪流剔除一個(gè)樣本計(jì)算均值,因此其樣本分布應(yīng)與原始樣本相同,在這里不重復(fù)作圖。
【參考文獻(xiàn)】:
期刊論文
[1]Mlinex損失函數(shù)下艾拉姆咖分布的Bayes估計(jì)[J]. 范梓淼,周菊玲. 統(tǒng)計(jì)與決策. 2017(07)
[2]逆指數(shù)分布參數(shù)估計(jì)的損失函數(shù)和風(fēng)險(xiǎn)函數(shù)的Bayes推斷[J]. 陽(yáng)連武. 宜春學(xué)院學(xué)報(bào). 2016(12)
[3]住戶調(diào)查中戶內(nèi)樣本抽樣方法的比較研究[J]. 呂萍. 數(shù)理統(tǒng)計(jì)與管理. 2016(01)
[4]基于指數(shù)損失函數(shù)的參數(shù)設(shè)計(jì)[J]. 文平,賈達(dá)明. 常州工學(xué)院學(xué)報(bào). 2015(Z1)
[5]有輔助信息下總體均值的一類新比估計(jì)量[J]. 薛雨霞,閆在在. 內(nèi)蒙古工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版). 2015(01)
[6]連續(xù)性抽樣調(diào)查中總體均值的估計(jì)[J]. 高莉菁. 統(tǒng)計(jì)與決策. 2015(01)
[7]比估計(jì)方法下Eichhorn and Hayre模型的參數(shù)估計(jì)[J]. 劉媛媛,呂雄,白樹葉,曹學(xué)勤,李樹華. 內(nèi)蒙古師范大學(xué)學(xué)報(bào)(自然科學(xué)漢文版). 2014(06)
[8]在線社交媒體數(shù)據(jù)抽樣方法的比較研究[J]. 崔穎安,李雪,王志曉,張德運(yùn). 計(jì)算機(jī)學(xué)報(bào). 2014(08)
[9]PPS和簡(jiǎn)單隨機(jī)抽樣估計(jì)效率的實(shí)證檢驗(yàn)[J]. 周慶元. 統(tǒng)計(jì)與決策. 2014(01)
[10]非抽樣誤差視角下普查涵蓋誤差及其模型研究[J]. 陶然. 統(tǒng)計(jì)研究. 2012(12)
博士論文
[1]復(fù)雜數(shù)據(jù)的統(tǒng)計(jì)推斷:時(shí)間序列、抽樣和函數(shù)型數(shù)據(jù)[D]. 王江艷.蘇州大學(xué) 2016
碩士論文
[1]機(jī)器學(xué)習(xí)中損失函數(shù)問(wèn)題研究[D]. 蘇美紅.西北大學(xué) 2015
[2]在半?yún)?shù)密度函數(shù)比模型下關(guān)于兩總體均值差檢驗(yàn)的研究[D]. 方芳.南京財(cái)經(jīng)大學(xué) 2014
[3]Jackknife估計(jì)與Bootstrap估計(jì)的理論與應(yīng)用[D]. 王娟.揚(yáng)州大學(xué) 2007
[4]幾類分布的參數(shù)估計(jì)的損失函數(shù)和風(fēng)險(xiǎn)函數(shù)的Bayes推斷[D]. 桑紅芳.中南大學(xué) 2006
本文編號(hào):2946922
本文鏈接:http://sikaile.net/jingjilunwen/jingjiguanlilunwen/2946922.html
最近更新
教材專著