多維貧困視角下中國農(nóng)村貧困家庭的識別研究
【學(xué)位授予單位】:首都經(jīng)濟貿(mào)易大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:F323.8
【圖文】:
圖 4.1 特征指標(biāo)的重要性(2)選取對模型有重要影響的指標(biāo)進行建模根據(jù)上述理由闡述并不是所有變量都會進入最終的隨機森林模型,篩選之后,進隨機森林模型的有人均年收入、醫(yī)療保險、居住環(huán)境、受教育程度、生活負(fù)擔(dān)、養(yǎng)老險、掌握技能和電器資產(chǎn)等 8 個變量。根據(jù)已有文獻(xiàn)劉波[23](2017)主觀貧困并不等于客觀貧困,有些時候往往還有更豐富的內(nèi)涵,比客觀貧困更能夠代表貧困家庭的情所以選擇主客觀法相結(jié)合主要是因為,單獨的客觀貧困只能看到貧困家庭的物質(zhì)方面需求和匱乏,而精神方面的貧困缺失,會損失很多有用的信息,繼而不能過全面很好對貧困戶進行識別。所以對主觀指標(biāo)包括居住環(huán)境、生活負(fù)擔(dān)和掌握技能的入選,是方便了筆者在做實證分析的經(jīng)驗。4.3.2 農(nóng)村多維貧困的隨機森林識別模型本小節(jié)主要是對建立農(nóng)村多維貧困的隨機森林識別模型,之前收集到的數(shù)據(jù)集5563 條觀測,訓(xùn)練集為 4564 條,測試集為 999 條,預(yù)測集數(shù)據(jù)是在建立模型之前預(yù)
圖 4.2 Mtry=2 誤差圖由圖 4.2Mtry=2 時的誤差圖可知,當(dāng) ntree 的值大概大于 400 之后,模型誤差趨穩(wěn)定,沒有特別大的波動,基本穩(wěn)定在一個定值附近,所以我們可以將模型中的 n的值大致確定為 400 左右,最佳隨機森林模型就選擇當(dāng) Mtry=2。由圖 4.3 當(dāng) Mtry=2 時的誤差圖時可知,當(dāng) ntree 的值大概在大于 400 之后,模型差趨于穩(wěn)定,沒有特別大的波動,基本穩(wěn)定在一個定值附近,當(dāng) Mtry=3 時的誤差圖可知,當(dāng) ntree 的值大概在大于 400 之后,模型誤差趨于穩(wěn)定,沒有特別大的波動,本穩(wěn)定在一個定值附近,所以我們可以將模型中的 ntree 的值大致確定為 400 左右,此來達(dá)到最佳隨機森林模型。通過以上分析之后,加上之前所述使用全變量做隨機森林模型,通過上文可知,n的值為 400 的模型具有很好的穩(wěn)定性,但是決策數(shù)個數(shù)是多少,還沒有最終的確定以本文決定最優(yōu)模型為決策樹節(jié)點處變量個數(shù)為 2 和 3,模型中 ntree 的值為 400 的型,通過建立模型,然后再比較哪一個模型是比較好的。建立隨機森林模型過程及顯結(jié)果如表 4.4,部分重要變量建立隨機森林模型結(jié)果如表 4.4 和表 4.5。
圖 4.3 Mtry=3 誤差圖表 4.4 Mtry=2 全部變量的隨機森林模型的混淆矩陣混淆矩陣預(yù)測值系統(tǒng)誤差 模型內(nèi)誤差0 1真實值0 1660 328 0.165012.4%1 238 2338 0.0924表 4.5 Mtry=3 全部變量的隨機森林模型的混淆矩陣混淆矩陣預(yù)測值系統(tǒng)誤差 模型內(nèi)誤差0 1真實值0 1653 335 0.168512.62%1 241 2335 0.0936表 4.6 Mtry=2 重要變量的隨機森林模型的混淆矩陣
【參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 高艷云;馬瑜;;多維框架下中國家庭貧困的動態(tài)識別[J];統(tǒng)計研究;2013年12期
2 王艷慧;錢樂毅;段福洲;;縣級多維貧困度量及其空間分布格局研究——以連片特困區(qū)扶貧重點縣為例[J];地理科學(xué);2013年12期
3 王素霞;王小林;;中國多維貧困測量[J];中國農(nóng)業(yè)大學(xué)學(xué)報(社會科學(xué)版);2013年02期
4 高艷云;;中國城鄉(xiāng)多維貧困的測度及比較[J];統(tǒng)計研究;2012年11期
5 陸康強;;要素均衡:人類發(fā)展指數(shù)的算法改進與實證研究[J];統(tǒng)計研究;2012年10期
6 王小林;;貧困標(biāo)準(zhǔn)及全球貧困狀況[J];經(jīng)濟研究參考;2012年55期
7 方迎風(fēng);;中國貧困的多維測度[J];當(dāng)代經(jīng)濟科學(xué);2012年04期
8 郭建宇;吳國寶;;基于不同指標(biāo)及權(quán)重選擇的多維貧困測量——以山西省貧困縣為例[J];中國農(nóng)村經(jīng)濟;2012年02期
9 鄒薇;方迎風(fēng);;關(guān)于中國貧困的動態(tài)多維度研究[J];中國人口科學(xué);2011年06期
10 郭勁光;;我國貧困人口的脆弱度與貧困動態(tài)[J];統(tǒng)計研究;2011年09期
本文編號:2780305
本文鏈接:http://sikaile.net/jingjilunwen/nongyejingjilunwen/2780305.html