天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于機(jī)器學(xué)習(xí)的貧困等級分類

發(fā)布時(shí)間:2020-05-18 11:23
【摘要】:貧困問題是全球廣泛關(guān)注的“3P”問題之一,引起了世界各地學(xué)者和政府的高度關(guān)注[1]。隨著現(xiàn)代化腳步的加快,貧困問題是目前急需解決的第一大問題,政府實(shí)施了很多方案來緩解其對社會的危害程度。在處理該問題之前,國家和政府優(yōu)先要考慮的是怎樣把貧困人群識別出來,只有將貧困人群區(qū)分出來之后,才能制定更有效的計(jì)劃,實(shí)施更惠民的政策[2]。目前世界各地區(qū)的政府或?qū)W者都是基于貧困線來研究社會的貧困問題,絕大多數(shù)文獻(xiàn)和參考資料主要是從經(jīng)濟(jì)學(xué)的角度研究該問題,對家庭的貧困程度以數(shù)據(jù)挖掘的方式研究的文獻(xiàn)較少。本文是使用機(jī)器學(xué)習(xí)的方法研究并預(yù)測家庭的貧困程度,這種做法對政府辨識貧困人群提供一種思路,且本文的研究方法對確定我國的貧困人口有一定的輔助作用。本文以哥斯達(dá)黎加部分家庭的樣本數(shù)據(jù)為實(shí)證數(shù)據(jù)并結(jié)合python軟件進(jìn)行研究,因數(shù)據(jù)中每個(gè)樣本的貧困程度的劃分是在家庭層面上進(jìn)行的,故選擇每個(gè)家庭的戶主作為本文的研究對象,首先對樣本數(shù)據(jù)做預(yù)處理工作,包括數(shù)據(jù)壓縮、缺失值處理、數(shù)據(jù)歸一化、冗余性和相關(guān)性處理;其次使用皮爾遜相關(guān)系數(shù)進(jìn)行特征篩選,經(jīng)過處理后的數(shù)據(jù)集就能夠直接運(yùn)用到機(jī)器學(xué)習(xí)模型中;然后選擇三種單模型的分類算法進(jìn)行貧困等級分類,這三種單模型分別是Logistic回歸、支持向量機(jī)和樸素貝葉斯,通過比較這三個(gè)模型在測試集上的精確度、召回率和Fl-score的值可知,支持向量機(jī)的分類準(zhǔn)確度是最高的,但是召回率低于Logistic回歸,樸素貝葉斯的預(yù)測效果是三個(gè)模型中最差的,故選擇支持向量機(jī)作為集成學(xué)習(xí)的基學(xué)習(xí)器;最后使用集成學(xué)習(xí)算法進(jìn)行貧困等級分類,因支持向量機(jī)在測試集上的精確度最高,故選支持向量機(jī)作為bagging算法的基學(xué)習(xí)器,通過比較不同基學(xué)習(xí)器的個(gè)數(shù)在測試集上的預(yù)測效果可知,4-bagging-SVM模型在測試集上的預(yù)測效果最好;比較bagging算法前后模型的性能發(fā)現(xiàn),4-bagging-SVM在測試集上的精確度、召回率和F1-score的值都優(yōu)于SVM的預(yù)測效果,集成學(xué)習(xí)提高了單模型的泛化性能;同時(shí)也對比了AdaBoost模型和4-bagging-SVM模型在測試集上的預(yù)測效果,因數(shù)據(jù)集是非均衡的,故使用Kappa系數(shù)來評估模型的效果,這兩種集成學(xué)習(xí)模型的Kappa系數(shù)的值都在0.4-0.6之間,預(yù)測的效果中等,但4-bagging-SVM模型的Kappa系數(shù)高于AdaBoost模型,故在家庭貧困等級分類中,4-bagging-SVM模型表現(xiàn)最優(yōu)。
【圖文】:

洛倫茨曲線,洛倫茨曲線,基尼系數(shù),面積


基尼系數(shù)的值是一個(gè)比值,是指家庭的相對比例占該家庭所有收入的相對比例逡逑的比重。在20世紀(jì)初期,意大利經(jīng)濟(jì)學(xué)家基尼通過研究洛倫茨曲線,提出了洛倫逡逑茨系數(shù)(基尼系數(shù)),該系數(shù)是用于判斷收入分配的平等程度,洛倫茨曲線如圖1.邋1逡逑所示:逡逑兗剖恕板義襄危罰蒎邋邋聞朔鄭垮義暇云降認(rèn)咤義希義纖誨,’邋/邋逦淲鎪人分}\0逡逑外一邐c邐W邋}邐岕(洛屖逡逑/邐/邐灥J逡逑/邋^邋/逡逑^邋 ̄邋/邐B逡逑—1——I邐邐邐逡逑2?.邋螂.s6邋f娜攀計(jì)人0逡逑圖1.1洛倫茨曲線逡逑用J表示絕對平等線和洛倫茨曲線之間區(qū)域的面積大小,用5表示洛倫茨曲線逡逑右下方的面積,基尼系數(shù)的計(jì)算公式為:逡逑基尼系數(shù)=一1逡逑A邋+邋B逡逑當(dāng)A等于0時(shí),,基尼系數(shù)的值就是0,即收入分配完全平等;逡逑當(dāng)B等于0時(shí),基尼系數(shù)的值就是1,即收入分配一定不平等。逡逑該系數(shù)的取值范圍為[0,1],基尼系數(shù)的值與洛倫茨曲線的弧度同向變化,值逡逑越大說明居民的收入分配越均勻,如果通過收取個(gè)人所得稅的方法讓收入相同,那逡逑么基尼系數(shù)的值將趨于0[1°]。國際上公認(rèn)的基尼系數(shù)與收入分配情況如表1.邋1所示逡逑[in邋I逡逑表1.邋1基尼系數(shù)與收入分配逡逑基尼系數(shù)邋<0.2邐0.2-0.3邋0.3-0.4邐0.4-0.6邐>0.6逡逑.邐收:人分配丨絕對平均|比較平均|相對合理|收人差距過大|收人差距懸殊逡逑’邐④恩格爾系數(shù)邐—邐一…逡逑19世紀(jì)德國統(tǒng)計(jì)學(xué)家恩格爾發(fā)現(xiàn)社會的富;蜇毨КF(xiàn)象可以用食品消費(fèi)在整逡逑個(gè)消費(fèi)結(jié)構(gòu)中所占比重來衡量

框架結(jié)構(gòu),論文,框架結(jié)構(gòu),學(xué)位論文


圖1.邋2論文框架結(jié)構(gòu)逡逑11逡逑
【學(xué)位授予單位】:華中師范大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:F113.9;TP181

【參考文獻(xiàn)】

相關(guān)期刊論文 前6條

1 張全紅;周強(qiáng);;多維貧困測量及述評[J];經(jīng)濟(jì)與管理;2014年01期

2 郭建宇;吳國寶;;基于不同指標(biāo)及權(quán)重選擇的多維貧困測量——以山西省貧困縣為例[J];中國農(nóng)村經(jīng)濟(jì);2012年02期

3 陸康強(qiáng);;貧困指數(shù):構(gòu)造與再造[J];社會學(xué)研究;2007年04期

4 石磊;岳森;;我國居民收入差距的評判依據(jù)分析[J];當(dāng)代經(jīng)理人;2005年03期

5 王時(shí)濤;我國城市貧困問題研究[J];學(xué)術(shù)界;1998年02期

6 毛保華;評價(jià)指標(biāo)體系分析及其權(quán)重系數(shù)的確定[J];系統(tǒng)工程;1991年04期

相關(guān)博士學(xué)位論文 前5條

1 畢潔穎;中國農(nóng)戶貧困的測量及影響因素研究[D];中國農(nóng)業(yè)科學(xué)院;2016年

2 張會敏;基于小域估計(jì)的貧困指標(biāo)測度方法與模型研究[D];天津財(cái)經(jīng)大學(xué);2015年

3 張鳳華;中國農(nóng)村扶貧政策的績效評價(jià)[D];武漢大學(xué);2011年

4 姚毅;中國城鄉(xiāng)貧困動(dòng)態(tài)演化的理論與實(shí)證研究[D];西南財(cái)經(jīng)大學(xué);2010年

5 尹海潔;城市貧困人口的經(jīng)濟(jì)支持網(wǎng)研究[D];哈爾濱工業(yè)大學(xué);2006年

相關(guān)碩士學(xué)位論文 前10條

1 汪周盼;基于樸素貝葉斯分類器的軌道交通客流分布模型研究[D];華南理工大學(xué);2018年

2 李雨辰;我國西部地區(qū)精準(zhǔn)扶貧:理論追溯、實(shí)踐現(xiàn)狀與成效評價(jià)[D];南京大學(xué);2018年

3 莫豪文;數(shù)據(jù)挖掘方法在反恐預(yù)警中的應(yīng)用[D];北京工業(yè)大學(xué);2017年

4 魏敏;南疆三地州縣域多維貧困測度研究[D];新疆大學(xué);2017年

5 肖榮榮;中國農(nóng)村多維貧困測量研究[D];中南財(cái)經(jīng)政法大學(xué);2017年

6 文春艷;我國多維貧困水平的分析研究[D];天津財(cái)經(jīng)大學(xué);2017年

7 王鋰達(dá);恐怖組織行為挖掘與預(yù)測[D];北京郵電大學(xué);2017年

8 安曉寧;基于ELES模型的中國城鎮(zhèn)貧困度量研究[D];天津財(cái)經(jīng)大學(xué);2012年

9 岳瑞紅;基于MODIS數(shù)據(jù)的蒙古高原土地覆蓋分類研究[D];內(nèi)蒙古師范大學(xué);2010年

10 曾輝;基于數(shù)據(jù)挖掘的銀行個(gè)人客戶信用評分模型的研究[D];對外經(jīng)濟(jì)貿(mào)易大學(xué);2007年



本文編號:2669641

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/jingjilunwen/shijiejingjilunwen/2669641.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶cf606***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com