基于機器學習的農戶信用評估研究
發(fā)布時間:2022-02-14 14:59
“三農”問題一直以來都是黨中央和國家高度重視的民生問題,近年來,在全面建成小康社會的政策指引下,國家精準扶貧的力度不斷加大,貧困農戶的生活也切實發(fā)生了變化,基本生活保障已經落實到位。然而,“三農”問題的關鍵還是農業(yè)問題,對于廣大農戶而言,發(fā)展農業(yè)經濟依舊是脫貧致富的主要道路,而資金則是發(fā)展農業(yè)經濟最為核心的要素,農戶的資金來源相對有限,通過銀行等金融信貸機構貸款仍然是他們獲得資金的主要渠道,而農村金融體系相對比較薄弱,隨之引發(fā)了“雙難”問題,即農村金融信貸機構“難貸款”以及農戶“貸款難”。這背后的主要原因是農戶和金融信貸機構之間信息不對稱,農村信用評估體系不完善,農村金融信貸機構不能準確客觀對農戶的信用作出評估,農戶貸款違約率較高。因此,在這種背景下,探索一套適用于我國農戶的科學統(tǒng)一的信用評估體系對于解決“雙難”問題從而解決“三農”問題是十分有意義的。具體地,本文首先闡述農戶信用評估的研究背景,并分別從現(xiàn)實和理論的角度說明進行農戶信用評估研究的意義,接著對信用評估理論、農戶信用、農戶信用評估方法以及農戶信用評估指標選取的相關文獻進行梳理和闡述,為進一步研究夯實基礎。其次,對機器學習相關...
【文章來源】:安徽財經大學安徽省
【文章頁數(shù)】:96 頁
【學位級別】:碩士
【部分圖文】:
技術路線圖
基于機器學習的農戶信用評估研究15二、機器學習分類算法機器學習的分類算法種類繁多,根據(jù)分類器的多少可以分為單一學習分類算法和集成學習分類算法。單一學習分類算法是指模型只有一個分類器,常見的單一學習分類算法有KNN、Logistic回歸、決策樹等;集成學習分類算法是指將多個分類器進行組合,各個分類器可以相同也可以不同,目前相同的分類器居多,這些相同的分類器是由不同參數(shù)的同一分類器組成,即可以看成是一些相似的分類器,集成學習分類算法按照參與訓練的基礎學習器生成方式不同又可以分為串行學習器算法和并行學習器算法,常見的串行學習器算法有boosting系列算法下的AdaBoost、GBDT、XGBoost算法等,常見的并行學習器算法有bagging算法和RandomForest算法。由于篇幅限制,本文僅對本文實證分析中所使用的有關算法進行介紹,主要包括:(一)Logistic回歸算法Logistic模型引入一個Logistic函數(shù),將連續(xù)型的輸出映射到區(qū)間(0,1)。在本文中,Y=1代表違約農戶,Y=0代表正常農戶。假定在本文的Logistic模型中有n個自變量,用向量組12(,,,)nXXX表示,Logistic模型經過機器學習會得出對應于自變量向量組的權值系數(shù)向量組12(,,,)n,通過該權值系數(shù)向量組和樣本數(shù)據(jù)按照線性加權得到結果:1122nnYXXX(2.1)實際上,Logistic模型是一個基于條件概率的判別模型,這里引入sigmoid函數(shù)作為判別函數(shù),sigmoid函數(shù)圖形如圖2-1所示,表達式為:1()1exX(2.2)圖2-1sigmoid函數(shù)
第二章機器學習相關理論18輸入:訓練集D,特征維度為d,隨機選取特征數(shù)量m,決策樹學習算法h。輸出:集成模型H(x)。1:fort=1toTdo;2:使用Bootstrap抽樣,從訓練數(shù)據(jù)集D獲得大小為n的抽樣數(shù)據(jù)集tD;3:從d個特征中隨機選取m個特征,基于tD中隨機選取的m個特征,使用決策樹模型學習得到一課決策樹()thx;4:如果是回歸問題,則輸出集成模型:11()(())TttHxhxT;5:如果是分類問題,則輸出集成模型:1()_({()})TttHxmajorityvotehx。由以上算法過程可知,隨機森林之所以存在隨機性,主要是因為:一方面隨機森林采取Bootstrap抽樣,這就保證了數(shù)據(jù)空間的隨機性;另一方面特征及特征閾值的的隨機選取保證了特征空間的隨機性。若處理回歸問題,利用平均值輸出模型結果;若處理分類問題,隨機森林中的每一個決策樹都會預測新的樣本所屬類別,并將預測結果進行集中,稱之為“投票”,選擇票數(shù)最多的即為最后分類結果。隨機森林的有點主要有:(1)由于建模時隨機引入數(shù)據(jù)樣本和樣本特征,發(fā)生過擬合的可能性低,且抗噪聲能力很強。(2)當很大一部分數(shù)據(jù)丟失時,隨機森林能有效估計丟失值,并保持較高準確性。(3)能處理各種類型的數(shù)據(jù)集,圖2-2RandomForest算法過程
【參考文獻】:
期刊論文
[1]BP神經網(wǎng)絡在農戶信用評級領域的應用研究——以甘南藏族自治州為例[J]. 梁榮,嚴小軍,布貴臣,馮華. 西部金融. 2019(11)
[2]農戶品質對農戶信用影響實證分析——基于“農分期”16101個農戶貸款數(shù)據(jù)[J]. 李莉,張宗毅. 中國農業(yè)大學學報. 2019(01)
[3]基于ELECTRE III的農戶小額貸款信用評級模型[J]. 石寶峰,王靜. 系統(tǒng)管理學報. 2018(05)
[4]基于XGBoost的信用風險分析的研究[J]. 趙天傲,鄭山紅,李萬龍,劉凱. 軟件工程. 2018(06)
[5]基于MIC-MAC的農戶信用評價指標體系優(yōu)化研究[J]. 程鑫,石洪波,董媛香. 數(shù)學的實踐與認識. 2018(08)
[6]交易費用對農戶貸款資金規(guī)模影響的審查回歸模型分析——基于湖北省某鄉(xiāng)鎮(zhèn)農戶的調查[J]. 賀景霖. 湖北社會科學. 2017(12)
[7]一種創(chuàng)新型的農戶信用評價方法——基于安徽省長豐縣農村信用體系建設的實證研究[J]. 吳貽軍,傅泳,許謙,胡瑤. 征信. 2017(07)
[8]基于GBDT與Logistic回歸融合的個人信貸風險評估模型及實證分析[J]. 蔡文學,羅永豪,張冠湘,鐘慧玲. 管理現(xiàn)代化. 2017(02)
[9]農業(yè)產業(yè)化龍頭企業(yè)信用風險評價的改進——基于農村金融聯(lián)結視角[J]. 李延敏,章敏. 農林經濟管理學報. 2016(05)
[10]機器學習法在信貸風險預測識別中的應用[J]. 孫存一,王彩霞. 中國物價. 2015(12)
博士論文
[1]政府投資項目代建人信用評價體系與信用管理研究[D]. 陳文君.華北電力大學 2013
[2]我國個人征信體系的構建與應用研究[D]. 李俊麗.山東農業(yè)大學 2007
[3]機器學習與文本挖掘若干算法研究[D]. 何清.中國科學院研究生院(計算技術研究所) 2002
碩士論文
[1]甘肅省農村信用社農戶信用評級體系改進研究[D]. 李增玉.蘭州大學 2019
[2]基于違約損失顯著判別的兼業(yè)型農戶信用評價研究[D]. 董丹陽.西北農林科技大學 2019
[3]基于機器學習的信用評分模型研究[D]. 林一帆.天津商業(yè)大學 2019
[4]基于機器學習的信用評分模型研究[D]. 張杏枝.西南大學 2019
[5]隨機森林優(yōu)化算法在農戶信用風險評估中的應用[D]. 宋鑫.云南師范大學 2018
[6]農戶信用等級評價體系設計[D]. 徐寶石.西北農林科技大學 2017
[7]基于Logistic模型的呼和浩特市農戶信用影響因素實證研究[D]. 鄭黎陽.內蒙古農業(yè)大學 2016
[8]農戶信用評價體系構建研究[D]. 王曉瑩.云南財經大學 2016
[9]基于神經網(wǎng)絡的農商行農戶信用評級系統(tǒng)的設計與實現(xiàn)[D]. 伍偉.湖南大學 2015
[10]基于Logistic-SVM的農戶信用評價組合模型研究[D]. 康艷紅.吉林大學 2014
本文編號:3624771
【文章來源】:安徽財經大學安徽省
【文章頁數(shù)】:96 頁
【學位級別】:碩士
【部分圖文】:
技術路線圖
基于機器學習的農戶信用評估研究15二、機器學習分類算法機器學習的分類算法種類繁多,根據(jù)分類器的多少可以分為單一學習分類算法和集成學習分類算法。單一學習分類算法是指模型只有一個分類器,常見的單一學習分類算法有KNN、Logistic回歸、決策樹等;集成學習分類算法是指將多個分類器進行組合,各個分類器可以相同也可以不同,目前相同的分類器居多,這些相同的分類器是由不同參數(shù)的同一分類器組成,即可以看成是一些相似的分類器,集成學習分類算法按照參與訓練的基礎學習器生成方式不同又可以分為串行學習器算法和并行學習器算法,常見的串行學習器算法有boosting系列算法下的AdaBoost、GBDT、XGBoost算法等,常見的并行學習器算法有bagging算法和RandomForest算法。由于篇幅限制,本文僅對本文實證分析中所使用的有關算法進行介紹,主要包括:(一)Logistic回歸算法Logistic模型引入一個Logistic函數(shù),將連續(xù)型的輸出映射到區(qū)間(0,1)。在本文中,Y=1代表違約農戶,Y=0代表正常農戶。假定在本文的Logistic模型中有n個自變量,用向量組12(,,,)nXXX表示,Logistic模型經過機器學習會得出對應于自變量向量組的權值系數(shù)向量組12(,,,)n,通過該權值系數(shù)向量組和樣本數(shù)據(jù)按照線性加權得到結果:1122nnYXXX(2.1)實際上,Logistic模型是一個基于條件概率的判別模型,這里引入sigmoid函數(shù)作為判別函數(shù),sigmoid函數(shù)圖形如圖2-1所示,表達式為:1()1exX(2.2)圖2-1sigmoid函數(shù)
第二章機器學習相關理論18輸入:訓練集D,特征維度為d,隨機選取特征數(shù)量m,決策樹學習算法h。輸出:集成模型H(x)。1:fort=1toTdo;2:使用Bootstrap抽樣,從訓練數(shù)據(jù)集D獲得大小為n的抽樣數(shù)據(jù)集tD;3:從d個特征中隨機選取m個特征,基于tD中隨機選取的m個特征,使用決策樹模型學習得到一課決策樹()thx;4:如果是回歸問題,則輸出集成模型:11()(())TttHxhxT;5:如果是分類問題,則輸出集成模型:1()_({()})TttHxmajorityvotehx。由以上算法過程可知,隨機森林之所以存在隨機性,主要是因為:一方面隨機森林采取Bootstrap抽樣,這就保證了數(shù)據(jù)空間的隨機性;另一方面特征及特征閾值的的隨機選取保證了特征空間的隨機性。若處理回歸問題,利用平均值輸出模型結果;若處理分類問題,隨機森林中的每一個決策樹都會預測新的樣本所屬類別,并將預測結果進行集中,稱之為“投票”,選擇票數(shù)最多的即為最后分類結果。隨機森林的有點主要有:(1)由于建模時隨機引入數(shù)據(jù)樣本和樣本特征,發(fā)生過擬合的可能性低,且抗噪聲能力很強。(2)當很大一部分數(shù)據(jù)丟失時,隨機森林能有效估計丟失值,并保持較高準確性。(3)能處理各種類型的數(shù)據(jù)集,圖2-2RandomForest算法過程
【參考文獻】:
期刊論文
[1]BP神經網(wǎng)絡在農戶信用評級領域的應用研究——以甘南藏族自治州為例[J]. 梁榮,嚴小軍,布貴臣,馮華. 西部金融. 2019(11)
[2]農戶品質對農戶信用影響實證分析——基于“農分期”16101個農戶貸款數(shù)據(jù)[J]. 李莉,張宗毅. 中國農業(yè)大學學報. 2019(01)
[3]基于ELECTRE III的農戶小額貸款信用評級模型[J]. 石寶峰,王靜. 系統(tǒng)管理學報. 2018(05)
[4]基于XGBoost的信用風險分析的研究[J]. 趙天傲,鄭山紅,李萬龍,劉凱. 軟件工程. 2018(06)
[5]基于MIC-MAC的農戶信用評價指標體系優(yōu)化研究[J]. 程鑫,石洪波,董媛香. 數(shù)學的實踐與認識. 2018(08)
[6]交易費用對農戶貸款資金規(guī)模影響的審查回歸模型分析——基于湖北省某鄉(xiāng)鎮(zhèn)農戶的調查[J]. 賀景霖. 湖北社會科學. 2017(12)
[7]一種創(chuàng)新型的農戶信用評價方法——基于安徽省長豐縣農村信用體系建設的實證研究[J]. 吳貽軍,傅泳,許謙,胡瑤. 征信. 2017(07)
[8]基于GBDT與Logistic回歸融合的個人信貸風險評估模型及實證分析[J]. 蔡文學,羅永豪,張冠湘,鐘慧玲. 管理現(xiàn)代化. 2017(02)
[9]農業(yè)產業(yè)化龍頭企業(yè)信用風險評價的改進——基于農村金融聯(lián)結視角[J]. 李延敏,章敏. 農林經濟管理學報. 2016(05)
[10]機器學習法在信貸風險預測識別中的應用[J]. 孫存一,王彩霞. 中國物價. 2015(12)
博士論文
[1]政府投資項目代建人信用評價體系與信用管理研究[D]. 陳文君.華北電力大學 2013
[2]我國個人征信體系的構建與應用研究[D]. 李俊麗.山東農業(yè)大學 2007
[3]機器學習與文本挖掘若干算法研究[D]. 何清.中國科學院研究生院(計算技術研究所) 2002
碩士論文
[1]甘肅省農村信用社農戶信用評級體系改進研究[D]. 李增玉.蘭州大學 2019
[2]基于違約損失顯著判別的兼業(yè)型農戶信用評價研究[D]. 董丹陽.西北農林科技大學 2019
[3]基于機器學習的信用評分模型研究[D]. 林一帆.天津商業(yè)大學 2019
[4]基于機器學習的信用評分模型研究[D]. 張杏枝.西南大學 2019
[5]隨機森林優(yōu)化算法在農戶信用風險評估中的應用[D]. 宋鑫.云南師范大學 2018
[6]農戶信用等級評價體系設計[D]. 徐寶石.西北農林科技大學 2017
[7]基于Logistic模型的呼和浩特市農戶信用影響因素實證研究[D]. 鄭黎陽.內蒙古農業(yè)大學 2016
[8]農戶信用評價體系構建研究[D]. 王曉瑩.云南財經大學 2016
[9]基于神經網(wǎng)絡的農商行農戶信用評級系統(tǒng)的設計與實現(xiàn)[D]. 伍偉.湖南大學 2015
[10]基于Logistic-SVM的農戶信用評價組合模型研究[D]. 康艷紅.吉林大學 2014
本文編號:3624771
本文鏈接:http://sikaile.net/guanlilunwen/huobilw/3624771.html