天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 管理論文 > 信貸論文 >

基于數(shù)據(jù)挖掘技術(shù)的微額借款用戶的信用預(yù)測

發(fā)布時(shí)間:2018-06-20 00:07

  本文選題:數(shù)據(jù)挖掘 + 信用評(píng)估 ; 參考:《華中師范大學(xué)》2016年碩士論文


【摘要】:隨著計(jì)算機(jī)技術(shù)的發(fā)展,數(shù)字化時(shí)代已經(jīng)到來。以互聯(lián)網(wǎng)、大數(shù)據(jù)為代表的這場技術(shù)革命正在引領(lǐng)人們加速進(jìn)入繼農(nóng)業(yè)時(shí)代、工業(yè)時(shí)代之后的又一個(gè)新的發(fā)展階段—數(shù)據(jù)時(shí)代。世界上百分之九十以上的數(shù)據(jù)都是近兩年產(chǎn)生的,然而龐大數(shù)據(jù)的背后是如何才能有效利用它們的問題。數(shù)據(jù)挖掘就是為滿足人們對(duì)于數(shù)據(jù)中蘊(yùn)含信息的充分理解和有效運(yùn)用而發(fā)展起來的一門新興技術(shù)。近幾年,伴隨著互聯(lián)網(wǎng)發(fā)展起來的還有線上金融服務(wù)等新型業(yè)務(wù),其中小額貸款以其程序簡單、資金靈活、貸款范圍廣等優(yōu)勢迅速走紅,相應(yīng)的也給貸款機(jī)構(gòu)帶來了諸如:貸不貸,貸多少的問題。要處理好這些問題就要盡可能全面的了解貸款客戶的各項(xiàng)特征,把握客戶動(dòng)態(tài),及時(shí)擬定有效的業(yè)務(wù)方案。貸款機(jī)構(gòu)在過去的業(yè)務(wù)實(shí)施過程中積累了大量數(shù)據(jù),如何利用好這些數(shù)據(jù)成為解決問題的關(guān)鍵。這里就可以運(yùn)用數(shù)據(jù)分析技術(shù),對(duì)數(shù)據(jù)進(jìn)行分析,及時(shí)把握市場動(dòng)向,優(yōu)化業(yè)務(wù)模式。本文就是基于微額速達(dá)金融服務(wù)公司提供的真實(shí)有效數(shù)據(jù),詳細(xì)闡述了數(shù)據(jù)挖掘在微額借款用戶數(shù)據(jù)集中的應(yīng)用。具體實(shí)施過程是:在R軟件中,首先利用sampleO將數(shù)據(jù)集分為訓(xùn)練集和測試集,然后在訓(xùn)練集上進(jìn)行模型訓(xùn)練,在測試集上測試模型擬合效果。因?yàn)闇y試集數(shù)據(jù)結(jié)果是已知的,所以可以根據(jù)預(yù)測值與真實(shí)值的比例評(píng)價(jià)模型好壞。我們這里主要運(yùn)用了邏輯斯諦回歸、K最鄰近、決策樹和lasso回歸進(jìn)行建模分析,用它們得到的測試錯(cuò)誤率依次為:13.8%、10.98%、18.9%、10.5%。期間我們還對(duì)logistic回歸進(jìn)行了變量選擇,選擇后的測試錯(cuò)誤率為10.8%,比全模型有所提升。對(duì)比這幾個(gè)模型的測試錯(cuò)誤率,lasso回歸的效果要稍微好一點(diǎn)。文章不僅對(duì)數(shù)據(jù)挖掘和信用評(píng)估的基本理論知識(shí)作了介紹,也對(duì)信用評(píng)估的研究現(xiàn)狀做了深刻的分析說明。大數(shù)據(jù)時(shí)代的來臨,給企業(yè)甚至是政府都帶來了很好的發(fā)展的契機(jī),然而對(duì)數(shù)據(jù)的有效利用卻成為難題。本篇文章就以微額借款用戶數(shù)據(jù)的人品分析為例,向讀者展示了如何運(yùn)用數(shù)據(jù)挖掘技術(shù)對(duì)真實(shí)的企業(yè)數(shù)據(jù)進(jìn)行信息發(fā)現(xiàn)的過程。文章還對(duì)用到的挖掘技術(shù)的原理進(jìn)行了詳細(xì)介紹,方便讀者以后的研究工作。通過運(yùn)用豐富的客戶數(shù)據(jù),不斷地修改模型參數(shù),優(yōu)化算法模型,能夠在一定程度上降低貸款風(fēng)險(xiǎn),提高貸款服務(wù)質(zhì)量。文章中的問題處理辦法,也給今后的社會(huì)發(fā)展提供了借鑒:我們可以通過“大數(shù)據(jù)”和“算法”讓商業(yè)變得智能,從而為商業(yè)決策、企業(yè)發(fā)展提供好的思路。
[Abstract]:With the development of computer technology, the digital age has come. The technological revolution, represented by the Internet and big data, is leading people to enter a new stage of development after the agricultural age and the industrial age-the data age. More than 90% of the world's data have been generated in the last two years, but behind the huge numbers is the question of how to use them effectively. Data mining is a new technology developed to satisfy the full understanding and effective application of information contained in data. In recent years, along with the development of the Internet, there have also been new types of business such as online financial services. Among them, micro-loans have quickly become popular because of their advantages of simple procedures, flexible capital, wide scope of loans, and so on. It also brings problems such as not lending and how much to lend to lenders. In order to deal with these problems, we must fully understand the characteristics of loan customers, grasp customer dynamics, and formulate effective business plans in time. Loan institutions have accumulated a large amount of data in the past business implementation process, how to make good use of these data become the key to solve the problem. Here can use data analysis technology, data analysis, timely grasp market trends, optimize business models. This paper is based on the real and effective data provided by Microfinance Services Company, and describes the application of data mining in the data set of micro-loan users in detail. In R software, the data set is divided into training set and test set by sampleO, then model training is carried out on the training set, and the model fitting effect is tested on the test set. Because the results of the test set are known, the model can be evaluated according to the ratio of the predicted value to the real value. We mainly use the logicality regression to model and analyze the nearest neighbor, decision tree and lasso regression. The test error rates obtained by them are: 1: 13.8and 10.98 / 18.9 / 10.5 respectively. We also selected variables for logistic regression. The error rate of the selected test was 10.8, which was higher than that of the whole model. The test error rate of these models is slightly better than the lasso regression. This paper not only introduces the basic theoretical knowledge of data mining and credit evaluation, but also makes a profound analysis of the present situation of credit evaluation. With the advent of big data era, enterprises and even the government have a good opportunity to develop, but the effective use of data has become a difficult problem. This paper takes the personal character analysis of micro-loan user data as an example to show readers how to use data mining technology to discover the information of real enterprise data. The paper also introduces the principle of mining technology in detail, which is convenient for readers to study in the future. By using abundant customer data, constantly modifying the model parameters and optimizing the algorithm model, the loan risk can be reduced to a certain extent and the loan service quality can be improved. The problem solving methods in this paper can also be used for reference for the future social development: we can make the business intelligent through "big data" and "algorithm", so as to provide a good way of thinking for business decision making and enterprise development.
【學(xué)位授予單位】:華中師范大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:F832.4

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 韓海萌;信息時(shí)代的指南針——數(shù)據(jù)挖掘[J];江蘇統(tǒng)計(jì);2002年05期

2 韓雙霞;李萍;;數(shù)據(jù)挖掘:構(gòu)筑企業(yè)競爭優(yōu)勢[J];金卡工程;2002年08期

3 李菁菁,邵培基,黃亦瀟;數(shù)據(jù)挖掘在中國的現(xiàn)狀和發(fā)展研究[J];管理工程學(xué)報(bào);2004年03期

4 ;中國科學(xué)院數(shù)據(jù)挖掘與知識(shí)管理學(xué)術(shù)研討會(huì)在京舉行[J];管理評(píng)論;2004年07期

5 李峰;數(shù)據(jù)挖掘在企業(yè)中的應(yīng)用[J];商場現(xiàn)代化;2004年15期

6 魏瑜,陸靜;數(shù)據(jù)挖掘與統(tǒng)計(jì)學(xué)的關(guān)系淺析[J];沿海企業(yè)與科技;2005年09期

7 羅錦珠;數(shù)據(jù)挖掘與知識(shí)管理的結(jié)合應(yīng)用[J];技術(shù)經(jīng)濟(jì);2005年10期

8 袁衛(wèi),林楨順,謝邦昌;工業(yè)領(lǐng)域的數(shù)據(jù)挖掘——改善流程,提高效率[J];中國統(tǒng)計(jì);2005年04期

9 王琳;;統(tǒng)計(jì)學(xué)方法在數(shù)據(jù)挖掘中的應(yīng)用[J];當(dāng)代經(jīng)理人;2006年02期

10 劉曉華;;數(shù)據(jù)挖掘在商業(yè)中的應(yīng)用[J];商場現(xiàn)代化;2006年34期

相關(guān)會(huì)議論文 前10條

1 史東輝;蔡慶生;張春陽;;一種新的數(shù)據(jù)挖掘多策略方法研究[A];第十七屆全國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2000年

2 張弦;;數(shù)據(jù)挖掘在農(nóng)業(yè)中的應(yīng)用[A];紀(jì)念中國農(nóng)業(yè)工程學(xué)會(huì)成立30周年暨中國農(nóng)業(yè)工程學(xué)會(huì)2009年學(xué)術(shù)年會(huì)(CSAE 2009)論文集[C];2009年

3 魏順平;;教育數(shù)據(jù)挖掘:現(xiàn)狀與趨勢[A];信息化、工業(yè)化融合與服務(wù)創(chuàng)新——第十三屆計(jì)算機(jī)模擬與信息技術(shù)學(xué)術(shù)會(huì)議論文集[C];2011年

4 關(guān)清平;沉培輝;;概率網(wǎng)絡(luò)在數(shù)據(jù)挖掘上的應(yīng)用[A];科技、工程與經(jīng)濟(jì)社會(huì)協(xié)調(diào)發(fā)展——中國科協(xié)第五屆青年學(xué)術(shù)年會(huì)論文集[C];2004年

5 丁瑾;;基于Web數(shù)據(jù)挖掘的綜述[A];山西省科學(xué)技術(shù)情報(bào)學(xué)會(huì)學(xué)術(shù)年會(huì)論文集[C];2004年

6 聶茹;田森平;;Web數(shù)據(jù)挖掘及其在電子商務(wù)中的應(yīng)用[A];中南六。▍^(qū))自動(dòng)化學(xué)會(huì)第24屆學(xué)術(shù)年會(huì)會(huì)議論文集[C];2006年

7 李菊;王軍;;數(shù)據(jù)挖掘在客戶關(guān)系管理的應(yīng)用[A];計(jì)算機(jī)技術(shù)與應(yīng)用進(jìn)展·2007——全國第18屆計(jì)算機(jī)技術(shù)與應(yīng)用(CACIS)學(xué)術(shù)會(huì)議論文集[C];2007年

8 肖陽;李啟賢;;數(shù)據(jù)挖掘在中國鋼鐵行業(yè)中的應(yīng)用[A];中國計(jì)量協(xié)會(huì)冶金分會(huì)2012年會(huì)暨能源計(jì)量與節(jié)能降耗經(jīng)驗(yàn)交流會(huì)論文集[C];2012年

9 楊磊;王貴成;汪勇;張占勝;;SQL Server 2005在數(shù)據(jù)挖掘中的應(yīng)用[A];2009年中國智能自動(dòng)化會(huì)議論文集(第二分冊)[C];2009年

10 謝中;邱玉輝;;面向商務(wù)網(wǎng)站有效性的數(shù)據(jù)挖掘方法[A];第十八屆全國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2001年

相關(guān)重要報(bào)紙文章 前10條

1 本報(bào)記者褚寧;數(shù)據(jù)挖掘如“挖金”[N];解放日?qǐng)?bào);2002年

2 周蓉蓉;數(shù)據(jù)挖掘需要點(diǎn)想像力[N];計(jì)算機(jī)世界;2004年

3 □中國電信股份有限公司北京研究院 張舒博 □北京郵電大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院 牛琨;走出數(shù)據(jù)挖掘的誤區(qū)[N];人民郵電;2006年

4 《網(wǎng)絡(luò)世界》記者 王瑩;數(shù)據(jù)挖掘保險(xiǎn)業(yè)的新藍(lán)海[N];網(wǎng)絡(luò)世界;2012年

5 劉俊麗;基于地理化的網(wǎng)絡(luò)數(shù)據(jù)挖掘與分析提升投資有效性[N];人民郵電;2014年

6 本報(bào)記者 連曉東;數(shù)據(jù)挖掘:金融信息化新熱點(diǎn)[N];中國電子報(bào);2002年

7 本報(bào)記者 鳳小華 朱仁康;“數(shù)字挖掘軟件”引領(lǐng)中國信息化新浪潮[N];中國電子報(bào);2003年

8 本報(bào)記者 史延廷;“成功企業(yè)數(shù)據(jù)挖掘暨數(shù)量化管理論壇”在京舉辦[N];中國旅游報(bào);2002年

9 朱小寧;數(shù)據(jù)挖掘:信息化戰(zhàn)爭的基礎(chǔ)工程[N];解放軍報(bào);2005年

10 本報(bào)記者 王小平;從“大集中”走向數(shù)據(jù)挖掘[N];金融時(shí)報(bào);2002年

相關(guān)博士學(xué)位論文 前10條

1 于自強(qiáng);海量流數(shù)據(jù)挖掘相關(guān)問題研究[D];山東大學(xué);2015年

2 張馨;全基因組SNP芯片應(yīng)用于CNV和L0H分析的軟件比對(duì)與數(shù)據(jù)挖掘[D];復(fù)旦大學(xué);2011年

3 彭計(jì)紅;基于數(shù)據(jù)挖掘的癡呆中醫(yī)證的研究[D];南京中醫(yī)藥大學(xué);2015年

4 李秋虹;基于MapReduce的大規(guī)模數(shù)據(jù)挖掘技術(shù)研究[D];復(fù)旦大學(xué);2013年

5 鄔文帥;基于多目標(biāo)決策的數(shù)據(jù)挖掘方法評(píng)估與應(yīng)用[D];電子科技大學(xué);2015年

6 謝邦彥;整合數(shù)據(jù)挖掘與TRIZ理論的質(zhì)量管理方法研究[D];首都經(jīng)濟(jì)貿(mào)易大學(xué);2010年

7 何偉全;云南高校學(xué)生意外傷害因素關(guān)聯(lián)規(guī)則挖掘及風(fēng)險(xiǎn)管控體系研究[D];昆明理工大學(xué);2015年

8 段功豪;基于多結(jié)構(gòu)數(shù)據(jù)挖掘的滑坡災(zāi)害預(yù)測模型研究[D];中國地質(zhì)大學(xué);2016年

9 白曉明;基于數(shù)據(jù)挖掘的復(fù)合材料宏—細(xì)觀力學(xué)模型研究[D];哈爾濱工業(yè)大學(xué);2016年

10 藍(lán)永豪(LAM Wing Ho);基于數(shù)據(jù)挖掘技術(shù)分析當(dāng)代中醫(yī)名家痤瘡驗(yàn)方經(jīng)驗(yàn)研究[D];南京中醫(yī)藥大學(xué);2016年

相關(guān)碩士學(xué)位論文 前10條

1 林仁紅;基于數(shù)據(jù)挖掘的機(jī)遇識(shí)別與評(píng)價(jià)研究[D];首都經(jīng)濟(jì)貿(mào)易大學(xué);2007年

2 張彥俊;游戲運(yùn)營中的數(shù)據(jù)挖掘[D];復(fù)旦大學(xué);2011年

3 焦亞召;基于多核函數(shù)FCM算法在數(shù)據(jù)挖掘聚類中的應(yīng)用研究[D];昆明理工大學(xué);2015年

4 王杰鋒;物聯(lián)網(wǎng)能耗數(shù)據(jù)智能分析及其應(yīng)用平臺(tái)設(shè)計(jì)[D];江南大學(xué);2015年

5 劉學(xué)建;數(shù)據(jù)挖掘在電子商務(wù)推薦系統(tǒng)中的應(yīng)用研究[D];昆明理工大學(xué);2015年

6 戴陽陽;基于數(shù)據(jù)挖掘的金融時(shí)間序列預(yù)測研究與應(yīng)用[D];江南大學(xué);2015年

7 石思優(yōu);基于主題模型的醫(yī)療數(shù)據(jù)挖掘研究[D];廣東技術(shù)師范學(xué)院;2015年

8 陳丹;移動(dòng)互聯(lián)網(wǎng)信令挖掘?qū)崿F(xiàn)智慧營銷的設(shè)計(jì)與實(shí)現(xiàn)應(yīng)用研究[D];華南理工大學(xué);2015年

9 陳思;基于數(shù)據(jù)挖掘的大學(xué)生客戶識(shí)別模型的研究[D];昆明理工大學(xué);2015年

10 位長帥;基于客戶數(shù)據(jù)挖掘的電信客戶關(guān)系管理研究[D];西南交通大學(xué);2015年



本文編號(hào):2041962

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/bankxd/2041962.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶697f8***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com