天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 經(jīng)濟論文 > 投融資論文 >

基于數(shù)據(jù)挖掘的個人網(wǎng)絡(luò)信貸違約預(yù)警研究

發(fā)布時間:2020-09-15 11:43
   P2P網(wǎng)絡(luò)借貸作為一種新型的普惠金融模式起源于歐美,在發(fā)展初期,由于實際數(shù)據(jù)的匱乏,學(xué)者們的將研究集中于金融服務(wù)、平臺運營模式的介紹,直到美國P2P平臺Prosper對外公開平臺交易數(shù)據(jù),學(xué)術(shù)界才有了豐富的研究資源,開始把目光放在P2P面對的最主要的風(fēng)險問題--信貸違約問題。我國P2P行業(yè)起步較晚,仍需借鑒歐美國家的發(fā)展經(jīng)驗,目前國內(nèi)P2P網(wǎng)絡(luò)借貸的研究還停留在較淺層面,主要集中在P2P平臺運營模式,行業(yè)監(jiān)管和信貸違約的影響因素等等,鮮有通過數(shù)據(jù)挖掘方法建立個人信貸違約預(yù)警模型的研究。本文選擇使用已經(jīng)進入穩(wěn)定發(fā)展期的美國P2P市場的網(wǎng)站數(shù)據(jù)進行實證研究,以期為投資者和P2P平臺在如何有效規(guī)避信貸違約問題上提供一定的參考。本研究的主要目的是預(yù)測一筆貸款是否會違約,將個人信貸違約問題看作了一個二分類問題,選取了集成學(xué)習(xí)中以bagging算法為基礎(chǔ)的隨機森林算法建立預(yù)警模型,并以CART算法作為基學(xué)習(xí)器。使用的數(shù)據(jù)來源于美國P2P網(wǎng)站Prosper提供的2005-2014年的真實交易數(shù)據(jù),共含有113,937個實例,81個屬性。由于本研究關(guān)注的是已完成的貸款和違約貸款的區(qū)別,因此刪除了數(shù)據(jù)集中貸款狀態(tài)為進行中、銷賬和取消的數(shù)據(jù),最終使用的數(shù)據(jù)集中違約貸款的比例約為10.8%。在分析了個人信貸違約形成的原因之后,從借款者基本信息、借款者經(jīng)濟信息、借款者信用歷史和借款信息四個方面結(jié)合Prosper的實證數(shù)據(jù)分析個人信貸違約的影響因素,結(jié)果表明借款者的地理位置、工作類型、月收入和負(fù)債收入比,借款的原因和利率都對借款者是否會違約影響,特別的,借款者的拖欠賬目數(shù)對違約的影響很大。在此基礎(chǔ)上,通過特征選擇方法,刪除了識別能力差、和違約無因果關(guān)系的、重要性較低的變量,最終選取了24個指標(biāo)組成個人信貸違約評價體系。以此評價體系在Prosper真實數(shù)據(jù)集上的實證結(jié)果表明,隨機森林分類器與CART,LDA和LR分類器相比,獲得了最高的查全率,說明隨機森林的優(yōu)勢在于能夠正確預(yù)測樣本中的違約用戶,更適合于個人信貸違約預(yù)警問題。此外,在個人信貸違約問題中,存在著嚴(yán)重的數(shù)據(jù)不均衡問題,從Prosper公布的數(shù)據(jù)來看,其貸款違約率保持在10%左右的較低水平,為了解決這個問題,使用加權(quán)隨機森林(WRF)算法給予少數(shù)類更大的權(quán)重,增加其分類錯誤的代價。結(jié)果表明WRF算法將查全率提高到了62%,并且獲得了最高的AUC分?jǐn)?shù)和袋外分?jǐn)?shù),證明該模型不僅能正確預(yù)測違約用戶,還有很高的泛化能力,可以在一定程度上幫助投資者進行投資決策,保護投資者的根本利益,使P2P網(wǎng)絡(luò)借貸市場健康、穩(wěn)定發(fā)展。
【學(xué)位單位】:吉林大學(xué)
【學(xué)位級別】:碩士
【學(xué)位年份】:2018
【中圖分類】:F832.4
【部分圖文】:

還款能力,違約風(fēng)險,違約率,數(shù)據(jù)集中


對于經(jīng)濟發(fā)展水平較發(fā)達的東部地區(qū)來說,借款者對資金的運轉(zhuǎn)和利用能力一般較高,相對的,其還款能力較強,該地區(qū)發(fā)生違約風(fēng)險也就更小。圖 3.1 給出了Prosper 數(shù)據(jù)集中不同地區(qū)的違約分布?梢钥闯觯琒C 州的違約率只有 3.9%。而 RI 州是其 4 倍,達到了 16.1%。

違約率,經(jīng)濟信息,收入水平,工作狀況


2. 借款者經(jīng)濟信息①工作狀況。包括工作類型和工作時長等因素。它們可以側(cè)面反映出借款者的收入穩(wěn)定性和收入水平。從圖 3.2 來看,工作類型和工作時長與違約的相關(guān)性似乎比較低,這一點將在 3.3 節(jié)中進一步檢驗。有趣的是,工作類型為其他(other)的借款者,其違約率比沒有工作(not employed)的人還要高。

支付能力,債務(wù),比率,因素


圖3.3月收入和負(fù)債收入比對違約的影響

【相似文獻】

相關(guān)期刊論文 前10條

1 趙烏吉斯古楞;;數(shù)據(jù)挖掘的研究熱點和發(fā)展趨勢的淺談[J];電腦知識與技術(shù);2019年08期

2 王彬;;數(shù)據(jù)挖掘構(gòu)成要素的偵查視角分析[J];河南警察學(xué)院學(xué)報;2019年02期

3 程志;張玉彤;賈彪;;遠距離光纖通信傳輸故障數(shù)據(jù)挖掘方法[J];激光雜志;2019年04期

4 邵興江;;數(shù)據(jù)挖掘在教育信息化中的應(yīng)用空間分析[J];浙江現(xiàn)代教育技術(shù);2004年03期

5 于春香;;數(shù)據(jù)挖掘技術(shù)簡介[J];福建信息技術(shù)教育;2005年01期

6 周致丞;;大數(shù)據(jù)下一種規(guī)則的快速挖掘技術(shù)研究[J];河南科技;2018年25期

7 蔡萌萌;張巍巍;王泓霖;;大數(shù)據(jù)時代的數(shù)據(jù)挖掘綜述[J];價值工程;2019年05期

8 張澤;呂新;侯彤瑜;;數(shù)據(jù)挖掘在農(nóng)業(yè)信息化中的應(yīng)用進展探析[J];信息記錄材料;2019年01期

9 張俊杰;;恰當(dāng)?shù)乃畡?wù)大數(shù)據(jù)才符合數(shù)據(jù)挖掘的需求[J];城鄉(xiāng)建設(shè);2019年02期

10 周洋;;數(shù)據(jù)挖掘在電力調(diào)度自動化系統(tǒng)中的應(yīng)用解析[J];科技創(chuàng)新與應(yīng)用;2017年35期

相關(guān)會議論文 前10條

1 馬鈺超;;淺析大數(shù)據(jù)和數(shù)據(jù)挖掘及其在煙草行業(yè)中的應(yīng)用[A];中國煙草學(xué)會2015年度優(yōu)秀論文匯編[C];2015年

2 唐杰;梅俏竹;;數(shù)據(jù)挖掘?qū)W科發(fā)展研究[A];2012-2013控制科學(xué)與工程學(xué)科發(fā)展報告[C];2014年

3 王時光;;大數(shù)據(jù)時代規(guī)劃數(shù)據(jù)挖掘的創(chuàng)新思考[A];新常態(tài):傳承與變革——2015中國城市規(guī)劃年會論文集(04城市規(guī)劃新技術(shù)應(yīng)用)[C];2015年

4 史東輝;蔡慶生;張春陽;;一種新的數(shù)據(jù)挖掘多策略方法研究[A];第十七屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2000年

5 謝中;邱玉輝;;面向商務(wù)網(wǎng)站有效性的數(shù)據(jù)挖掘方法[A];第十八屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2001年

6 許珂;姜山;;數(shù)據(jù)挖掘方法在科技產(chǎn)出分布可視化研究中的運用[A];第二屆中國科技哲學(xué)及交叉學(xué)科研究生論壇論文集(碩士卷)[C];2008年

7 雷宇;;論行業(yè)信息資源的數(shù)據(jù)挖掘[A];中國煙草行業(yè)信息化研討會論文集[C];2004年

8 吳以凡;吳鐵軍;歐陽樹生;;面向生產(chǎn)過程質(zhì)量控制的動態(tài)數(shù)據(jù)挖掘方法[A];05'中國自動化產(chǎn)業(yè)高峰會議暨中國企業(yè)自動化和信息化建設(shè)論壇論文集[C];2005年

9 彭怡;;從數(shù)據(jù)挖掘文章聚類分析看其發(fā)展趨勢[A];現(xiàn)代工業(yè)工程與管理研討會會議論文集[C];2006年

10 張建錦;劉小霞;;密度偏差抽樣及其在海量數(shù)據(jù)挖掘中的應(yīng)用[A];2006北京地區(qū)高校研究生學(xué)術(shù)交流會——通信與信息技術(shù)會議論文集(下)[C];2006年

相關(guān)重要報紙文章 前10條

1 陸天歌 王兆亮;數(shù)據(jù)挖掘:幫你讀懂未來戰(zhàn)爭[N];解放軍報;2018年

2 本報記者 戴麗昕;在人才工作中展現(xiàn)數(shù)據(jù)挖掘力量[N];上?萍紙;2019年

3 本報記者 張佳星;把扎克伯格拉下水,大數(shù)據(jù)挖掘犯錯了嗎[N];科技日報;2018年

4 本報記者 張佳星;數(shù)據(jù)挖掘大戰(zhàn) 機器怎么做到“見信如面”[N];科技日報;2018年

5 記者 張瀟;打造數(shù)據(jù)挖掘領(lǐng)域的“響尾蛇模式”[N];西安日報;2018年

6 上海市浦東衛(wèi)生發(fā)展研究院 孫雪松 王曉麗;數(shù)據(jù)挖掘在醫(yī)學(xué)大數(shù)據(jù)研究中的應(yīng)用[N];中國信息化周報;2018年

7 本報記者 葉曜坤;全國人大代表鄧曉輝:推翻阻礙數(shù)據(jù)挖掘的“三座大山”[N];人民郵電;2017年

8 本報記者 牛福蓮;貴州爭奪“大數(shù)據(jù)挖掘”制高點[N];中國經(jīng)濟時報;2017年

9 中國聯(lián)合商報記者 劉末;大數(shù)據(jù)挖掘 讓金融業(yè)未來更加多彩[N];中國聯(lián)合商報;2017年

10 南方日報記者 彭穎;日化巨頭借力大數(shù)據(jù)挖掘線下市場[N];南方日報;2017年

相關(guān)博士學(xué)位論文 前10條

1 姜彥;正則化方法在數(shù)據(jù)挖掘中的應(yīng)用與研究[D];湖南大學(xué);2015年

2 馬昱欣;結(jié)合可視化與數(shù)據(jù)挖掘的數(shù)據(jù)分析方法探究[D];浙江大學(xué);2017年

3 李雄;單核苷酸多態(tài)性數(shù)據(jù)挖掘方法及其應(yīng)用研究[D];湖南大學(xué);2015年

4 董瑤;基于統(tǒng)計分析與數(shù)據(jù)挖掘的智能優(yōu)化預(yù)測研究及應(yīng)用[D];蘭州大學(xué);2015年

5 王達;時間序列數(shù)據(jù)挖掘研究與應(yīng)用[D];浙江大學(xué);2004年

6 馬昕;粗糙集理論在數(shù)據(jù)挖掘領(lǐng)域中的應(yīng)用[D];浙江大學(xué);2003年

7 王立宏;信息系統(tǒng)的約簡與粒度分析及其在數(shù)據(jù)挖掘中的應(yīng)用[D];上海大學(xué);2004年

8 楊虎;序列數(shù)據(jù)挖掘的模型和算法研究[D];重慶大學(xué);2003年

9 李秋丹;數(shù)據(jù)挖掘相關(guān)算法的研究與平臺實現(xiàn)[D];大連理工大學(xué);2004年

10 李力;數(shù)據(jù)挖掘方法研究及其在中藥復(fù)方配伍分析中的應(yīng)用[D];西南交通大學(xué);2003年

相關(guān)碩士學(xué)位論文 前10條

1 蔡楚華;基于數(shù)據(jù)挖掘的心臟疾病診斷研究[D];福州大學(xué);2017年

2 高鵬;基于JBPM的大數(shù)據(jù)挖掘服務(wù)流程引擎的研究與實現(xiàn)[D];福州大學(xué);2017年

3 顧海霞;數(shù)據(jù)挖掘在精準(zhǔn)幫扶數(shù)據(jù)分析中的應(yīng)用研究[D];貴州大學(xué);2018年

4 鄭張;數(shù)據(jù)挖掘在CDMA網(wǎng)絡(luò)分析中的應(yīng)用[D];福州大學(xué);2017年

5 林志群;基于Spark MLlib統(tǒng)一數(shù)據(jù)挖掘服務(wù)平臺的研究與實現(xiàn)[D];福州大學(xué);2017年

6 朱小舟;數(shù)據(jù)挖掘方法在股票選擇中的應(yīng)用研究[D];對外經(jīng)濟貿(mào)易大學(xué);2018年

7 張楠;基于數(shù)據(jù)挖掘的實時短文本處理技術(shù)的研究[D];中國電子科技集團公司電子科學(xué)研究院;2018年

8 李華;基于數(shù)據(jù)挖掘的消防電子生產(chǎn)企業(yè)客戶關(guān)系管理研究[D];燕山大學(xué);2018年

9 鞏陽光;基于數(shù)據(jù)挖掘技術(shù)的金融數(shù)據(jù)分析系統(tǒng)設(shè)計與實現(xiàn)[D];湖北工業(yè)大學(xué);2018年

10 余曉婧;基于數(shù)據(jù)挖掘的高速公路防逃費系統(tǒng)的設(shè)計與應(yīng)用[D];湖北工業(yè)大學(xué);2018年



本文編號:2818923

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/jingjilunwen/touziyanjiulunwen/2818923.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶ebe28***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com