天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 教育論文 > 素質(zhì)教育論文 >

非均衡數(shù)據(jù)分類算法及其在助學(xué)貸款風(fēng)險(xiǎn)管理中的應(yīng)用研究

發(fā)布時(shí)間:2018-01-12 05:10

  本文關(guān)鍵詞:非均衡數(shù)據(jù)分類算法及其在助學(xué)貸款風(fēng)險(xiǎn)管理中的應(yīng)用研究 出處:《華中科技大學(xué)》2012年博士論文 論文類型:學(xué)位論文


  更多相關(guān)文章: 分類 非均衡數(shù)據(jù)集 重取樣 支持向量機(jī) 助學(xué)貸款 信用風(fēng)險(xiǎn)管理


【摘要】:非均衡數(shù)據(jù)集的分類是數(shù)據(jù)挖掘的任務(wù)之一,通常傳統(tǒng)分類方法應(yīng)用于非均衡數(shù)據(jù)集會(huì)帶來少數(shù)類分類精度的下降等問題,而非均衡數(shù)據(jù)集的預(yù)處理和分類器的優(yōu)化可以較好地提高少數(shù)類的分類精度。國家助學(xué)貸款的違約風(fēng)險(xiǎn)管理涉及到非均衡數(shù)據(jù)集的分類問題,有效預(yù)防和控制違約風(fēng)險(xiǎn)的發(fā)生始終是這個(gè)領(lǐng)域關(guān)注的重點(diǎn)。 本文圍繞非均衡數(shù)據(jù)集分類問題及其在助學(xué)貸款風(fēng)險(xiǎn)分類中的應(yīng)用做了如下工作: 對(duì)分類問題的研究現(xiàn)狀進(jìn)行了綜述。重點(diǎn)分析非均衡數(shù)據(jù)集分類所面臨的困境及當(dāng)前國內(nèi)外在這一領(lǐng)域研究的主要方向,同時(shí)對(duì)比了國內(nèi)外非均衡分類技術(shù)在學(xué)生貸款風(fēng)險(xiǎn)管理分類及個(gè)人信用評(píng)估中的主要差異。指出我國在學(xué)生貸款信用風(fēng)險(xiǎn)管理定量研究方面的不足和制約因素。 圍繞非均衡數(shù)據(jù)集分類的兩個(gè)主要研究方向:數(shù)據(jù)集的預(yù)處理和分類算法的優(yōu)化開展了研究工作。分析了SMOTE重取樣技術(shù)的特點(diǎn)和不足之處,受封裝式屬性選擇思想的啟發(fā),提出了基于封裝式的少數(shù)類重取樣技術(shù)(Wrapper Synthetic Minority Over-sampling Technique, Wrapper-SMOTE)來解決非均衡數(shù)據(jù)集的分類問題,通過UCI數(shù)據(jù)集的實(shí)驗(yàn)驗(yàn)證,該數(shù)據(jù)預(yù)處理方法與SMOTE方法相比進(jìn)一步提高了少數(shù)類分類的效率。 改進(jìn)了標(biāo)準(zhǔn)粒子群算法,提出基于遺傳選擇策略的粒子群算法(Genetic Selection Strategy Particle Swarm Optimization, GSSPSO)。利用粒子群的尋優(yōu)特性,用改進(jìn)的粒子群來優(yōu)化支持向量機(jī)分類器的參數(shù)。重點(diǎn)把支持向量機(jī)的損失參數(shù)C和權(quán)重參數(shù)Weight作為一個(gè)二維的粒子K(c,w),用GSSPSO進(jìn)行優(yōu)化并找到最佳適應(yīng)值,促使支持向量機(jī)優(yōu)化模型盡快找到面向非均衡數(shù)據(jù)不同類別錯(cuò)分代價(jià)的合理權(quán)重,使得分類超平面盡可能偏向于少數(shù)類。實(shí)驗(yàn)證明優(yōu)化過的分類器提高了分類模型對(duì)少數(shù)類樣本數(shù)據(jù)的擬合程度,使分類的精度得到提高。 探索了我國助學(xué)貸款違約風(fēng)險(xiǎn)管理的定量研究方法。以武漢地區(qū)10所不同類別的高校2001年至2008年貸款學(xué)生的57836個(gè)數(shù)據(jù)為樣本,這些數(shù)據(jù)覆蓋從高職高專學(xué)生到研究生、涉及106個(gè)專業(yè)。分別把基于封裝式的少數(shù)類重取樣算法和改進(jìn)粒子群優(yōu)化支持向量機(jī)的分類模型這兩種定量方法用應(yīng)于國家助學(xué)貸款違約風(fēng)險(xiǎn)分類,實(shí)驗(yàn)結(jié)果證明這兩種方法提高了分類效率。論文的研究成果可有效幫助高校和銀行加強(qiáng)其對(duì)可能違約貸款學(xué)生的信用評(píng)價(jià)和跟蹤管理,從而降低銀行助學(xué)貸款違約率;同時(shí),研究成果也有助于促進(jìn)我國學(xué)生助學(xué)貸款政策的健康和可持續(xù)發(fā)展。
[Abstract]:The classification of disequilibrium data sets is Ren Wuzhi of data mining. Usually, the traditional classification methods applied to the disequilibrium data sets lead to the decline of classification accuracy of a few classes. The preprocessing of non-equilibrium data sets and the optimization of classifiers can improve the classification accuracy of a few categories. The default risk management of national student loans involves the classification of non-equilibrium data sets. Effective prevention and control of default risk has always been the focus of attention in this field. This paper focuses on the classification of disequilibrium data sets and its application in the risk classification of student loans. In this paper, the current situation of classification is summarized, and the difficulties of non-equilibrium data set classification and the main research directions in this field at home and abroad are analyzed. At the same time, this paper compares the main differences of disequilibrium classification technology in student loan risk management classification and personal credit assessment, and points out the deficiency and restriction factors in the quantitative research of student loan credit risk management in China. This paper focuses on the two main research directions of the classification of disequilibrium data sets: the preprocessing of data sets and the optimization of classification algorithms. The characteristics and shortcomings of SMOTE resampling technology are analyzed. Inspired by the idea of encapsulated attribute selection. This paper presents a few class resampling technique based on encapsulation, wrapper Synthetic Minority Over-sampling Technique. Wrapper-SMOTE) is used to solve the classification problem of unbalanced datasets, which is verified by the experiment of UCI datasets. Compared with the SMOTE method, the data preprocessing method improves the efficiency of the classification of a few classes. The standard particle swarm optimization algorithm is improved. A particle swarm optimization algorithm based on genetic selection strategy (. Genetic Selection Strategy Particle Swarm Optimization. GSSPSO. The optimization property of particle swarm optimization is used. The parameters of support vector machine classifier are optimized by improved particle swarm optimization. The loss parameter C and weight parameter Weight of support vector machine are considered as a two-dimensional particle. GSSPSO is used to optimize and find the best fit value, which urges the support vector machine optimization model to find out the reasonable weight of the different kinds of misdivision cost for the unbalanced data as soon as possible. The experimental results show that the optimized classifier improves the fitting degree of the classification model to a few sample data and improves the accuracy of the classification. This paper explores the quantitative research methods of default risk management of student loans in China. The sample is 57836 loan students from 2001 to 2008 in 10 different types of universities in Wuhan. These data cover everything from higher vocational students to graduate students. These two quantitative methods, which are based on encapsulated minority resampling algorithm and improved particle swarm optimization support vector machine (PSO) classification model, are applied to the classification of default risk of national student loans. The experimental results show that these two methods can improve the classification efficiency. The research results of this paper can effectively help universities and banks to strengthen their credit evaluation and tracking management of students who may default loans. In order to reduce the default rate of bank student loan; At the same time, the research results also help to promote the healthy and sustainable development of student loan policy in China.
【學(xué)位授予單位】:華中科技大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2012
【分類號(hào)】:TP311.13;G647;F832.4

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 王安娜;李云路;趙鋒云;史成龍;;一種新的半監(jiān)督直推式支持向量機(jī)分類算法[J];儀器儀表學(xué)報(bào);2011年07期

2 鄺濤;張倩;;改進(jìn)支持向量機(jī)在電信客戶流失預(yù)測的應(yīng)用[J];計(jì)算機(jī)仿真;2011年07期

3 李玲俐;;數(shù)據(jù)挖掘中分類算法綜述[J];重慶師范大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年04期

4 倪煜;趙耀;朱振峰;;結(jié)合標(biāo)簽傳遞的鏡頭邊界檢測與分類[J];中國圖象圖形學(xué)報(bào);2011年06期

5 鄺神芬;李銀;;集群SVM大規(guī)模數(shù)據(jù)分類算法[J];韶關(guān)學(xué)院學(xué)報(bào);2011年08期

6 賈昱晟;;基于機(jī)器學(xué)習(xí)的中文文本分類技術(shù)研究[J];電腦知識(shí)與技術(shù);2011年21期

7 劉健;劉忠;;基于小波變換和支持向量機(jī)的水下目標(biāo)分類方法[J];火力與指揮控制;2011年09期

8 陳榮;曹永鋒;孫洪;;基于主動(dòng)學(xué)習(xí)和半監(jiān)督學(xué)習(xí)的多類圖像分類[J];自動(dòng)化學(xué)報(bào);2011年08期

9 周靖;;改進(jìn)偏二叉樹多類SVM的文本分類[J];廣東石油化工學(xué)院學(xué)報(bào);2011年04期

10 王偉;馬永強(qiáng);彭強(qiáng);;SVM多類分類器在車牌字符識(shí)別中的應(yīng)用[J];計(jì)算機(jī)工程與設(shè)計(jì);2011年09期

相關(guān)會(huì)議論文 前10條

1 林杰華;張斌;李冬森;宋華茂;余志強(qiáng);王浩;;支持向量機(jī)在電力客戶信用評(píng)級(jí)中的應(yīng)用[A];全國第21屆計(jì)算機(jī)技術(shù)與應(yīng)用學(xué)術(shù)會(huì)議(CACIS·2010)暨全國第2屆安全關(guān)鍵技術(shù)與應(yīng)用學(xué)術(shù)會(huì)議論文集[C];2010年

2 蔣鐵軍;張懷強(qiáng);李積源;;多變量系統(tǒng)預(yù)測的支持向量機(jī)方法研究[A];管理科學(xué)與系統(tǒng)科學(xué)研究新進(jìn)展——第7屆全國青年管理科學(xué)與系統(tǒng)科學(xué)學(xué)術(shù)會(huì)議論文集[C];2003年

3 黃淑云;孫興玉;梁汝萍;邱建丁;;基于小波支持向量機(jī)預(yù)測蛋白質(zhì)亞細(xì)胞定位研究[A];第十一屆全國計(jì)算(機(jī))化學(xué)學(xué)術(shù)會(huì)議論文摘要集[C];2011年

4 謝湘;匡鏡明;;支持向量機(jī)在語音識(shí)別中的應(yīng)用研究[A];現(xiàn)代通信理論與信號(hào)處理進(jìn)展——2003年通信理論與信號(hào)處理年會(huì)論文集[C];2003年

5 高紅霞;蔡錦龍;;基于支持向量機(jī)的印刷電路板焊點(diǎn)分類算法[A];中國自動(dòng)化學(xué)會(huì)中南六。▍^(qū))2010年第28屆年會(huì)·論文集[C];2010年

6 涂冬成;薛龍;劉木華;趙進(jìn)輝;沈杰;吁芳;;基于支持向量機(jī)的鵝肉肉色客觀評(píng)定研究[A];中國農(nóng)業(yè)工程學(xué)會(huì)電氣信息與自動(dòng)化專業(yè)委員會(huì)、中國電機(jī)工程學(xué)會(huì)農(nóng)村電氣化分會(huì)科技與教育專委會(huì)2010年學(xué)術(shù)年會(huì)論文摘要[C];2010年

7 楊凌;劉玉樹;;基于支持向量機(jī)的坦克識(shí)別算法[A];第三屆全國數(shù)字成像技術(shù)及相關(guān)材料發(fā)展與應(yīng)用學(xué)術(shù)研討會(huì)論文摘要集[C];2004年

8 師旭超;巴松濤;;基于支持向量機(jī)方法的深基坑變形預(yù)測[A];科技、工程與經(jīng)濟(jì)社會(huì)協(xié)調(diào)發(fā)展——河南省第四屆青年學(xué)術(shù)年會(huì)論文集(上冊)[C];2004年

9 張軍;;支持向量機(jī)方法在地下水位干擾排除中的初步應(yīng)用[A];2007年地震流體學(xué)術(shù)研討會(huì)論文摘要集[C];2007年

10 許建生;盛立東;;基于改進(jìn)的支持向量機(jī)和BP神經(jīng)網(wǎng)絡(luò)的識(shí)別算法[A];第八屆全國漢字識(shí)別學(xué)術(shù)會(huì)議論文集[C];2002年

相關(guān)重要報(bào)紙文章 前10條

1 ;SecuiWALL獨(dú)創(chuàng)分類算法[N];計(jì)算機(jī)世界;2002年

2 俞路石;中科大研究生解決網(wǎng)絡(luò)數(shù)據(jù)包有效分類算法[N];中國教育報(bào);2007年

3 ;銳捷RG-WALL系列防火墻[N];電腦商報(bào);2004年

4 中國科學(xué)院東北地理與農(nóng)業(yè)生態(tài)研究所 李建平;保護(hù)地球之腎 遙感體檢濕地健康[N];中國水利報(bào);2008年

5 課題主持人 李心丹 課題協(xié)調(diào)人 上海證券交易所 施東暉 傅浩 課題研究員 宋素榮 查曉磊 賓紅輝 張?jiān)S宏 郭靜靜 黃雋 南京大學(xué)工程管理學(xué)院;內(nèi)幕交易與市場操縱的行為動(dòng)機(jī)與判別監(jiān)管研究[N];中國證券報(bào);2007年

6 李水根;計(jì)算機(jī)詳解配伍與藥效關(guān)系[N];健康報(bào);2005年

7 清華大學(xué) 蘇光大;非接觸式人臉識(shí)別技術(shù)[N];計(jì)算機(jī)世界;2006年

8 YMG記者 李仁 通訊員 曲華明 孫運(yùn)智;我市九項(xiàng)目進(jìn)入省“盤子”[N];煙臺(tái)日報(bào);2010年

9 ;百兆防火墻[N];計(jì)算機(jī)世界;2002年

10 ;MaxNet:本土化貼合市場[N];網(wǎng)絡(luò)世界;2008年

相關(guān)博士學(xué)位論文 前10條

1 秦玉平;基于支持向量機(jī)的文本分類算法研究[D];大連理工大學(xué);2008年

2 陳萬海;基于支持向量機(jī)的超譜圖像分類技術(shù)研究[D];哈爾濱工程大學(xué);2008年

3 武國正;支持向量機(jī)在湖泊富營養(yǎng)化評(píng)價(jià)及水質(zhì)預(yù)測中的應(yīng)用研究[D];內(nèi)蒙古農(nóng)業(yè)大學(xué);2008年

4 王冬麗;基于可擴(kuò)展的支持向量機(jī)分類算法及在信用評(píng)級(jí)中的應(yīng)用[D];東華大學(xué);2011年

5 劉葉青;原始空間中支持向量機(jī)若干問題的研究[D];西安電子科技大學(xué);2009年

6 韓曉明;基于符號(hào)有向圖和支持向量機(jī)的故障診斷方法的研究[D];太原理工大學(xué);2011年

7 賈銀山;支持向量機(jī)算法及其在網(wǎng)絡(luò)入侵檢測中的應(yīng)用[D];大連海事大學(xué);2004年

8 劉宏兵;多目標(biāo)粒度支持向量機(jī)及其應(yīng)用研究[D];武漢理工大學(xué);2011年

9 杜小芳;基于CPFR的農(nóng)產(chǎn)品采購模型研究[D];華中科技大學(xué);2005年

10 劉育明;動(dòng)態(tài)過程數(shù)據(jù)的多變量統(tǒng)計(jì)監(jiān)控方法研究[D];浙江大學(xué);2006年

相關(guān)碩士學(xué)位論文 前10條

1 劉艷偉;支持向量機(jī)方法在感潮河段洪峰水位預(yù)報(bào)中的應(yīng)用[D];浙江大學(xué);2010年

2 楊鐳;支持向量機(jī)算法設(shè)計(jì)及在高分辨雷達(dá)目標(biāo)識(shí)別中的應(yīng)用[D];國防科學(xué)技術(shù)大學(xué);2010年

3 童振;基于支持向量機(jī)的電解液成分預(yù)測[D];東北大學(xué);2008年

4 聶小芳;模糊粗糙集與支持向量機(jī)在煤與瓦斯突出預(yù)測中的應(yīng)用研究[D];遼寧工程技術(shù)大學(xué);2009年

5 鄢常亮;基于支持向量機(jī)的高爐向涼向熱爐況預(yù)測研究[D];內(nèi)蒙古科技大學(xué);2010年

6 韓敘東;基于支持向量機(jī)的水電故障分類器的設(shè)計(jì)與實(shí)現(xiàn)[D];東北大學(xué);2008年

7 馮杰;慢時(shí)變對(duì)象的支持向量機(jī)建模與在線校正方法研究[D];東北大學(xué);2009年

8 朱耿峰;支持向量機(jī)在沖擊地壓預(yù)測模型中的應(yīng)用研究[D];山東科技大學(xué);2010年

9 王奇安;基于廣泛內(nèi)核的CVM算法研究及參數(shù)C的選擇[D];南京航空航天大學(xué);2009年

10 張永新;基于支持向量機(jī)和遺傳算法相結(jié)合的模擬電路故障診斷方法研究[D];東北大學(xué);2009年

,

本文編號(hào):1412815

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/jiaoyulunwen/suzhijiaoyulunwen/1412815.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶32f95***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com