基于灰色關(guān)聯(lián)度與改進(jìn)SMOTE的支持向量機(jī)建模與應(yīng)用
本文關(guān)鍵詞:基于灰色關(guān)聯(lián)度與改進(jìn)SMOTE的支持向量機(jī)建模與應(yīng)用,由筆耕文化傳播整理發(fā)布。
【摘要】:隨著信貸行業(yè)的迅速發(fā)展和數(shù)據(jù)挖掘技術(shù)的不斷進(jìn)步,傳統(tǒng)人工完成的信用風(fēng)險(xiǎn)評估工作正逐步被大數(shù)據(jù)背景下的機(jī)器學(xué)習(xí)所代替。作為一種有效的分類工具,支持向量機(jī)通過對歷史樣本的學(xué)習(xí),可在短時(shí)間內(nèi)構(gòu)建出一個分類模型,用于對新樣本所屬類別的判定。嚴(yán)格的數(shù)學(xué)推理和扎實(shí)的統(tǒng)計(jì)學(xué)基礎(chǔ),使其被越來越多的專家和學(xué)者所接納,同時(shí)被廣泛應(yīng)用于工業(yè)生產(chǎn)、文本識別、圖像分析、入侵檢測、廣告推薦、管理評估、金融保險(xiǎn)、醫(yī)療診斷、生命科學(xué)等諸多領(lǐng)域。然而在現(xiàn)現(xiàn)實(shí)生活中,分類問題中的數(shù)據(jù)復(fù)雜性不斷增加,如噪聲樣本對正常分類的干擾、非均衡數(shù)據(jù)帶來的分類傾向性改變,這些問題的存在使得經(jīng)典支持向量機(jī)分類精度下降。為了更好地將支持向量機(jī)應(yīng)用于實(shí)際問題當(dāng)中,需要結(jié)合支持向量機(jī)自身性質(zhì),充分考慮噪聲樣本和非均衡數(shù)據(jù)給分類結(jié)果帶來的影響,深入分析分類精度下降的原因,從而有針對性地對經(jīng)典支持向量機(jī)模型加以改進(jìn),進(jìn)一步拓寬支持向量機(jī)的理論價(jià)值和應(yīng)用價(jià)值。本文系統(tǒng)地研究了經(jīng)典支持向量機(jī)的相關(guān)理論及其性質(zhì),針對支持向量機(jī)中的噪聲問題和數(shù)據(jù)非均衡問題分別進(jìn)行了討論,并提出同時(shí)解決噪聲和非均衡數(shù)據(jù)的改進(jìn)支持向量機(jī)算法,將其應(yīng)用到小額貸款公司客戶信用風(fēng)險(xiǎn)評估的實(shí)際案例當(dāng)中,違約客戶識別率有所提高。本文的主要研究內(nèi)容如下:(1)引入灰色關(guān)聯(lián)度,定義了樣本的平均灰色絕對關(guān)聯(lián)度;針對噪聲識別過程中支持向量對分類貢獻(xiàn)被削弱的問題,提出了基于同類中心和異類中心雙參照點(diǎn)的噪聲判別方法;給出新的隸屬度函數(shù)設(shè)置具體步驟。(2)針對傳統(tǒng)SMOTE算法在處理非均衡數(shù)據(jù)時(shí)對全部少數(shù)類樣本操作的問題,提出僅對錯分樣本人工合成的改進(jìn)思想;引入Random-SMOTE算法,改善新合成樣本的分布情況;給出具體非均衡數(shù)據(jù)下的改進(jìn)支持向量機(jī)算法流程。(3)分析了在使用SMOTE過程中噪聲對分類結(jié)果的影響;提出一種新型支持向量機(jī)算法,首先使用雙參照點(diǎn)灰色關(guān)聯(lián)度的噪聲判別方法對樣本進(jìn)行篩選,再通過改進(jìn)SMOTE算法合成新樣本;給出組合算法的流程。(4)研究了小額貸款公司對客戶進(jìn)行信用風(fēng)險(xiǎn)評估時(shí)面臨的問題;構(gòu)建了信用風(fēng)險(xiǎn)評估指標(biāo)體系,給出真實(shí)案例背景下的各指標(biāo)違約分布情況;將本文提出的改進(jìn)支持向量機(jī)算法應(yīng)用到具體數(shù)據(jù)當(dāng)中,與其他算法對比違約客戶的識別精度。
【關(guān)鍵詞】:灰色關(guān)聯(lián)度 SMOTE 支持向量機(jī) 非均衡數(shù)據(jù) 信用風(fēng)險(xiǎn)
【學(xué)位授予單位】:南京航空航天大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:F832.39;F224.9
【目錄】:
- 摘要4-5
- ABSTRACT5-11
- 第一章 緒論11-18
- 1.1 研究背景及意義11-13
- 1.1.1 研究背景11-12
- 1.1.2 研究意義12-13
- 1.2 國內(nèi)外研究現(xiàn)狀13-15
- 1.2.1 支持向量機(jī)發(fā)展回顧及研究現(xiàn)狀13-15
- 1.2.2 信用風(fēng)險(xiǎn)評估研究現(xiàn)狀15
- 1.2.3 現(xiàn)有文獻(xiàn)綜述15
- 1.3 研究內(nèi)容15-16
- 1.4 研究思路與框架16-18
- 第二章 基于雙參照點(diǎn)灰色關(guān)聯(lián)度的模糊SVM分類模型研究18-28
- 2.1 引言18-19
- 2.2 問題的提出19-21
- 2.2.1 模糊支持向量機(jī)19-20
- 2.2.2 現(xiàn)有隸屬度函數(shù)設(shè)計(jì)缺陷20-21
- 2.3 基于雙參照點(diǎn)灰色關(guān)聯(lián)度的模糊支持向量機(jī)改進(jìn)方法21-25
- 2.3.1 灰色關(guān)聯(lián)度22-23
- 2.3.2 樣本平均關(guān)聯(lián)度的確定23-24
- 2.3.3 基于雙參照點(diǎn)樣本隸屬度的確定24-25
- 2.4 實(shí)驗(yàn)仿真25-27
- 2.5 本章小結(jié)27-28
- 第三章 基于改進(jìn)SMOTE的非均衡數(shù)據(jù)SVM分類模型研究28-44
- 3.1 引言28
- 3.2 問題的提出28-33
- 3.2.1 SMOTE算法28-29
- 3.2.2 現(xiàn)有SMOTE算法的不足29-33
- 3.3 基于改進(jìn)SMOTE的非均衡SVM分類算法33-37
- 3.3.1 Random-SMOTE33-34
- 3.3.2 改進(jìn)SMOTE的支持向量機(jī)算法34-37
- 3.4 實(shí)驗(yàn)仿真37-42
- 3.4.1 精確度測量37-38
- 3.4.2 對比的方法38
- 3.4.3 實(shí)驗(yàn)與結(jié)果38-42
- 3.5 本章小結(jié)42-44
- 第四章 基于灰色關(guān)聯(lián)度與改進(jìn)SMOTE的SVM分類模型研究44-54
- 4.1 問題的提出44-45
- 4.2 基于灰色關(guān)聯(lián)度與改進(jìn)SMOTE的SVM分類算法45-48
- 4.2.1 噪聲的處理45-46
- 4.2.2 含噪聲的非均衡數(shù)據(jù)分類算法46-48
- 4.3 實(shí)驗(yàn)仿真48-53
- 4.4 本章小結(jié)53-54
- 第五章 小額貸款公司客戶信用風(fēng)險(xiǎn)非均衡SVM分類實(shí)證研究54-61
- 5.1 引言54-55
- 5.2 數(shù)據(jù)來源55
- 5.3 信用風(fēng)險(xiǎn)評估指標(biāo)構(gòu)建55-59
- 5.4 結(jié)果與分析59
- 5.5 本章小結(jié)59-61
- 第六章 結(jié)論與展望61-63
- 6.1 結(jié)論61-62
- 6.2 展望62-63
- 參考文獻(xiàn)63-68
- 致謝68-69
- 在學(xué)期間的研究成果及發(fā)表的學(xué)術(shù)論文69
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 朱雙;周建中;孟長青;肖舸;陳健國;;基于灰色關(guān)聯(lián)分析的模糊支持向量機(jī)方法在徑流預(yù)報(bào)中的應(yīng)用研究[J];水力發(fā)電學(xué)報(bào);2015年06期
2 章少平;梁雪春;;優(yōu)化的支持向量機(jī)集成分類器在非平衡數(shù)據(jù)集分類中的應(yīng)用[J];計(jì)算機(jī)應(yīng)用;2015年05期
3 張大斌;周志剛;許職;李延暉;;基于差分進(jìn)化自動聚類的信用風(fēng)險(xiǎn)評價(jià)模型研究[J];中國管理科學(xué);2015年04期
4 周華平;李敬兆;;多階灰色支持向量機(jī)集成預(yù)測模型研究[J];計(jì)算機(jī)工程與科學(xué);2015年03期
5 王鮮芳;王歲花;杜昊澤;王平;;基于模糊粗糙集和支持向量機(jī)的化工過程故障診斷[J];控制與決策;2015年02期
6 陳庭強(qiáng);何建敏;;基于復(fù)雜網(wǎng)絡(luò)的信用風(fēng)險(xiǎn)傳染模型研究[J];中國管理科學(xué);2014年11期
7 郭勤;賈振紅;覃錫忠;盛磊;陳麗;;支持向量機(jī)補(bǔ)償?shù)亩嘁蛩鼗疑P驮拕?wù)量預(yù)測[J];計(jì)算機(jī)工程與科學(xué);2014年07期
8 呂成戍;;基于代價(jià)敏感支持向量機(jī)的推薦系統(tǒng)托攻擊檢測方法[J];計(jì)算機(jī)工程與科學(xué);2014年04期
9 宋李俊;趙虎;;基于融合特征與支持向量機(jī)的控制圖模式識別[J];計(jì)算機(jī)應(yīng)用研究;2014年03期
10 陳偉;賈慶軒;孫漢旭;;基于灰關(guān)聯(lián)信息熵的SVM決策樹軸承故障分類[J];振動.測試與診斷;2013年03期
本文關(guān)鍵詞:基于灰色關(guān)聯(lián)度與改進(jìn)SMOTE的支持向量機(jī)建模與應(yīng)用,,由筆耕文化傳播整理發(fā)布。
本文編號:434604
本文鏈接:http://sikaile.net/jingjilunwen/guojijinrong/434604.html