基于重抽樣法處理不平衡問題的信用評級模型
【部分圖文】:
(b)對于樣本資源不足的中小型金融機(jī)構(gòu),令τ=4,在“好”客戶中隨機(jī)不重復(fù)抽。20/τ)×n個(gè)樣本組成樣本集G11,G11的樣本容量為(20/τ)×n=5n。移除Β1組變量,在其余4組變量組成的樣本集{Β2,…,Β5}中不重復(fù)抽取n個(gè)樣本組成樣本集B′11,運(yùn)用樣本集B′11與{Β2,…,Β5}組成樣本集Β-11={B′11,Β2,…,Β5},Β-11的樣本容量為5n。運(yùn)用樣本集G11和Β-11組成訓(xùn)練集TR11={G11,Β-11}(如圖2所示)。再次操作上述抽取“好”客戶的過程4次,獲得樣本集G12,…,G15,操作抽取“壞”客戶的過程4次,獲得樣本集B′12,…,B′15,分別與{Β2,…,Β5}組成樣本集Β-12={B′12,Β2,…,Β5},…,Β-15={B′15,Β2,…,Β5}。利用樣本集G12,…,G15和Β-12,…,Β-15組成訓(xùn)練集TR12={G12,Β-12},…,TR15={G15,Β-15}。第3步,將步驟2中的Β1分別替換為Β2,重復(fù)以上操作獲得訓(xùn)練集TR21={G21,Β-21},…,TR25={G25,Β-25}。利用Β3、Β4和Β5進(jìn)行相同的替換,獲得其他訓(xùn)練集。
難點(diǎn)之四是如何確定調(diào)整后“好”客戶與“壞”客戶的比例,來確保模型在傾向表現(xiàn)“壞”客戶的同時(shí)不過度減少貸款產(chǎn)品的市場份額。伴隨欠抽樣方法對建模數(shù)據(jù)的調(diào)整,“壞”客戶占比不斷提升,由評級模型所代表的貸款審核機(jī)制變得更為嚴(yán)格,貸款申請的通過率降低,進(jìn)而導(dǎo)致貸款產(chǎn)品的市場份額下降。信用評級模型的分類效果可以用混淆矩陣表示(如圖1所示),其中TP和TN代表被正確分類的客戶數(shù),F(xiàn)N和FP代表被錯(cuò)誤分類的客戶數(shù)!皦摹笨蛻舯徽_預(yù)測的比例為P1=TP/(TP+FN),“好”客戶被正確預(yù)測的比例為P2=TN/(TN+FP),一般來說,運(yùn)用不平衡數(shù)據(jù)建模時(shí)P1<P2,運(yùn)用平衡數(shù)據(jù)建模時(shí)P1≈P2;煜仃嚳梢赞D(zhuǎn)化成一個(gè)2×2的列聯(lián)表,可以從統(tǒng)計(jì)學(xué)角度進(jìn)行列聯(lián)表卡方檢驗(yàn),選取P1顯著大于P2時(shí)的客戶類別比例。難點(diǎn)之五是如何在眾多信用評級模型中選取合適的模型,可以適應(yīng)信用評級領(lǐng)域的應(yīng)用要求。Logistic模型在我國信用評級工作中應(yīng)用最為廣泛,SVM模型次之,其他分類模型較少被采用。內(nèi)蘊(yùn)線性形式使得Logistic模型的函數(shù)形式相對簡單,模型的可解釋性良好,分類效果較好,因而在實(shí)踐中頗受歡迎。此外,為確保變量影響的穩(wěn)定性,實(shí)踐中常對數(shù)值型變量進(jìn)行欄位劃分(數(shù)據(jù)分組),評級模型中會加入較多的分類變量。Logistic group lasso(LGLM)模型融合了Logistic模型的解釋性優(yōu)勢、Group lasso模型變量選擇和處理分類變量的優(yōu)勢,將此模型作為本研究的基學(xué)習(xí)模型較為適宜。設(shè)定(xi,yi),i=1,…,n是觀測樣本,yi∈{0,1}是二值響應(yīng)變量,xi=(xi,1,…,xi,G)是包含G個(gè)組的p維協(xié)變量。對于第g組變量,g=1,…,G,當(dāng)其維度大于1時(shí),該組代表分類變量;當(dāng)維度等于1時(shí),實(shí)際上它是連續(xù)變量。Logistic模型通過(1)式估計(jì)條件概率p(xi)=Pr(Y=1|xi),即:
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 劉麗萍;;高維稀疏對角GARCH模型的估計(jì)及應(yīng)用[J];數(shù)學(xué)的實(shí)踐與認(rèn)識;2017年11期
2 蔣福坤;變額還貸的按揭貸款模型研究[J];浙江統(tǒng)計(jì);2004年03期
3 黃長征;趙崇新;;農(nóng)村二元金融模型與分成制模型辨析[J];現(xiàn)代商業(yè);2011年24期
4 聶巧平;胡冰倩;;GARCH模型族及其在金融市場中的應(yīng)用研究綜述[J];天津商業(yè)大學(xué)學(xué)報(bào);2020年02期
5 劉呂科;;模型風(fēng)險(xiǎn)及其控制研究[J];農(nóng)村金融研究;2012年04期
6 鄒柏松;;信用風(fēng)險(xiǎn)分類預(yù)測單一模型研究及實(shí)證分析[J];武漢冶金管理干部學(xué)院學(xué)報(bào);2017年02期
7 孟勇;;對Black-Litterman模型加入主觀收益方法的改進(jìn)[J];統(tǒng)計(jì)研究;2012年02期
8 劉超;;商業(yè)銀行風(fēng)險(xiǎn)管理模型的性質(zhì)及啟示[J];上海金融;2011年03期
9 戴玉林;;馬科維茲模型的分析與評價(jià)[J];金融研究;1991年09期
10 胡楠;;“消息”在匯率模型中扮演了怎樣的角色?[J];時(shí)代金融;2015年32期
相關(guān)博士學(xué)位論文 前10條
1 周伊佳;帶有共享不確定參數(shù)的魯棒優(yōu)化模型[D];大連理工大學(xué);2017年
2 張運(yùn)鵬;基于GARCH模型的金融市場風(fēng)險(xiǎn)研究[D];吉林大學(xué);2009年
3 黃薏舟;無模型隱含波動率及其所包含的信息研究[D];廈門大學(xué);2009年
4 許一覽;人民幣對公貸款違約概率計(jì)量模型研究[D];復(fù)旦大學(xué);2014年
5 彭偉;CAViaR模型方法及其實(shí)證研究[D];華中科技大學(xué);2015年
6 汪盧俊;STAR-GARCH模型的理論與應(yīng)用研究[D];南開大學(xué);2014年
7 黃建忠;商業(yè)銀行違約損失率估計(jì)模型構(gòu)建研究[D];南京農(nóng)業(yè)大學(xué);2011年
8 耿立艷;非線性金融波動率模型及其實(shí)證研究[D];天津大學(xué);2009年
9 劉鵬;投資組合保險(xiǎn)模型研究[D];西南交通大學(xué);2012年
10 向暉;個(gè)人信用評分組合模型研究與應(yīng)用[D];湖南大學(xué);2011年
相關(guān)碩士學(xué)位論文 前10條
1 顧洲一;基于高頻數(shù)據(jù)的分?jǐn)?shù)整合Realized HAR GARCH模型[D];浙江財(cái)經(jīng)大學(xué);2017年
2 張勔;基于優(yōu)化的Black-Litterman模型證券資產(chǎn)配置研究[D];中國科學(xué)技術(shù)大學(xué);2015年
3 丁慎勇;反欺詐模型在電子銀行的應(yīng)用研究[D];山東大學(xué);2014年
4 張嬌艷;基于DEJ-GARCH-Vasicek模型的利率跳躍行為研究[D];湖南大學(xué);2014年
5 孫凱;GARCH模型簇在我國金融領(lǐng)域應(yīng)用的探討[D];蘭州大學(xué);2010年
6 王敏;非參數(shù)條件自回歸極差模型及其應(yīng)用[D];西南財(cái)經(jīng)大學(xué);2013年
7 焦鵬;基于模糊GARCH模型的中國股票市場波動性研究[D];西南財(cái)經(jīng)大學(xué);2011年
8 林萍;貨幣主義匯率模型及其實(shí)證研究[D];武漢大學(xué);2005年
9 李知常;基于Black-Litterman模型的資產(chǎn)配置策略研究[D];山東大學(xué);2017年
10 葉蜜冬;基于中國市場的最優(yōu)套期保值比率模型績效實(shí)證檢驗(yàn)[D];廈門大學(xué);2009年
本文編號:2888856
本文鏈接:http://sikaile.net/jingjilunwen/huobiyinxinglunwen/2888856.html