基于度量學習的最近鄰信用評分模型研究
發(fā)布時間:2020-08-08 03:32
【摘要】:消費信貸是金融機構(gòu)的一項重要業(yè)務(wù),借貸融資和信用卡消費等理念已經(jīng)普遍被中小企業(yè)和個人接受.在面對大量新借款客戶的申請時,金融機構(gòu)需要迅速作出批準或拒絕的決策,而決策的依據(jù)是對新申請客戶進行信用評分.隨著消費信貸業(yè)務(wù)的迅速發(fā)展,許多信用評分模型被提出并廣泛應用于信用錄取決策.例如,基于統(tǒng)計學方法的判別分析、Logistic回歸分析和決策樹等模型,基于人工智能方法的人工神經(jīng)網(wǎng)絡(luò)、支持向量機等模型.雖然這些模型在應用中有各自的優(yōu)勢,但也存在著一些局限性.而最近鄰信用評分模型作為一個非參數(shù)模型,既不需要考慮數(shù)據(jù)分布的假設(shè),也不需要引入?yún)?shù),且還具有解決人口漂移問題的優(yōu)點,雖然其應用依賴于度量的選擇.因此,本文考慮利用度量學習方法,對最近鄰信用評分模型進行研究.本學位論文主要對最近鄰信用評分模型進行研究.模型中采用的度量是通過本文提出的度量學習方法而學習得到的,所設(shè)計的內(nèi)蘊最速下降算法提升了所學度量的精確性,進而提高了最近鄰信用評分模型的分類性能.本文的主要內(nèi)容和創(chuàng)新點是:1.研究基于監(jiān)督度量學習的最近鄰信用評分模型.該模型中的度量是通過所提出的非線性監(jiān)督度量學習方法而學習得到的,它能夠更好地反映數(shù)據(jù)的分布情況,改進了歐氏距離在信用評分中受數(shù)據(jù)分布和數(shù)據(jù)特征變量影響較大的缺點,從而能提高信用評分的預測精度.其中用于學習度量的非線性監(jiān)督度量學習方法所對應的優(yōu)化問題,約束條件僅僅只有一個,可以轉(zhuǎn)化為一個無約束的優(yōu)化問題進行求解,避免了現(xiàn)有度量學習模型中約束條件過多而導致計算復雜的問題.2.通過分析約束條件的幾何特征,將所提出的非線性監(jiān)督度量學習對應的優(yōu)化問題轉(zhuǎn)化為流形上的無約束優(yōu)化問題,從而設(shè)計了具有自適應最優(yōu)迭代步長的內(nèi)蘊最速下降算法.該算法在每次迭代時都能保證沿著流形上的點進行,解決了傳統(tǒng)算法在求解時需要通過投影才能保證約束條件成立這一問題.這就減少了投影帶來的計算代價和誤差,有利于提高所學度量的精確性,進而能提高最近鄰信用評分模型的性能.3.研究基于半監(jiān)督度量學習的最近鄰信用評分模型.該模型中的度量是通過我們提出的非線性半監(jiān)督度量學習模型而學習得到的,它雖然是通過訓練集中少量已知類別的客戶數(shù)據(jù)而得到的,但是卻能較好地反映訓練集中全部數(shù)據(jù)的分布情況.這就使得在信用評分中,當新申請客戶到來時,只需要計算與那些已知類別的客戶之間的距離,無需計算與訓練集中全部數(shù)據(jù)的距離.從而大大減少了最近鄰信用評分模型在應用時的計算量.另外,用于學習度量的非線性半監(jiān)督度量學習方法,是利用半監(jiān)督學習和多核學習的理論提出的,它有兩個優(yōu)點:一是僅僅只需要知道訓練集中少量的客戶類別信息,這就減少了監(jiān)督學習時金融機構(gòu)為了對現(xiàn)有數(shù)據(jù)庫中全部的客戶進行類別標記所帶來的代價;二是還能學習得到一個新的核函數(shù),這就解決了傳統(tǒng)非線性方法中關(guān)于核函數(shù)的選取問題.
【學位授予單位】:上海大學
【學位級別】:博士
【學位授予年份】:2017
【分類號】:F224
【圖文】:
維空間中具有線性可分的性質(zhì),然后通過最大化兩類數(shù)據(jù)之間的間隔找到一個分逡逑類超平面,從而得到一個分類器.利用此分類器可以實現(xiàn)對新的借款客戶申請進行逡逑類別預測.圖2.1給出二維空間上線性可分支持向量機的簡單示意圖,實線表示分逡逑類超平面,虛線表示支撐超平面.逡逑wTx+b邋=邋-1逡逑????逡逑?邋?邋?逡逑★邋★邋★邋\逡逑—★邋★逡逑圖2.1:二維空間中的線性可分支持向量機逡逑
信息.機器學習的目的是專門讓計算機自身通過數(shù)據(jù)或者以往經(jīng)驗等外部輸入逡逑進行自身學習以改善系統(tǒng)自身的性能,從而達到對數(shù)據(jù)進行分類或聚類的目的.逡逑圖2.2給出機器學習在分類和聚類中的簡單示意圖.逡逑小邐個逡逑★邐★邐★邐#性分類器逡逑?邐?邐機器學‘習邐?邐?逡逑★邐4逡逑?邐?邐?邋?逡逑邐>邋邐>逡逑個逡逑°邐°邐1/^:;聚類逡逑O邐O邋W逡逑0邐0逡逑邐^邋邐邐邐>逡逑圖2.2:機器學習在分類和聚類中的簡單示意圖逡逑由圖2.2可知,機器學習研究的主要對象就是“數(shù)據(jù)”.現(xiàn)實世界中的“數(shù)逡逑據(jù)”有多種出現(xiàn)形式,常見的形式有數(shù)值型數(shù)據(jù)(numerical邋data)和結(jié)構(gòu)型數(shù)逡逑據(jù)(structure邋data)兩種?圖2.3給出了常見數(shù)據(jù)的形式.逡逑
信息.機器學習的目的是專門讓計算機自身通過數(shù)據(jù)或者以往經(jīng)驗等外部輸入逡逑進行自身學習以改善系統(tǒng)自身的性能,從而達到對數(shù)據(jù)進行分類或聚類的目的.逡逑圖2.2給出機器學習在分類和聚類中的簡單示意圖.逡逑小邐個逡逑★邐★邐★邐#性分類器逡逑?邐?邐機器學‘習邐?邐?逡逑★邐4逡逑?邐?邐?邋?逡逑邐>邋邐>逡逑個逡逑°邐°邐1/^:;聚類逡逑O邐O邋W逡逑0邐0逡逑邐^邋邐邐邐>逡逑圖2.2:機器學習在分類和聚類中的簡單示意圖逡逑由圖2.2可知,機器學習研究的主要對象就是“數(shù)據(jù)”.現(xiàn)實世界中的“數(shù)逡逑據(jù)”有多種出現(xiàn)形式,常見的形式有數(shù)值型數(shù)據(jù)(numerical邋data)和結(jié)構(gòu)型數(shù)逡逑據(jù)(structure邋data)兩種?圖2.3給出了常見數(shù)據(jù)的形式.逡逑
本文編號:2784980
【學位授予單位】:上海大學
【學位級別】:博士
【學位授予年份】:2017
【分類號】:F224
【圖文】:
維空間中具有線性可分的性質(zhì),然后通過最大化兩類數(shù)據(jù)之間的間隔找到一個分逡逑類超平面,從而得到一個分類器.利用此分類器可以實現(xiàn)對新的借款客戶申請進行逡逑類別預測.圖2.1給出二維空間上線性可分支持向量機的簡單示意圖,實線表示分逡逑類超平面,虛線表示支撐超平面.逡逑wTx+b邋=邋-1逡逑????逡逑?邋?邋?逡逑★邋★邋★邋\逡逑—★邋★逡逑圖2.1:二維空間中的線性可分支持向量機逡逑
信息.機器學習的目的是專門讓計算機自身通過數(shù)據(jù)或者以往經(jīng)驗等外部輸入逡逑進行自身學習以改善系統(tǒng)自身的性能,從而達到對數(shù)據(jù)進行分類或聚類的目的.逡逑圖2.2給出機器學習在分類和聚類中的簡單示意圖.逡逑小邐個逡逑★邐★邐★邐#性分類器逡逑?邐?邐機器學‘習邐?邐?逡逑★邐4逡逑?邐?邐?邋?逡逑邐>邋邐>逡逑個逡逑°邐°邐1/^:;聚類逡逑O邐O邋W逡逑0邐0逡逑邐^邋邐邐邐>逡逑圖2.2:機器學習在分類和聚類中的簡單示意圖逡逑由圖2.2可知,機器學習研究的主要對象就是“數(shù)據(jù)”.現(xiàn)實世界中的“數(shù)逡逑據(jù)”有多種出現(xiàn)形式,常見的形式有數(shù)值型數(shù)據(jù)(numerical邋data)和結(jié)構(gòu)型數(shù)逡逑據(jù)(structure邋data)兩種?圖2.3給出了常見數(shù)據(jù)的形式.逡逑
信息.機器學習的目的是專門讓計算機自身通過數(shù)據(jù)或者以往經(jīng)驗等外部輸入逡逑進行自身學習以改善系統(tǒng)自身的性能,從而達到對數(shù)據(jù)進行分類或聚類的目的.逡逑圖2.2給出機器學習在分類和聚類中的簡單示意圖.逡逑小邐個逡逑★邐★邐★邐#性分類器逡逑?邐?邐機器學‘習邐?邐?逡逑★邐4逡逑?邐?邐?邋?逡逑邐>邋邐>逡逑個逡逑°邐°邐1/^:;聚類逡逑O邐O邋W逡逑0邐0逡逑邐^邋邐邐邐>逡逑圖2.2:機器學習在分類和聚類中的簡單示意圖逡逑由圖2.2可知,機器學習研究的主要對象就是“數(shù)據(jù)”.現(xiàn)實世界中的“數(shù)逡逑據(jù)”有多種出現(xiàn)形式,常見的形式有數(shù)值型數(shù)據(jù)(numerical邋data)和結(jié)構(gòu)型數(shù)逡逑據(jù)(structure邋data)兩種?圖2.3給出了常見數(shù)據(jù)的形式.逡逑
【參考文獻】
相關(guān)期刊論文 前5條
1 陸愛國;王玨;劉紅衛(wèi);;基于改進的SVM學習算法及其在信用評分中的應用[J];系統(tǒng)工程理論與實踐;2012年03期
2 姜明輝;謝行恒;王樹林;溫瀟;;個人信用評估的Logistic-RBF組合模型[J];哈爾濱工業(yè)大學學報;2007年07期
3 吳德勝,梁j;遺傳算法優(yōu)化神經(jīng)網(wǎng)絡(luò)及信用評價研究[J];中國管理科學;2004年01期
4 姜明輝,王雅林,趙欣,黃偉平;k-近鄰判別分析法在個人信用評估中的應用[J];數(shù)量經(jīng)濟技術(shù)經(jīng)濟研究;2004年02期
5 石慶焱,靳云匯;個人信用評分的主要模型與方法綜述[J];統(tǒng)計研究;2003年08期
相關(guān)博士學位論文 前3條
1 閆辛;半監(jiān)督支持向量機模型與算法研究[D];上海大學;2016年
2 向暉;個人信用評分組合模型研究與應用[D];湖南大學;2011年
3 陳為民;基于支持向量機的信用卡信用風險管理模型與技術(shù)研究[D];湖南大學;2009年
本文編號:2784980
本文鏈接:http://sikaile.net/jingjifazhanlunwen/2784980.html
最近更新
教材專著