基于因式分解機(jī)的信用預(yù)測中數(shù)據(jù)壓縮和補(bǔ)齊方法研究
發(fā)布時(shí)間:2021-10-25 22:30
企業(yè)和個(gè)人信用預(yù)測在金融貸款領(lǐng)域具有重要的意義,通過信用預(yù)測模型判斷借貸方信用類別,決定是否對其進(jìn)行貸款,可以在很大程度上降低銀行等信貸部門的貸款風(fēng)險(xiǎn)。小微企業(yè)是我國企業(yè)的重要組成部分,然而小微企業(yè)普遍存在貸款難題。隨著互聯(lián)網(wǎng)的高速發(fā)展,小微企業(yè)在網(wǎng)絡(luò)上的信息越來越多,利用互聯(lián)網(wǎng)數(shù)據(jù)預(yù)測小微企業(yè)的信用,將會給小微企業(yè)信用貸款帶來啟發(fā)。由于互聯(lián)網(wǎng)信用數(shù)據(jù)的特征之間具有一定的關(guān)聯(lián),因式分解機(jī)處理這種關(guān)聯(lián)數(shù)據(jù)具有一定的優(yōu)勢,因此本文將研究因式分解機(jī)在信用預(yù)測方面的應(yīng)用。由于信用數(shù)據(jù)存在缺失和重復(fù)的問題,采用一定的方法去掉重復(fù)數(shù)據(jù)將會加快信用預(yù)測的效率,同時(shí)對缺失值進(jìn)行補(bǔ)齊將有助于提高信用預(yù)測的質(zhì)量。本文的主要研究工作如下:(1)研究因式分解機(jī)模型Factorization Machine在信用預(yù)測方面的應(yīng)用。本文對因式分解機(jī)進(jìn)行了深入的研究,分析其原理和優(yōu)勢,并將其應(yīng)用在信用預(yù)測方面。本文在四個(gè)信用數(shù)據(jù)集上進(jìn)行信用預(yù)測實(shí)驗(yàn),并與常用的分類算法對比。實(shí)驗(yàn)結(jié)果表明,因式分解機(jī)在多個(gè)分類評價(jià)指標(biāo)上的性能表現(xiàn)良好,比較適用于信用數(shù)據(jù)集。(2)針對信用數(shù)據(jù)中存在重復(fù)數(shù)據(jù)的問題,提出基于Block St...
【文章來源】:武漢理工大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁數(shù)】:72 頁
【學(xué)位級別】:碩士
【部分圖文】:
本文組織結(jié)構(gòu)圖
圖 2-1 SVM 最優(yōu)超平面與最大化間隔樹(CART):CART 是一種決策樹算法,采用兩個(gè)步驟:1)對樣本遞歸劃分并建立二叉樹T 與 C4.5 算法類似,不同點(diǎn)在于 CART 支持計(jì)算規(guī)則集。NN 算法的思想比較簡單,對于一個(gè)給定的樣的距離公式(歐氏距離、余弦相似度等)找出這些樣本的類別來決定當(dāng)前樣本屬于哪一類機(jī) MLP:MLP 是一種監(jiān)督學(xué)習(xí)類型的神經(jīng)網(wǎng)LP 可以學(xué)習(xí)非線性的函數(shù)逼近,并且在輸入,圖 2-2 是只有一個(gè)隱藏層的 MLP 模型:使用 libFM[20]進(jìn)行實(shí)驗(yàn);對于 SVM,本章使核函數(shù)和 RBF 核函數(shù)進(jìn)行實(shí)驗(yàn);對于 KNN、on 開源機(jī)器學(xué)習(xí)工具包 scikit-learn3。
圖 2-2 包含一個(gè)隱藏層的 MLP 模型和假正率價(jià)比較關(guān)心準(zhǔn)確率和假正率的表現(xiàn),因此將這兩個(gè)表分別表示各算法在不同數(shù)據(jù)集上的表現(xiàn),并將每加粗顯示。表中的 A 表示準(zhǔn)確率,該指標(biāo)的值越示假正率,該指標(biāo)越低表示算法性能越好。表 2-2 Jiangsu 數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果M SVM-linear SVM-RBF KNN CART.993 0.7512 0.986 0.9872 0.9920178 0.7736 0.0966 0.0872 0.021表 2-3Australian 數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果
【參考文獻(xiàn)】:
期刊論文
[1]基于上市公司財(cái)務(wù)數(shù)據(jù)的企業(yè)信用風(fēng)險(xiǎn)預(yù)測Logistic模型研究[J]. 閆炳琪,趙月瑤,張輝. 中國傳媒大學(xué)學(xué)報(bào)(自然科學(xué)版). 2016(04)
[2]基于K-均值聚類的多值有序Logistic回歸模型在信用卡信用評級中的應(yīng)用研究[J]. 王純杰,李群,董小剛,林珊屹. 吉林師范大學(xué)學(xué)報(bào)(自然科學(xué)版). 2016(03)
[3]結(jié)合屬性重要度和灰色關(guān)聯(lián)度的數(shù)據(jù)補(bǔ)齊方法[J]. 王方心,潘巍,吳立鋒,金聲震,李曉娟. 計(jì)算機(jī)工程與設(shè)計(jì). 2014(01)
[4]我國小微企業(yè)發(fā)展問題研究[J]. 王俊峰,王巖. 商業(yè)研究. 2012(09)
[5]基于投影尋蹤和最優(yōu)分割的企業(yè)信用評級模型[J]. 張目,周宗放. 運(yùn)籌與管理. 2011(06)
[6]C2C交易中的動態(tài)信用評價(jià)模型[J]. 楊韻. 情報(bào)科學(xué). 2010(04)
[7]增加融資供給緩解小微企業(yè)融資難[J]. 魏國雄. 中國金融. 2010(03)
[8]基于信息熵和回歸分析的信用風(fēng)險(xiǎn)評估研究[J]. 王剛,韓立巖. 運(yùn)籌與管理. 2003(05)
本文編號:3458285
【文章來源】:武漢理工大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁數(shù)】:72 頁
【學(xué)位級別】:碩士
【部分圖文】:
本文組織結(jié)構(gòu)圖
圖 2-1 SVM 最優(yōu)超平面與最大化間隔樹(CART):CART 是一種決策樹算法,采用兩個(gè)步驟:1)對樣本遞歸劃分并建立二叉樹T 與 C4.5 算法類似,不同點(diǎn)在于 CART 支持計(jì)算規(guī)則集。NN 算法的思想比較簡單,對于一個(gè)給定的樣的距離公式(歐氏距離、余弦相似度等)找出這些樣本的類別來決定當(dāng)前樣本屬于哪一類機(jī) MLP:MLP 是一種監(jiān)督學(xué)習(xí)類型的神經(jīng)網(wǎng)LP 可以學(xué)習(xí)非線性的函數(shù)逼近,并且在輸入,圖 2-2 是只有一個(gè)隱藏層的 MLP 模型:使用 libFM[20]進(jìn)行實(shí)驗(yàn);對于 SVM,本章使核函數(shù)和 RBF 核函數(shù)進(jìn)行實(shí)驗(yàn);對于 KNN、on 開源機(jī)器學(xué)習(xí)工具包 scikit-learn3。
圖 2-2 包含一個(gè)隱藏層的 MLP 模型和假正率價(jià)比較關(guān)心準(zhǔn)確率和假正率的表現(xiàn),因此將這兩個(gè)表分別表示各算法在不同數(shù)據(jù)集上的表現(xiàn),并將每加粗顯示。表中的 A 表示準(zhǔn)確率,該指標(biāo)的值越示假正率,該指標(biāo)越低表示算法性能越好。表 2-2 Jiangsu 數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果M SVM-linear SVM-RBF KNN CART.993 0.7512 0.986 0.9872 0.9920178 0.7736 0.0966 0.0872 0.021表 2-3Australian 數(shù)據(jù)集上的實(shí)驗(yàn)結(jié)果
【參考文獻(xiàn)】:
期刊論文
[1]基于上市公司財(cái)務(wù)數(shù)據(jù)的企業(yè)信用風(fēng)險(xiǎn)預(yù)測Logistic模型研究[J]. 閆炳琪,趙月瑤,張輝. 中國傳媒大學(xué)學(xué)報(bào)(自然科學(xué)版). 2016(04)
[2]基于K-均值聚類的多值有序Logistic回歸模型在信用卡信用評級中的應(yīng)用研究[J]. 王純杰,李群,董小剛,林珊屹. 吉林師范大學(xué)學(xué)報(bào)(自然科學(xué)版). 2016(03)
[3]結(jié)合屬性重要度和灰色關(guān)聯(lián)度的數(shù)據(jù)補(bǔ)齊方法[J]. 王方心,潘巍,吳立鋒,金聲震,李曉娟. 計(jì)算機(jī)工程與設(shè)計(jì). 2014(01)
[4]我國小微企業(yè)發(fā)展問題研究[J]. 王俊峰,王巖. 商業(yè)研究. 2012(09)
[5]基于投影尋蹤和最優(yōu)分割的企業(yè)信用評級模型[J]. 張目,周宗放. 運(yùn)籌與管理. 2011(06)
[6]C2C交易中的動態(tài)信用評價(jià)模型[J]. 楊韻. 情報(bào)科學(xué). 2010(04)
[7]增加融資供給緩解小微企業(yè)融資難[J]. 魏國雄. 中國金融. 2010(03)
[8]基于信息熵和回歸分析的信用風(fēng)險(xiǎn)評估研究[J]. 王剛,韓立巖. 運(yùn)籌與管理. 2003(05)
本文編號:3458285
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3458285.html
最近更新
教材專著