基于復(fù)合CatBoost模型的P2P網(wǎng)貸違約分類預(yù)測
【學(xué)位授予單位】:蘭州大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:F832.4;F724.6
【圖文】:
本文選取 ENN 算法、RENN 算法、NCR 算法、Borrline2-SMOTE 算法、ADASYN 算法、SMOTE+TomN 算法對數(shù)據(jù)集進行均衡處理。量機(SVM)機是由 Cortes 和 Vapnik[32]于 1995 年提出,不僅可問題的研究,SVM 作為經(jīng)典算法已被應(yīng)用在很多空氣質(zhì)量預(yù)測、電力預(yù)測等,其作為分類模型的主一個使得正反兩類樣本之間間隔最大的分類超平面魯棒的。若樣本在當(dāng)前特征空間中是線性可分的,分類超平面;若樣本屬于線性不可分情況,則引入射到其可以實現(xiàn)線性可分的高維空間(如圖 2-1 所以在低維進行計算克服計算量大的難題,也可以使的效果。
學(xué)碩士學(xué)位論文 基于復(fù)合 CatBoost 模型的 P2P 網(wǎng)貸違約分類預(yù)moid 核: ( ,) tanh( )jTijik xxxx,tanh 是雙曲正切函數(shù), 0, 使用 SVM 進行二分類預(yù)測時,選擇的是比較常用的高斯核。森林(RF)森林原理法是通過學(xué)習(xí)多個基礎(chǔ)模型來完成學(xué)習(xí)任務(wù),每個經(jīng)過訓(xùn)練的基礎(chǔ)習(xí)器,然后將多個基學(xué)習(xí)器的結(jié)果整合后輸出,輸出的結(jié)果作為最(如圖 2-2 所示)。集成學(xué)習(xí)可以分為兩種類型:同質(zhì)集成和異質(zhì)成是每個基學(xué)習(xí)器使用的是同種學(xué)習(xí)算法,異質(zhì)集成是允許基學(xué)習(xí)學(xué)習(xí)算法,比如所有基礎(chǔ)模型中,有的學(xué)習(xí)算法是決策樹,有的是隨機森林是基于并行集成算法的典型代表-Bagging 的擴展變體,是決策樹,是同質(zhì)集成類型。
圖 2-3 PR 曲線示意圖橫軸為查全率,縱軸為查準(zhǔn)率。如果一個模型個模型的 PR 曲線,則前者的性能要比后者好;,那么將無法直接判斷兩個模型的優(yōu)劣,因為 P此可依據(jù)具體的業(yè)務(wù)目標(biāo)計算 F , F 為查準(zhǔn)率域?qū)W習(xí)目標(biāo)不同,比如,電子商務(wù)平臺需要對他們就更看重查準(zhǔn)率;而對于抓捕逃犯來說,看重查全率。因此,我們在實際業(yè)務(wù)中需要根供了這樣的機會,可以通過調(diào)節(jié) 值來實現(xiàn),,查全率有較大影響;當(dāng) 小于 1 時,查準(zhǔn)率 AUCceiver Operating Characteristic)曲線被經(jīng)常應(yīng)常,()(1)22PRPRF
【相似文獻】
相關(guān)期刊論文 前10條
1 宋維康;徐冰;;煤與瓦斯突出分類預(yù)測方法分析[J];煤;2016年04期
2 李倩倩;姜景;李瑛;劉怡君;;我國政務(wù)微博轉(zhuǎn)發(fā)規(guī)模分類預(yù)測[J];情報雜志;2018年01期
3 路小娟;朱正平;;太陽能光伏發(fā)電量分類預(yù)測研究[J];自動化與儀器儀表;2016年01期
4 陸桂明;張源;周志敏;;基于機器學(xué)習(xí)的貧困生分類預(yù)測研究[J];計算機應(yīng)用與軟件;2019年01期
5 張學(xué)扶;曾攀;金敏;;相關(guān)性和相似度聯(lián)合的癌癥分類預(yù)測[J];計算機科學(xué);2019年07期
6 屈玉濤;鄧萬宇;;基于matlab的svm分類預(yù)測實現(xiàn)[J];信息通信;2017年03期
7 王與;劉洋;;分類技術(shù)在高校教學(xué)管理中的應(yīng)用[J];滁州學(xué)院學(xué)報;2011年05期
8 莫世華,俞敏;霍亂發(fā)病地區(qū)分類預(yù)測方法研究[J];浙江預(yù)防醫(yī)學(xué);1999年10期
9 馬寅午,周曉陽,尚金成,張勇傳,顧寧昌,劉丹雅,譚培倫;防洪系統(tǒng)洪水分類預(yù)測優(yōu)化調(diào)度方法[J];水利學(xué)報;1997年04期
10 陳暉;胡澤根;李云鵬;葛麗珍;李彥來;;自組織神經(jīng)網(wǎng)絡(luò)技術(shù)在新油田快速評價中的應(yīng)用[J];重慶科技學(xué)院學(xué)報(自然科學(xué)版);2017年02期
相關(guān)會議論文 前3條
1 沈杰;李衛(wèi)華;唐峗;;一種基于化合物子結(jié)構(gòu)模式識別的分類預(yù)測方法[A];中國化學(xué)會第27屆學(xué)術(shù)年會第15分會場摘要集[C];2010年
2 孫蕾;羅建書;;基于分類預(yù)測的高光譜遙感圖像無損壓縮[A];第一屆建立和諧人機環(huán)境聯(lián)合學(xué)術(shù)會議(HHME2005)論文集[C];2005年
3 羅三華;黃建華;邱建丁;;小波支持向量機在蛋白質(zhì)二級結(jié)構(gòu)分類預(yù)測中應(yīng)用[A];中國化學(xué)會第26屆學(xué)術(shù)年會化學(xué)信息學(xué)與化學(xué)計量學(xué)分會場論文集[C];2008年
相關(guān)博士學(xué)位論文 前4條
1 劉惠;蛋白質(zhì)序列數(shù)據(jù)的分類預(yù)測研究[D];上海交通大學(xué);2007年
2 王立鵬;特征提取及分類算法在膜蛋白分類預(yù)測問題中的應(yīng)用[D];蘭州理工大學(xué);2010年
3 廖志芳;大腸早癌輔助診斷數(shù)據(jù)挖掘方法研究[D];中南大學(xué);2008年
4 王彤;高維生物數(shù)據(jù)的分類與預(yù)測研究[D];上海交通大學(xué);2009年
相關(guān)碩士學(xué)位論文 前10條
1 邵亞潔;基于復(fù)合CatBoost模型的P2P網(wǎng)貸違約分類預(yù)測[D];蘭州大學(xué);2019年
2 王會娜;基于特征提取的肝癌患者乙肝病毒再激活的分類預(yù)測[D];齊魯工業(yè)大學(xué);2018年
3 王曉明;基于分類預(yù)測技術(shù)的軟件成本估算方法的研究與應(yīng)用[D];國防科學(xué)技術(shù)大學(xué);2010年
4 安俊峰;游戲評價數(shù)據(jù)的分類預(yù)測研究[D];東華大學(xué);2014年
5 張吉寬;蛋白質(zhì)熱穩(wěn)定性分類預(yù)測系統(tǒng)的設(shè)計與實現(xiàn)[D];遼寧大學(xué);2016年
6 陶雨雨;決策樹及神經(jīng)網(wǎng)絡(luò)算法在股票分類預(yù)測中的應(yīng)用[D];杭州電子科技大學(xué);2014年
7 石雪娜;基于壓縮感知的蛋白質(zhì)功能分類預(yù)測[D];北京交通大學(xué);2014年
8 楊曉鵬;大數(shù)據(jù)環(huán)境下隱私保護的預(yù)測服務(wù)機制研究[D];西安電子科技大學(xué);2017年
9 肖芳;工業(yè)產(chǎn)品運輸需求分類預(yù)測理論研究[D];長安大學(xué);2011年
10 于成群;基于集成學(xué)習(xí)的數(shù)據(jù)庫營銷研究[D];重慶大學(xué);2016年
本文編號:2756195
本文鏈接:http://sikaile.net/jingjilunwen/guojimaoyilunwen/2756195.html