小樣本低質(zhì)量數(shù)據(jù)下貸款需求分類(lèi)模型研究
本文選題:邏輯回歸 切入點(diǎn):數(shù)據(jù)預(yù)處理 出處:《吉林大學(xué)》2016年碩士論文 論文類(lèi)型:學(xué)位論文
【摘要】:近年來(lái),隨著國(guó)民經(jīng)濟(jì)的快速發(fā)展,以及國(guó)家相關(guān)政策的鼓勵(lì)扶持,中小型企業(yè)大量出現(xiàn).隨之而來(lái)的問(wèn)題是小額度貸款的需求量增大.與傳統(tǒng)的銀行借貸模式相比,小額度貸款更具靈活性.因此,如何快速、準(zhǔn)確的判斷一個(gè)企業(yè)是否有貸款需求至關(guān)重要.本文主要針對(duì)中小型企業(yè)的貸款問(wèn)題,在完整展現(xiàn)企業(yè)數(shù)據(jù)分析流程的基礎(chǔ)上,討論了在小樣本低質(zhì)量數(shù)據(jù)的情況下,如何有效地進(jìn)行數(shù)據(jù)分析、建模.本文在數(shù)據(jù)缺失特征較多、數(shù)據(jù)來(lái)源較差、數(shù)據(jù)量較少的情況下,詳細(xì)討論了如何進(jìn)行數(shù)據(jù)預(yù)處理、探索性數(shù)據(jù)分析和模型建立.在數(shù)據(jù)預(yù)處理過(guò)程中,采用了“嚴(yán)內(nèi)寬外”以及“全部寬松”兩種策略相結(jié)合的方式對(duì)數(shù)據(jù)進(jìn)行貸款需求標(biāo)注;在探索性數(shù)據(jù)研究過(guò)程中,采用了不同貸款需求下單變量分析的方法;在模型建立的過(guò)程中,采用了條件投票選擇的模型聚合方法.最后我們得到了一個(gè)穩(wěn)定性相對(duì)較高的貸款需求模型,且最終模型的預(yù)測(cè)準(zhǔn)確率達(dá)到了76%.在建模過(guò)程中,采用邏輯回歸模型作為基本模型,減小了過(guò)擬合風(fēng)險(xiǎn);在數(shù)據(jù)分析流程中,充分考慮了建模目的以及之后的模型更新.因此,通過(guò)在整個(gè)數(shù)據(jù)流程上的特別處理及分析,最終模型較好的擬合了小樣本低質(zhì)量數(shù)據(jù)下中小型企業(yè)的貸款需求.我們根據(jù)最終模型對(duì)新的數(shù)據(jù)推薦出一批企業(yè),得到了良好的反饋結(jié)果.
[Abstract]:In recent years, with the rapid development of national economy and the encouragement and support of relevant national policies, small and medium-sized enterprises have appeared in large numbers. Small loans are more flexible. Therefore, how to quickly and accurately judge whether an enterprise has loan demand is very important. This paper mainly focuses on the loan problem of small and medium-sized enterprises, on the basis of showing the whole process of enterprise data analysis. This paper discusses how to carry out data analysis and modeling effectively in the case of small sample and low quality data. In this paper, we discuss how to preprocess the data in detail under the condition that there are many missing features, poor data sources and less data quantity. Exploratory data analysis and modeling. In the process of data preprocessing, we use the combination of "strict inside wide" and "all loose" strategy to mark the loan demand of the data. The univariate analysis method under different loan demand is adopted, and the model aggregation method of conditional voting is used in the process of establishing the model. Finally, we obtain a relatively stable loan demand model. In the process of modeling, the logical regression model is used as the basic model to reduce the risk of over-fitting. In the process of data analysis, the purpose of modeling and the subsequent updating of the model are fully considered. Through the special processing and analysis on the whole data flow, the final model fits the loan demand of small and medium-sized enterprises with small sample and low quality data. We recommend a group of enterprises according to the final model for the new data. Good feedback results are obtained.
【學(xué)位授予單位】:吉林大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類(lèi)號(hào)】:F832.4
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 周春平;;收入、收入滿(mǎn)意度對(duì)居民主觀幸福感影響實(shí)證研究——來(lái)自江蘇的證據(jù)[J];南京航空航天大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版);2013年01期
2 劉遵雄;黃志強(qiáng);鄭淑娟;張恒;;基于內(nèi)點(diǎn)法的稀疏邏輯回歸財(cái)務(wù)預(yù)警模型[J];計(jì)算機(jī)工程與設(shè)計(jì);2013年06期
3 ;《信用風(fēng)險(xiǎn)評(píng)分卡研究》[J];銀行家;2014年02期
4 張秀蘭;;邏輯回歸模型下的企業(yè)財(cái)務(wù)預(yù)警實(shí)證研究[J];求索;2012年01期
5 劉遵雄;黃志強(qiáng);孫清;張恒;;SCAD懲罰邏輯回歸的財(cái)務(wù)預(yù)警模型[J];統(tǒng)計(jì)與信息論壇;2012年12期
6 邢秋菊,趙純勇,高克昌,郭躍;基于GIS的滑坡危險(xiǎn)性邏輯回歸評(píng)價(jià)研究[J];地理與地理信息科學(xué);2004年03期
7 林辰樂(lè);呂翔濤;;影響城市低保受助者就業(yè)的政策因素分析——就業(yè)的雙項(xiàng)邏輯回歸模型及訪談實(shí)證研究[J];中國(guó)軟科學(xué);2012年08期
8 李霞;;基于邏輯回歸的電子企業(yè)員工工作滿(mǎn)意度研究[J];鄭州航空工業(yè)管理學(xué)院學(xué)報(bào);2010年01期
9 田永峰;王仕軍;;讓經(jīng)濟(jì)邏輯回歸文化自覺(jué)——亞當(dāng)·斯密理論體系中兩條主線關(guān)系的辨正[J];湖北經(jīng)濟(jì)學(xué)院學(xué)報(bào);2012年01期
10 趙路明;;ST公司有效利用盈余管理的實(shí)證研究[J];黑龍江科技信息;2007年02期
相關(guān)博士學(xué)位論文 前1條
1 張道軍;邏輯回歸空間加權(quán)技術(shù)及其在礦產(chǎn)資源信息綜合中的應(yīng)用[D];中國(guó)地質(zhì)大學(xué);2015年
相關(guān)碩士學(xué)位論文 前10條
1 粟武林;一種基于邏輯回歸的微博用戶(hù)可信度評(píng)估方法[D];河北大學(xué);2015年
2 胡俊;基于多元邏輯回歸和鄰域信息的高光譜遙感影像半監(jiān)督分類(lèi)[D];中國(guó)礦業(yè)大學(xué);2015年
3 伊瑤瑤;基于Hadoop的數(shù)據(jù)挖掘技術(shù)研究[D];南京郵電大學(xué);2015年
4 張曉旭;基于復(fù)雜網(wǎng)絡(luò)理論的厄爾尼諾分析與預(yù)測(cè)[D];中國(guó)海洋大學(xué);2015年
5 喬寧;多元邏輯回歸在實(shí)時(shí)競(jìng)價(jià)中的應(yīng)用研究[D];河北工業(yè)大學(xué);2015年
6 李雁林;小樣本低質(zhì)量數(shù)據(jù)下貸款需求分類(lèi)模型研究[D];吉林大學(xué);2016年
7 董純潔;基于實(shí)例與邏輯回歸的多標(biāo)簽分類(lèi)模型[D];南京大學(xué);2013年
8 祁全昌;基于內(nèi)容廣告平臺(tái)的點(diǎn)擊率預(yù)估系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];南京大學(xué);2012年
9 劉力銀;基于邏輯回歸的推薦技術(shù)研究及應(yīng)用[D];電子科技大學(xué);2013年
10 周建成;存在“就是”句子的句間關(guān)系識(shí)別研究[D];杭州電子科技大學(xué);2015年
,本文編號(hào):1558339
本文鏈接:http://sikaile.net/jingjilunwen/guojijinrong/1558339.html