基于自然語言處理與深度學(xué)習(xí)的信用貸款評估模型
發(fā)布時間:2021-12-09 03:10
針對信用貸款評估模型存在特征預(yù)處理復(fù)雜、受主觀因素干擾、準(zhǔn)確率較低等現(xiàn)象,提出一種新模型。該模型首先組建連續(xù)性信貸特征文本數(shù)據(jù),然后使用Word2Vec算法進(jìn)行詞向量化后通過詞嵌入層銜接卷積神經(jīng)網(wǎng)絡(luò)(CNN)進(jìn)行評估,通過Keras框架并依據(jù)2008~2018年的銀行個人信貸數(shù)據(jù)進(jìn)行實證分析。結(jié)果表明:新模型的總體評估準(zhǔn)確率高達(dá)91.7%,無需對缺失特征進(jìn)行處理并可直接評估,且評估準(zhǔn)確率更優(yōu)異,達(dá)到85.8%。新模型將離散型的信貸特征轉(zhuǎn)變?yōu)檫B續(xù)性文本,降低特征預(yù)處理復(fù)雜度,結(jié)合Word2Vec與自然語言處理實現(xiàn)直接評估缺失信貸特征的目的,并基于CNN優(yōu)異的特征分析能力最終提高信貸評估模型魯棒性,進(jìn)一步改善信用貸款評估模型中存在的部分問題,同時避免評估中主觀因素的干擾。
【文章來源】:系統(tǒng)管理學(xué)報. 2020,29(04)北大核心CSSCICSCD
【文章頁數(shù)】:10 頁
【部分圖文】:
CBOW模型運作圖
深度學(xué)習(xí)是基于數(shù)據(jù)進(jìn)行表征學(xué)習(xí)的方法,與傳統(tǒng)機(jī)器學(xué)習(xí)算法相比,其具有更優(yōu)異的特征提取能力,特別是深度學(xué)習(xí)分支下的卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)模型,在目標(biāo)檢測、自然語言處理等領(lǐng)域發(fā)揮了重要作用[22-25]。本文將CNN應(yīng)用于信貸評估領(lǐng)域,在WV-CNN模型內(nèi)構(gòu)建一維CNN,將詞向量化后的信貸特征文本作為該網(wǎng)絡(luò)的輸入進(jìn)行訓(xùn)練并評估。由圖2可知,WV-CNN模型的CNN部分首先將CBOW計算出的詞向量嵌入至CNN輸入層,稱為詞嵌入層。其次,構(gòu)建多重卷積層和池化層,由于信貸特征在時間維度上以一維向量的形式存在,因而卷積層與池化層的過濾器也是一維向量。同時,為了防止過擬合現(xiàn)象,在卷積層與池化層中加入Dropout層;Flatten層是基于多次卷積池化操作后進(jìn)行扁平化處理。最后,通過全連接層(Dense層)輸出信貸評估結(jié)果。
本文基于Tensorflow為后端的Keras實現(xiàn)WV-CNN模型。Keras是一個高級深度神經(jīng)網(wǎng)絡(luò)實現(xiàn)框架,具有模塊化、可擴(kuò)展性、快速部署神經(jīng)網(wǎng)絡(luò)等優(yōu)點[26-27]。圖3所示為WV-CNN模型在Keras中的部署圖。根據(jù)圖3,Keras根據(jù)WV-CNN模型的信貸特征文本預(yù)處理、詞向量化、模型訓(xùn)練與信貸評估3個過程,依次調(diào)用numpy、nltk和gensim等處理包進(jìn)行部署實現(xiàn)。結(jié)合圖3,Keras不僅是高級深度神經(jīng)網(wǎng)絡(luò)的實現(xiàn)框架,同時也提供多種模型和函數(shù)之間的銜接函數(shù),如Flatten數(shù)據(jù)扁平化處理函數(shù)、Dense數(shù)據(jù)全連接函數(shù)以及join語句連接函數(shù)等,這類銜接函數(shù)可以將文本預(yù)處理、詞向量化、訓(xùn)練及最終評估所產(chǎn)生的數(shù)據(jù)進(jìn)行數(shù)據(jù)銜接,從而形成整體的WV-CNN模型,進(jìn)一步完善了WV-CNN模型處理信貸數(shù)據(jù)的銜接性問題,提高了信貸評估的流暢性。另外,根據(jù)部署圖所示,將文本預(yù)處理、詞向量化、模型訓(xùn)練與信貸評估封裝在Keras內(nèi),不僅簡化評估的中間過程,若側(cè)重研究信貸特征的變化過程,同樣也可根據(jù)部署圖先探討信貸評估的內(nèi)部認(rèn)知結(jié)構(gòu),進(jìn)而調(diào)取信貸特征影響信貸評估結(jié)果的自主性,方便后續(xù)展開不同信貸特征對整個評估結(jié)果影響的研究。綜合而言,WV-CNN模型由于使用Word2Vec算法,因而可將單詞進(jìn)行相似度聚類,相比于其他特征處理方法,詞向量轉(zhuǎn)化更貼合實際定性表述,且CNN與傳統(tǒng)機(jī)器學(xué)習(xí)相比,具有更高效的特征分析與特征關(guān)聯(lián)判斷能力。因此,評估結(jié)果更高效準(zhǔn)確。同時,WV-CNN模型將Word2Vec和CNN通過詞嵌入層進(jìn)行銜接,使特征處理與模型評估有效結(jié)合,實現(xiàn)了端到端的整體化評估,避免多次操作帶來的繁瑣冗長。
【參考文獻(xiàn)】:
期刊論文
[1]基于動態(tài)權(quán)重的信用評級[J]. 葛興浪,劉海龍. 系統(tǒng)管理學(xué)報. 2019(02)
[2]A Text Sentiment Classification Modeling Method Based on Coordinated CNN-LSTM-Attention Model[J]. ZHANG Yangsen,ZHENG Jia,JIANG Yuru,HUANG Gaijuan,CHEN Ruoyu. Chinese Journal of Electronics. 2019(01)
[3]基于違約狀態(tài)聯(lián)合概率的商業(yè)銀行信貸資金行業(yè)間優(yōu)化配置模型[J]. 曹勇,李孟剛,李剛,常友玲. 系統(tǒng)管理學(xué)報. 2018(05)
[4]Using deep learning to detect small targets in infrared oversampling images[J]. LIN Liangkui,WANG Shaoyou,TANG Zhongxing. Journal of Systems Engineering and Electronics. 2018(05)
[5]基于ELECTRE III的農(nóng)戶小額貸款信用評級模型[J]. 石寶峰,王靜. 系統(tǒng)管理學(xué)報. 2018(05)
[6]Transcriptome analysis of adherens junction pathway-related genes after peripheral nerve injury[J]. Sheng Yi,Xing-Hui Wang,Ling-Yan Xing. Neural Regeneration Research. 2018(10)
[7]基于詞性與詞序的相關(guān)因子訓(xùn)練的word2vec改進(jìn)模型[J]. 潘博,于重重,張青川,徐世璇,曹帥. 電子學(xué)報. 2018(08)
[8]客戶特征影響信用卡業(yè)務(wù)盈利水平的結(jié)構(gòu)方程模型[J]. 王星,金淳,李延喜. 系統(tǒng)管理學(xué)報. 2018(03)
[9]Encoding syntactic representations with a neural network for sentiment collocation extraction[J]. Yanyan ZHAO,Bing QIN,Ting LIU. Science China(Information Sciences). 2017(11)
[10]Convolutional neural networks for expert recommendation in community question answering[J]. Jian WANG,Jiqing SUN,Hongfei LIN,Hualei DONG,Shaowu ZHANG. Science China(Information Sciences). 2017(11)
本文編號:3529797
【文章來源】:系統(tǒng)管理學(xué)報. 2020,29(04)北大核心CSSCICSCD
【文章頁數(shù)】:10 頁
【部分圖文】:
CBOW模型運作圖
深度學(xué)習(xí)是基于數(shù)據(jù)進(jìn)行表征學(xué)習(xí)的方法,與傳統(tǒng)機(jī)器學(xué)習(xí)算法相比,其具有更優(yōu)異的特征提取能力,特別是深度學(xué)習(xí)分支下的卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)模型,在目標(biāo)檢測、自然語言處理等領(lǐng)域發(fā)揮了重要作用[22-25]。本文將CNN應(yīng)用于信貸評估領(lǐng)域,在WV-CNN模型內(nèi)構(gòu)建一維CNN,將詞向量化后的信貸特征文本作為該網(wǎng)絡(luò)的輸入進(jìn)行訓(xùn)練并評估。由圖2可知,WV-CNN模型的CNN部分首先將CBOW計算出的詞向量嵌入至CNN輸入層,稱為詞嵌入層。其次,構(gòu)建多重卷積層和池化層,由于信貸特征在時間維度上以一維向量的形式存在,因而卷積層與池化層的過濾器也是一維向量。同時,為了防止過擬合現(xiàn)象,在卷積層與池化層中加入Dropout層;Flatten層是基于多次卷積池化操作后進(jìn)行扁平化處理。最后,通過全連接層(Dense層)輸出信貸評估結(jié)果。
本文基于Tensorflow為后端的Keras實現(xiàn)WV-CNN模型。Keras是一個高級深度神經(jīng)網(wǎng)絡(luò)實現(xiàn)框架,具有模塊化、可擴(kuò)展性、快速部署神經(jīng)網(wǎng)絡(luò)等優(yōu)點[26-27]。圖3所示為WV-CNN模型在Keras中的部署圖。根據(jù)圖3,Keras根據(jù)WV-CNN模型的信貸特征文本預(yù)處理、詞向量化、模型訓(xùn)練與信貸評估3個過程,依次調(diào)用numpy、nltk和gensim等處理包進(jìn)行部署實現(xiàn)。結(jié)合圖3,Keras不僅是高級深度神經(jīng)網(wǎng)絡(luò)的實現(xiàn)框架,同時也提供多種模型和函數(shù)之間的銜接函數(shù),如Flatten數(shù)據(jù)扁平化處理函數(shù)、Dense數(shù)據(jù)全連接函數(shù)以及join語句連接函數(shù)等,這類銜接函數(shù)可以將文本預(yù)處理、詞向量化、訓(xùn)練及最終評估所產(chǎn)生的數(shù)據(jù)進(jìn)行數(shù)據(jù)銜接,從而形成整體的WV-CNN模型,進(jìn)一步完善了WV-CNN模型處理信貸數(shù)據(jù)的銜接性問題,提高了信貸評估的流暢性。另外,根據(jù)部署圖所示,將文本預(yù)處理、詞向量化、模型訓(xùn)練與信貸評估封裝在Keras內(nèi),不僅簡化評估的中間過程,若側(cè)重研究信貸特征的變化過程,同樣也可根據(jù)部署圖先探討信貸評估的內(nèi)部認(rèn)知結(jié)構(gòu),進(jìn)而調(diào)取信貸特征影響信貸評估結(jié)果的自主性,方便后續(xù)展開不同信貸特征對整個評估結(jié)果影響的研究。綜合而言,WV-CNN模型由于使用Word2Vec算法,因而可將單詞進(jìn)行相似度聚類,相比于其他特征處理方法,詞向量轉(zhuǎn)化更貼合實際定性表述,且CNN與傳統(tǒng)機(jī)器學(xué)習(xí)相比,具有更高效的特征分析與特征關(guān)聯(lián)判斷能力。因此,評估結(jié)果更高效準(zhǔn)確。同時,WV-CNN模型將Word2Vec和CNN通過詞嵌入層進(jìn)行銜接,使特征處理與模型評估有效結(jié)合,實現(xiàn)了端到端的整體化評估,避免多次操作帶來的繁瑣冗長。
【參考文獻(xiàn)】:
期刊論文
[1]基于動態(tài)權(quán)重的信用評級[J]. 葛興浪,劉海龍. 系統(tǒng)管理學(xué)報. 2019(02)
[2]A Text Sentiment Classification Modeling Method Based on Coordinated CNN-LSTM-Attention Model[J]. ZHANG Yangsen,ZHENG Jia,JIANG Yuru,HUANG Gaijuan,CHEN Ruoyu. Chinese Journal of Electronics. 2019(01)
[3]基于違約狀態(tài)聯(lián)合概率的商業(yè)銀行信貸資金行業(yè)間優(yōu)化配置模型[J]. 曹勇,李孟剛,李剛,常友玲. 系統(tǒng)管理學(xué)報. 2018(05)
[4]Using deep learning to detect small targets in infrared oversampling images[J]. LIN Liangkui,WANG Shaoyou,TANG Zhongxing. Journal of Systems Engineering and Electronics. 2018(05)
[5]基于ELECTRE III的農(nóng)戶小額貸款信用評級模型[J]. 石寶峰,王靜. 系統(tǒng)管理學(xué)報. 2018(05)
[6]Transcriptome analysis of adherens junction pathway-related genes after peripheral nerve injury[J]. Sheng Yi,Xing-Hui Wang,Ling-Yan Xing. Neural Regeneration Research. 2018(10)
[7]基于詞性與詞序的相關(guān)因子訓(xùn)練的word2vec改進(jìn)模型[J]. 潘博,于重重,張青川,徐世璇,曹帥. 電子學(xué)報. 2018(08)
[8]客戶特征影響信用卡業(yè)務(wù)盈利水平的結(jié)構(gòu)方程模型[J]. 王星,金淳,李延喜. 系統(tǒng)管理學(xué)報. 2018(03)
[9]Encoding syntactic representations with a neural network for sentiment collocation extraction[J]. Yanyan ZHAO,Bing QIN,Ting LIU. Science China(Information Sciences). 2017(11)
[10]Convolutional neural networks for expert recommendation in community question answering[J]. Jian WANG,Jiqing SUN,Hongfei LIN,Hualei DONG,Shaowu ZHANG. Science China(Information Sciences). 2017(11)
本文編號:3529797
本文鏈接:http://sikaile.net/jingjilunwen/hongguanjingjilunwen/3529797.html
最近更新
教材專著