基于數(shù)據(jù)挖掘的銀行電話精準(zhǔn)營(yíng)銷(xiāo)
發(fā)布時(shí)間:2021-04-10 17:34
隨著數(shù)據(jù)時(shí)代的到來(lái)和數(shù)據(jù)挖掘技術(shù)的廣泛應(yīng)用,銀行金融產(chǎn)品不再是以前單一的、廣泛式的撒網(wǎng)銷(xiāo)售,而是依托于大數(shù)據(jù)的智能分析和算法的準(zhǔn)確判斷,進(jìn)行多樣化的精準(zhǔn)營(yíng)銷(xiāo)。電話營(yíng)銷(xiāo)作為銀行業(yè)傳統(tǒng)的營(yíng)銷(xiāo)方式,在獲取客戶方面是行之有效的。傳統(tǒng)的銀行電話營(yíng)銷(xiāo)方式由于隨機(jī)性、低命中率,難以滿足時(shí)代發(fā)展的需求。如何利用好銀行數(shù)據(jù)庫(kù)中的各種數(shù)據(jù),進(jìn)行科學(xué)有效的電話營(yíng)銷(xiāo),是實(shí)現(xiàn)銀行數(shù)字化、網(wǎng)點(diǎn)智能化的關(guān)鍵所在。本文的研究對(duì)象是預(yù)測(cè)銀行電話營(yíng)銷(xiāo)的結(jié)果,由于行業(yè)特點(diǎn),銀行客戶數(shù)據(jù)集是不平衡的。目前的銀行電話營(yíng)銷(xiāo)研究大多集中在提升模型效果上,雖然模型預(yù)測(cè)結(jié)果都不錯(cuò),但由于模型訓(xùn)練選取的數(shù)據(jù)集多為平衡數(shù)據(jù)集,改變了數(shù)據(jù)集原有的分布,且僅憑一兩個(gè)指標(biāo)便選出最優(yōu)模型,不夠全面,與實(shí)際應(yīng)用有所偏差。因此,本課題從數(shù)據(jù)層面出發(fā),結(jié)合數(shù)據(jù)集的分布,利用數(shù)據(jù)挖掘工具,綜合考慮多個(gè)評(píng)價(jià)指標(biāo),研究不平衡數(shù)據(jù)集的各種采樣策略對(duì)模型效果的影響,對(duì)比得到最佳采樣策略,尋找最佳采樣策略下的最佳模型,以此來(lái)提高模型預(yù)測(cè)的效果和營(yíng)銷(xiāo)成功率,實(shí)現(xiàn)精準(zhǔn)營(yíng)銷(xiāo)。最后,對(duì)預(yù)測(cè)錯(cuò)誤的樣本進(jìn)行了統(tǒng)計(jì)分析,并根據(jù)預(yù)測(cè)結(jié)果進(jìn)行客群分類(lèi),挖掘潛在客戶具有的特征,從增加...
【文章來(lái)源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁(yè)數(shù)】:71 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
sigmoid函數(shù)
哈爾濱工業(yè)大學(xué)應(yīng)用統(tǒng)計(jì)碩士學(xué)位論文-22-特征處理方式和并行策略四個(gè)方面將兩個(gè)算法進(jìn)行對(duì)比,以此得到LightGBM算法的改進(jìn)部分的優(yōu)缺點(diǎn)。在特征選擇方面,XGBoost采用的是pre-sorted算法,LightGBM采用的是histogram算法。CART決策樹(shù)在選擇特征時(shí),需要遍歷所有特征的所有分割點(diǎn),根據(jù)基尼系數(shù)來(lái)選擇最佳特征和最佳分割點(diǎn),這樣的方法在數(shù)據(jù)量大的情況下復(fù)雜度較高。XGBoost沿用了CART樹(shù)特征選擇的方法,對(duì)于遍歷到某一特征時(shí),先將樣本按該特征的基尼取值排序,然后根據(jù)排序樣本的二階梯度進(jìn)行分割,找到合適的分割點(diǎn)。與此不同的是,LightGBM不進(jìn)行預(yù)排序,而是采用histogram算法將連續(xù)特征離散化后做頻數(shù)直方圖來(lái)尋找特征的最佳二分點(diǎn)。這樣,不僅可以減少內(nèi)存,還可以降低數(shù)據(jù)分割的復(fù)雜度。但histogram算法也有缺點(diǎn),它不能找到精確的分割點(diǎn),訓(xùn)練誤差沒(méi)有pre-sorted算法低。在樹(shù)的切分策略方面,XGBoost采用的是Level-wise葉子生長(zhǎng)策略,如圖3-4所示;LightGBM采用的是帶深度限制的Left-wise葉子生長(zhǎng)策略,如圖3-5所示。Level-wise中的樹(shù)是一層一層進(jìn)行生長(zhǎng)的,同一層的所有節(jié)點(diǎn)都進(jìn)行分裂,最后剪枝。由于有些葉子節(jié)點(diǎn)的信息增益并不大,攜帶的信息量較少,沒(méi)必要進(jìn)行分裂,而Level-wise不加區(qū)分的對(duì)每一層節(jié)點(diǎn)進(jìn)行分裂,會(huì)加大計(jì)算量。而LightGBM使用的是帶有深度限制的Left-wise葉子生長(zhǎng)策略,每一層只對(duì)增益最大的節(jié)點(diǎn)進(jìn)行分裂。Left-wise葉子生長(zhǎng)策略的缺點(diǎn)是當(dāng)數(shù)據(jù)量較少時(shí),會(huì)長(zhǎng)出比較深的樹(shù),產(chǎn)生過(guò)擬合,降低模型的泛化性和精度。圖3-4Level-wise葉子生長(zhǎng)策略圖3-5Left-wise葉子生長(zhǎng)策略
哈爾濱工業(yè)大學(xué)應(yīng)用統(tǒng)計(jì)碩士學(xué)位論文-22-特征處理方式和并行策略四個(gè)方面將兩個(gè)算法進(jìn)行對(duì)比,以此得到LightGBM算法的改進(jìn)部分的優(yōu)缺點(diǎn)。在特征選擇方面,XGBoost采用的是pre-sorted算法,LightGBM采用的是histogram算法。CART決策樹(shù)在選擇特征時(shí),需要遍歷所有特征的所有分割點(diǎn),根據(jù)基尼系數(shù)來(lái)選擇最佳特征和最佳分割點(diǎn),這樣的方法在數(shù)據(jù)量大的情況下復(fù)雜度較高。XGBoost沿用了CART樹(shù)特征選擇的方法,對(duì)于遍歷到某一特征時(shí),先將樣本按該特征的基尼取值排序,然后根據(jù)排序樣本的二階梯度進(jìn)行分割,找到合適的分割點(diǎn)。與此不同的是,LightGBM不進(jìn)行預(yù)排序,而是采用histogram算法將連續(xù)特征離散化后做頻數(shù)直方圖來(lái)尋找特征的最佳二分點(diǎn)。這樣,不僅可以減少內(nèi)存,還可以降低數(shù)據(jù)分割的復(fù)雜度。但histogram算法也有缺點(diǎn),它不能找到精確的分割點(diǎn),訓(xùn)練誤差沒(méi)有pre-sorted算法低。在樹(shù)的切分策略方面,XGBoost采用的是Level-wise葉子生長(zhǎng)策略,如圖3-4所示;LightGBM采用的是帶深度限制的Left-wise葉子生長(zhǎng)策略,如圖3-5所示。Level-wise中的樹(shù)是一層一層進(jìn)行生長(zhǎng)的,同一層的所有節(jié)點(diǎn)都進(jìn)行分裂,最后剪枝。由于有些葉子節(jié)點(diǎn)的信息增益并不大,攜帶的信息量較少,沒(méi)必要進(jìn)行分裂,而Level-wise不加區(qū)分的對(duì)每一層節(jié)點(diǎn)進(jìn)行分裂,會(huì)加大計(jì)算量。而LightGBM使用的是帶有深度限制的Left-wise葉子生長(zhǎng)策略,每一層只對(duì)增益最大的節(jié)點(diǎn)進(jìn)行分裂。Left-wise葉子生長(zhǎng)策略的缺點(diǎn)是當(dāng)數(shù)據(jù)量較少時(shí),會(huì)長(zhǎng)出比較深的樹(shù),產(chǎn)生過(guò)擬合,降低模型的泛化性和精度。圖3-4Level-wise葉子生長(zhǎng)策略圖3-5Left-wise葉子生長(zhǎng)策略
【參考文獻(xiàn)】:
期刊論文
[1]不平衡數(shù)據(jù)的下采樣方法研究[J]. 周建偉. 計(jì)算機(jī)與數(shù)字工程. 2019(09)
[2]基于Xgboost和LightGBM算法預(yù)測(cè)住房月租金的應(yīng)用分析[J]. 謝勇,項(xiàng)薇,季孟忠,彭俊,黃益槐. 計(jì)算機(jī)應(yīng)用與軟件. 2019(09)
[3]基于LightGBM的銀行信用卡違約研究[J]. 張國(guó)慶,昌寧. 科技資訊. 2019(12)
[4]不平衡數(shù)據(jù)分類(lèi)方法綜述[J]. 李艷霞,柴毅,胡友強(qiáng),尹宏鵬. 控制與決策. 2019(04)
[5]基于數(shù)據(jù)挖掘的銀行電話營(yíng)銷(xiāo)預(yù)測(cè)研究[J]. 宣子岳. 現(xiàn)代商業(yè). 2018(24)
[6]不平衡數(shù)據(jù)分類(lèi)問(wèn)題解決辦法[J]. 季晨雨. 電子技術(shù)與軟件工程. 2018(15)
[7]面向不平衡數(shù)據(jù)集的一種精化Borderline-SMOTE方法[J]. 楊毅,盧誠(chéng)波,徐根海. 復(fù)旦學(xué)報(bào)(自然科學(xué)版). 2017(05)
[8]“互聯(lián)網(wǎng)+”時(shí)代商業(yè)銀行電話營(yíng)銷(xiāo)轉(zhuǎn)型與發(fā)展[J]. 中國(guó)信用卡. 2015(11)
[9]試論大數(shù)據(jù)時(shí)代企業(yè)的營(yíng)銷(xiāo)模式[J]. 張潔梅,李麗珂. 黨政干部學(xué)刊. 2014(12)
[10]我國(guó)電話營(yíng)銷(xiāo)的發(fā)展[J]. 張冠瓊. 商業(yè)文化(上半月). 2012(02)
碩士論文
[1]Stacking集成模型在銀行電話營(yíng)銷(xiāo)中的應(yīng)用[D]. 王艷雯.蘭州大學(xué) 2019
[2]銀行電話營(yíng)銷(xiāo)成功之路的分析與預(yù)測(cè)[D]. 高麗.華中師范大學(xué) 2017
[3]決策樹(shù)算法在銀行電話營(yíng)銷(xiāo)中的應(yīng)用[D]. 李明月.華中科技大學(xué) 2016
[4]Z銀行信用卡客戶的電話營(yíng)銷(xiāo)策略研究[D]. 姚穎.大連理工大學(xué) 2013
本文編號(hào):3130052
【文章來(lái)源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁(yè)數(shù)】:71 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
sigmoid函數(shù)
哈爾濱工業(yè)大學(xué)應(yīng)用統(tǒng)計(jì)碩士學(xué)位論文-22-特征處理方式和并行策略四個(gè)方面將兩個(gè)算法進(jìn)行對(duì)比,以此得到LightGBM算法的改進(jìn)部分的優(yōu)缺點(diǎn)。在特征選擇方面,XGBoost采用的是pre-sorted算法,LightGBM采用的是histogram算法。CART決策樹(shù)在選擇特征時(shí),需要遍歷所有特征的所有分割點(diǎn),根據(jù)基尼系數(shù)來(lái)選擇最佳特征和最佳分割點(diǎn),這樣的方法在數(shù)據(jù)量大的情況下復(fù)雜度較高。XGBoost沿用了CART樹(shù)特征選擇的方法,對(duì)于遍歷到某一特征時(shí),先將樣本按該特征的基尼取值排序,然后根據(jù)排序樣本的二階梯度進(jìn)行分割,找到合適的分割點(diǎn)。與此不同的是,LightGBM不進(jìn)行預(yù)排序,而是采用histogram算法將連續(xù)特征離散化后做頻數(shù)直方圖來(lái)尋找特征的最佳二分點(diǎn)。這樣,不僅可以減少內(nèi)存,還可以降低數(shù)據(jù)分割的復(fù)雜度。但histogram算法也有缺點(diǎn),它不能找到精確的分割點(diǎn),訓(xùn)練誤差沒(méi)有pre-sorted算法低。在樹(shù)的切分策略方面,XGBoost采用的是Level-wise葉子生長(zhǎng)策略,如圖3-4所示;LightGBM采用的是帶深度限制的Left-wise葉子生長(zhǎng)策略,如圖3-5所示。Level-wise中的樹(shù)是一層一層進(jìn)行生長(zhǎng)的,同一層的所有節(jié)點(diǎn)都進(jìn)行分裂,最后剪枝。由于有些葉子節(jié)點(diǎn)的信息增益并不大,攜帶的信息量較少,沒(méi)必要進(jìn)行分裂,而Level-wise不加區(qū)分的對(duì)每一層節(jié)點(diǎn)進(jìn)行分裂,會(huì)加大計(jì)算量。而LightGBM使用的是帶有深度限制的Left-wise葉子生長(zhǎng)策略,每一層只對(duì)增益最大的節(jié)點(diǎn)進(jìn)行分裂。Left-wise葉子生長(zhǎng)策略的缺點(diǎn)是當(dāng)數(shù)據(jù)量較少時(shí),會(huì)長(zhǎng)出比較深的樹(shù),產(chǎn)生過(guò)擬合,降低模型的泛化性和精度。圖3-4Level-wise葉子生長(zhǎng)策略圖3-5Left-wise葉子生長(zhǎng)策略
哈爾濱工業(yè)大學(xué)應(yīng)用統(tǒng)計(jì)碩士學(xué)位論文-22-特征處理方式和并行策略四個(gè)方面將兩個(gè)算法進(jìn)行對(duì)比,以此得到LightGBM算法的改進(jìn)部分的優(yōu)缺點(diǎn)。在特征選擇方面,XGBoost采用的是pre-sorted算法,LightGBM采用的是histogram算法。CART決策樹(shù)在選擇特征時(shí),需要遍歷所有特征的所有分割點(diǎn),根據(jù)基尼系數(shù)來(lái)選擇最佳特征和最佳分割點(diǎn),這樣的方法在數(shù)據(jù)量大的情況下復(fù)雜度較高。XGBoost沿用了CART樹(shù)特征選擇的方法,對(duì)于遍歷到某一特征時(shí),先將樣本按該特征的基尼取值排序,然后根據(jù)排序樣本的二階梯度進(jìn)行分割,找到合適的分割點(diǎn)。與此不同的是,LightGBM不進(jìn)行預(yù)排序,而是采用histogram算法將連續(xù)特征離散化后做頻數(shù)直方圖來(lái)尋找特征的最佳二分點(diǎn)。這樣,不僅可以減少內(nèi)存,還可以降低數(shù)據(jù)分割的復(fù)雜度。但histogram算法也有缺點(diǎn),它不能找到精確的分割點(diǎn),訓(xùn)練誤差沒(méi)有pre-sorted算法低。在樹(shù)的切分策略方面,XGBoost采用的是Level-wise葉子生長(zhǎng)策略,如圖3-4所示;LightGBM采用的是帶深度限制的Left-wise葉子生長(zhǎng)策略,如圖3-5所示。Level-wise中的樹(shù)是一層一層進(jìn)行生長(zhǎng)的,同一層的所有節(jié)點(diǎn)都進(jìn)行分裂,最后剪枝。由于有些葉子節(jié)點(diǎn)的信息增益并不大,攜帶的信息量較少,沒(méi)必要進(jìn)行分裂,而Level-wise不加區(qū)分的對(duì)每一層節(jié)點(diǎn)進(jìn)行分裂,會(huì)加大計(jì)算量。而LightGBM使用的是帶有深度限制的Left-wise葉子生長(zhǎng)策略,每一層只對(duì)增益最大的節(jié)點(diǎn)進(jìn)行分裂。Left-wise葉子生長(zhǎng)策略的缺點(diǎn)是當(dāng)數(shù)據(jù)量較少時(shí),會(huì)長(zhǎng)出比較深的樹(shù),產(chǎn)生過(guò)擬合,降低模型的泛化性和精度。圖3-4Level-wise葉子生長(zhǎng)策略圖3-5Left-wise葉子生長(zhǎng)策略
【參考文獻(xiàn)】:
期刊論文
[1]不平衡數(shù)據(jù)的下采樣方法研究[J]. 周建偉. 計(jì)算機(jī)與數(shù)字工程. 2019(09)
[2]基于Xgboost和LightGBM算法預(yù)測(cè)住房月租金的應(yīng)用分析[J]. 謝勇,項(xiàng)薇,季孟忠,彭俊,黃益槐. 計(jì)算機(jī)應(yīng)用與軟件. 2019(09)
[3]基于LightGBM的銀行信用卡違約研究[J]. 張國(guó)慶,昌寧. 科技資訊. 2019(12)
[4]不平衡數(shù)據(jù)分類(lèi)方法綜述[J]. 李艷霞,柴毅,胡友強(qiáng),尹宏鵬. 控制與決策. 2019(04)
[5]基于數(shù)據(jù)挖掘的銀行電話營(yíng)銷(xiāo)預(yù)測(cè)研究[J]. 宣子岳. 現(xiàn)代商業(yè). 2018(24)
[6]不平衡數(shù)據(jù)分類(lèi)問(wèn)題解決辦法[J]. 季晨雨. 電子技術(shù)與軟件工程. 2018(15)
[7]面向不平衡數(shù)據(jù)集的一種精化Borderline-SMOTE方法[J]. 楊毅,盧誠(chéng)波,徐根海. 復(fù)旦學(xué)報(bào)(自然科學(xué)版). 2017(05)
[8]“互聯(lián)網(wǎng)+”時(shí)代商業(yè)銀行電話營(yíng)銷(xiāo)轉(zhuǎn)型與發(fā)展[J]. 中國(guó)信用卡. 2015(11)
[9]試論大數(shù)據(jù)時(shí)代企業(yè)的營(yíng)銷(xiāo)模式[J]. 張潔梅,李麗珂. 黨政干部學(xué)刊. 2014(12)
[10]我國(guó)電話營(yíng)銷(xiāo)的發(fā)展[J]. 張冠瓊. 商業(yè)文化(上半月). 2012(02)
碩士論文
[1]Stacking集成模型在銀行電話營(yíng)銷(xiāo)中的應(yīng)用[D]. 王艷雯.蘭州大學(xué) 2019
[2]銀行電話營(yíng)銷(xiāo)成功之路的分析與預(yù)測(cè)[D]. 高麗.華中師范大學(xué) 2017
[3]決策樹(shù)算法在銀行電話營(yíng)銷(xiāo)中的應(yīng)用[D]. 李明月.華中科技大學(xué) 2016
[4]Z銀行信用卡客戶的電話營(yíng)銷(xiāo)策略研究[D]. 姚穎.大連理工大學(xué) 2013
本文編號(hào):3130052
本文鏈接:http://sikaile.net/guanlilunwen/bankxd/3130052.html
最近更新
教材專著