多目標(biāo)進(jìn)化聚類(lèi)算法及其在信用風(fēng)險(xiǎn)管理的應(yīng)用
發(fā)布時(shí)間:2021-10-21 00:28
中國(guó)金融行業(yè)的飛速發(fā)展和金融數(shù)據(jù)的爆炸式增長(zhǎng)衍生出了對(duì)金融領(lǐng)域數(shù)據(jù)挖掘技術(shù)的探索需求。尤其在信用風(fēng)險(xiǎn)管理領(lǐng)域,傳統(tǒng)的專(zhuān)家系統(tǒng)方法具有較高的主觀性,一般性的判別方法難以應(yīng)對(duì)日益復(fù)雜的高維數(shù)據(jù),而各類(lèi)數(shù)據(jù)挖掘技術(shù)展現(xiàn)出了客觀性和準(zhǔn)確性的優(yōu)勢(shì)。聚類(lèi)分析是一種重要的無(wú)監(jiān)督式數(shù)據(jù)挖掘技術(shù),能夠在沒(méi)有訓(xùn)練樣本的情況下,通過(guò)數(shù)據(jù)內(nèi)部的聯(lián)系識(shí)別橫截面維度和時(shí)間維度上各類(lèi)樣本的特征,對(duì)信用風(fēng)險(xiǎn)評(píng)價(jià)問(wèn)題和信用風(fēng)險(xiǎn)聯(lián)動(dòng)性分析問(wèn)題具有較強(qiáng)的適用性。然而現(xiàn)有聚類(lèi)算法在處理高維信用風(fēng)險(xiǎn)數(shù)據(jù)時(shí)存在聚類(lèi)目標(biāo)函數(shù)單一、算法魯棒性較差、易陷入局部最優(yōu)等不足。針對(duì)這些問(wèn)題,提出了一種面向信用風(fēng)險(xiǎn)高維數(shù)據(jù)的聚類(lèi)算法,并將其應(yīng)用于截面數(shù)據(jù)和時(shí)間序列數(shù)據(jù)兩種數(shù)據(jù)類(lèi)型的信用風(fēng)險(xiǎn)管理問(wèn)題的研究中。具體進(jìn)行了如下工作:提出基于參考向量的多目標(biāo)進(jìn)化聚類(lèi)算法(Reference Vector-based MultiObjective Clustering,RVMOC)。借鑒子空間聚類(lèi)思想,建立針對(duì)信用風(fēng)險(xiǎn)高維數(shù)據(jù)聚類(lèi)的多目標(biāo)優(yōu)化問(wèn)題,并采用進(jìn)化算法求解。在算法中設(shè)計(jì)了基于參考向量的局部搜索方法以提高算法準(zhǔn)確性,提出了基于集成聚類(lèi)的最終解選...
【文章來(lái)源】:北京工業(yè)大學(xué)北京市 211工程院校
【文章頁(yè)數(shù)】:96 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
RI指標(biāo)下基于集成聚類(lèi)的最終解選擇方法效果測(cè)試Fig.3-6Effectivenessoftheknee-pruningfuzzyensembleunderRImetric
0 0.2 0.4 0.6 0.8 10 0.05 0.1 0.15 0.2圖 3-7 NMI 指標(biāo)下基于集成聚類(lèi)的最終解選擇方法效果測(cè)試Fig. 3-7 Effectiveness of the knee-pruning fuzzy ensemble under NMI metric從圖 3-6 和圖 3-7 可以看出,本文提出的最終解選擇方法在各個(gè)數(shù)據(jù)集上均最優(yōu)。對(duì)比方法中,膝蓋方法在大多數(shù)數(shù)據(jù)上能夠取得僅次于本文提出的基成聚類(lèi)的最終解選擇方法的結(jié)果,但結(jié)果中往往會(huì)得到較高的標(biāo)準(zhǔn)差,這是最后一代的帕累托解集中,可能存在不止一個(gè)膝蓋區(qū)域,好的聚類(lèi)結(jié)果不一是存在于某一個(gè)膝蓋區(qū)域中;普通集成聚類(lèi)方法在獲得高魯棒性的解方面具勢(shì),但其結(jié)果的準(zhǔn)確性往往偏低,這是由于該方法綜合了最后一代所有的解息得到了最終的結(jié)果,這種方法趨于獲得穩(wěn)定的解,但最后一代解集中既包秀的解,也可能包含較差的解,使得集成后的解的表現(xiàn)一般;最小d1方法在據(jù)集上表現(xiàn)較為平均,該方法的思路是找到距離理想點(diǎn)(即原點(diǎn))最近的解最終解,但是在聚類(lèi)算法中,這樣的解并不一定能夠代表各目標(biāo)函數(shù)的最佳。本文提出的基于集成聚類(lèi)的最終解選擇方法首先利用膝蓋方法對(duì)最后一代進(jìn)行精煉,保留各膝蓋區(qū)域的優(yōu)秀解,篩除了較差解。并且,為保證算法的
0 0.2 0.4 0.6 0.8 10 0.05 0.1 0.15 0.2圖 3-7 NMI 指標(biāo)下基于集成聚類(lèi)的最終解選擇方法效果測(cè)試Fig. 3-7 Effectiveness of the knee-pruning fuzzy ensemble under NMI metric從圖 3-6 和圖 3-7 可以看出,本文提出的最終解選擇方法在各個(gè)數(shù)據(jù)集上均最優(yōu)。對(duì)比方法中,膝蓋方法在大多數(shù)數(shù)據(jù)上能夠取得僅次于本文提出的基成聚類(lèi)的最終解選擇方法的結(jié)果,但結(jié)果中往往會(huì)得到較高的標(biāo)準(zhǔn)差,這是最后一代的帕累托解集中,可能存在不止一個(gè)膝蓋區(qū)域,好的聚類(lèi)結(jié)果不一是存在于某一個(gè)膝蓋區(qū)域中;普通集成聚類(lèi)方法在獲得高魯棒性的解方面具勢(shì),但其結(jié)果的準(zhǔn)確性往往偏低,這是由于該方法綜合了最后一代所有的解息得到了最終的結(jié)果,這種方法趨于獲得穩(wěn)定的解,但最后一代解集中既包秀的解,也可能包含較差的解,使得集成后的解的表現(xiàn)一般;最小d1方法在據(jù)集上表現(xiàn)較為平均,該方法的思路是找到距離理想點(diǎn)(即原點(diǎn))最近的解最終解,但是在聚類(lèi)算法中,這樣的解并不一定能夠代表各目標(biāo)函數(shù)的最佳。本文提出的基于集成聚類(lèi)的最終解選擇方法首先利用膝蓋方法對(duì)最后一代進(jìn)行精煉,保留各膝蓋區(qū)域的優(yōu)秀解,篩除了較差解。并且,為保證算法的
本文編號(hào):3447887
【文章來(lái)源】:北京工業(yè)大學(xué)北京市 211工程院校
【文章頁(yè)數(shù)】:96 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
RI指標(biāo)下基于集成聚類(lèi)的最終解選擇方法效果測(cè)試Fig.3-6Effectivenessoftheknee-pruningfuzzyensembleunderRImetric
0 0.2 0.4 0.6 0.8 10 0.05 0.1 0.15 0.2圖 3-7 NMI 指標(biāo)下基于集成聚類(lèi)的最終解選擇方法效果測(cè)試Fig. 3-7 Effectiveness of the knee-pruning fuzzy ensemble under NMI metric從圖 3-6 和圖 3-7 可以看出,本文提出的最終解選擇方法在各個(gè)數(shù)據(jù)集上均最優(yōu)。對(duì)比方法中,膝蓋方法在大多數(shù)數(shù)據(jù)上能夠取得僅次于本文提出的基成聚類(lèi)的最終解選擇方法的結(jié)果,但結(jié)果中往往會(huì)得到較高的標(biāo)準(zhǔn)差,這是最后一代的帕累托解集中,可能存在不止一個(gè)膝蓋區(qū)域,好的聚類(lèi)結(jié)果不一是存在于某一個(gè)膝蓋區(qū)域中;普通集成聚類(lèi)方法在獲得高魯棒性的解方面具勢(shì),但其結(jié)果的準(zhǔn)確性往往偏低,這是由于該方法綜合了最后一代所有的解息得到了最終的結(jié)果,這種方法趨于獲得穩(wěn)定的解,但最后一代解集中既包秀的解,也可能包含較差的解,使得集成后的解的表現(xiàn)一般;最小d1方法在據(jù)集上表現(xiàn)較為平均,該方法的思路是找到距離理想點(diǎn)(即原點(diǎn))最近的解最終解,但是在聚類(lèi)算法中,這樣的解并不一定能夠代表各目標(biāo)函數(shù)的最佳。本文提出的基于集成聚類(lèi)的最終解選擇方法首先利用膝蓋方法對(duì)最后一代進(jìn)行精煉,保留各膝蓋區(qū)域的優(yōu)秀解,篩除了較差解。并且,為保證算法的
0 0.2 0.4 0.6 0.8 10 0.05 0.1 0.15 0.2圖 3-7 NMI 指標(biāo)下基于集成聚類(lèi)的最終解選擇方法效果測(cè)試Fig. 3-7 Effectiveness of the knee-pruning fuzzy ensemble under NMI metric從圖 3-6 和圖 3-7 可以看出,本文提出的最終解選擇方法在各個(gè)數(shù)據(jù)集上均最優(yōu)。對(duì)比方法中,膝蓋方法在大多數(shù)數(shù)據(jù)上能夠取得僅次于本文提出的基成聚類(lèi)的最終解選擇方法的結(jié)果,但結(jié)果中往往會(huì)得到較高的標(biāo)準(zhǔn)差,這是最后一代的帕累托解集中,可能存在不止一個(gè)膝蓋區(qū)域,好的聚類(lèi)結(jié)果不一是存在于某一個(gè)膝蓋區(qū)域中;普通集成聚類(lèi)方法在獲得高魯棒性的解方面具勢(shì),但其結(jié)果的準(zhǔn)確性往往偏低,這是由于該方法綜合了最后一代所有的解息得到了最終的結(jié)果,這種方法趨于獲得穩(wěn)定的解,但最后一代解集中既包秀的解,也可能包含較差的解,使得集成后的解的表現(xiàn)一般;最小d1方法在據(jù)集上表現(xiàn)較為平均,該方法的思路是找到距離理想點(diǎn)(即原點(diǎn))最近的解最終解,但是在聚類(lèi)算法中,這樣的解并不一定能夠代表各目標(biāo)函數(shù)的最佳。本文提出的基于集成聚類(lèi)的最終解選擇方法首先利用膝蓋方法對(duì)最后一代進(jìn)行精煉,保留各膝蓋區(qū)域的優(yōu)秀解,篩除了較差解。并且,為保證算法的
本文編號(hào):3447887
本文鏈接:http://sikaile.net/guanlilunwen/fengxianguanli/3447887.html
最近更新
教材專(zhuān)著