聚類分析在 H 銀行客戶分類中的應(yīng)用
第一章 緒論
1.1 研究背景和選題意義
隨著網(wǎng)絡(luò)技術(shù)和數(shù)據(jù)庫(kù)技術(shù)的成熟,銀行所提供的網(wǎng)上銀行服務(wù)也越來(lái)越多元化,除了能在線購(gòu)買(mǎi)銀行產(chǎn)品外,還能使用網(wǎng)上銀行所提供的轉(zhuǎn)賬服務(wù)。這種商業(yè)模式在逐步向電子化轉(zhuǎn)變的同時(shí),也為客戶帶來(lái)了更加方便的交易模式和更多的選擇,除此之外,同時(shí)可以讓銀行真正了解到客戶的服務(wù)需要與投資的行為特征,提供了強(qiáng)有力的支持。而數(shù)據(jù)挖掘技術(shù),則是銀行在電子商務(wù)領(lǐng)域中必不可少的重要工具,它能夠?yàn)殂y行營(yíng)運(yùn)者做出適當(dāng)?shù)臓I(yíng)銷(xiāo)策略,創(chuàng)造更多銀行利潤(rùn)提供數(shù)據(jù)支持和指導(dǎo)方向,是銀行電子商務(wù)中尤為重要的、不可或缺的應(yīng)用技術(shù)。除此之外,由于數(shù)據(jù)庫(kù)和網(wǎng)絡(luò)技術(shù)的飛速發(fā)展,銀行收集了大量而且不同類型的數(shù)據(jù),這些數(shù)據(jù)包括有客戶的基本信息、交易紀(jì)錄、以及產(chǎn)品的基本信息等等數(shù)據(jù)。為了能夠給銀行帶來(lái)更多的利潤(rùn),銀行必須要將這些收集到的數(shù)據(jù),轉(zhuǎn)化成為對(duì)銀行經(jīng)營(yíng)生產(chǎn)有幫助的信息,于是在這樣的一個(gè)轉(zhuǎn)化過(guò)程中,數(shù)據(jù)挖掘的概念油然而生。數(shù)據(jù)挖掘技術(shù)經(jīng)過(guò)了多年的發(fā)展及演變,其技術(shù)不斷在豐富,數(shù)據(jù)挖掘技術(shù)包括了聚類分析法、關(guān)聯(lián)規(guī)則、決策樹(shù)和神經(jīng)網(wǎng)絡(luò)等技術(shù),而這些技術(shù)現(xiàn)在已經(jīng)應(yīng)用在不同的科學(xué)領(lǐng)域中,還獲得了不錯(cuò)的效果。時(shí)至今日,數(shù)據(jù)挖掘的各種技術(shù)與方法都已經(jīng)應(yīng)用在銀行中去,為銀行制定營(yíng)銷(xiāo)策略提供了指導(dǎo),使得銀行不再盲目投放營(yíng)銷(xiāo)資源,給銀行的經(jīng)營(yíng)帶來(lái)了良好的效果。
由于信息管理技術(shù)和網(wǎng)絡(luò)技術(shù)這些科學(xué)技術(shù)的高速發(fā)展,電子商務(wù)在這些技術(shù)的刺激下也蓬勃的發(fā)展起來(lái)且呈現(xiàn)百花齊放的局面。銀行除了面對(duì)同行的競(jìng)爭(zhēng)外,還要面對(duì)一些新興的電子商務(wù)平臺(tái)所帶來(lái)的沖擊,例如支付寶、財(cái)付通等第三方支付平臺(tái)。銀行同行之間,以及和電子商務(wù)平臺(tái)之間的競(jìng)爭(zhēng)變得越來(lái)越激烈。在以前商業(yè)模式下多數(shù)銀行都是通過(guò)發(fā)行不同的產(chǎn)品,通過(guò)這樣的方式來(lái)吸收客戶提高客數(shù)量,以此達(dá)到提高經(jīng)濟(jì)效益的目的。然而,銀行提供的金融產(chǎn)品最大的特點(diǎn)就是同質(zhì)性,不同的銀行之間的金融產(chǎn)品沒(méi)有太大差別。但是不同的客戶他們的需求都是具有異質(zhì)性的,銀行要想留住客戶就只能夠改變現(xiàn)有的經(jīng)營(yíng)理念。
本文以 H 銀行網(wǎng)上轉(zhuǎn)賬系統(tǒng)的客戶分類項(xiàng)目為具體案例,針對(duì)該項(xiàng)目的特定需求,利用數(shù)據(jù)挖掘技術(shù)中的聚類分析法,設(shè)定相關(guān)變量,運(yùn)用 SPSS 軟件進(jìn)行檢驗(yàn)分析。將付費(fèi)客戶按指定變量進(jìn)行分類,并鎖定分類后的部分特征明顯的客戶群體,制定有針對(duì)性的營(yíng)銷(xiāo)方案,促進(jìn)付費(fèi)客戶的增長(zhǎng)。
......................
1.2 國(guó)內(nèi)外研究現(xiàn)狀
知識(shí)發(fā)現(xiàn) (Knowledge discovery in Database, KDD)與數(shù)據(jù)挖掘(Data Mining, DM)是數(shù)據(jù)庫(kù)領(lǐng)域中重要的課題之一。知識(shí)發(fā)現(xiàn) KDD,這個(gè)詞是一九八九年八月,一個(gè)在美國(guó)召開(kāi)的學(xué)術(shù)會(huì)議上所產(chǎn)生的。另外,數(shù)據(jù)挖掘技術(shù)在一九九五年召開(kāi)的學(xué)術(shù)會(huì)議上,被正式劃分成在科研領(lǐng)域的知識(shí)發(fā)現(xiàn)以及在工程領(lǐng)域的數(shù)據(jù)挖掘。而在此后數(shù)據(jù)挖掘技術(shù)不斷發(fā)展,針對(duì)它的研究也獲得了有效的成績(jī),F(xiàn)在,主要從三個(gè)方面去對(duì)知識(shí)發(fā)現(xiàn)進(jìn)行研究與探索,它們其中包括原理、技術(shù)與應(yīng)用。多種理論與方法的合理整合是大多數(shù)研究者采用的有效技術(shù)。
隨著時(shí)代的發(fā)展,數(shù)據(jù)挖掘在電子商務(wù)各個(gè)領(lǐng)域上的使用情況日益普及。例如在金融行業(yè)或零售行業(yè)中,它能廣泛應(yīng)用在客戶細(xì)分、客戶開(kāi)拓、客戶挽留、差別化服務(wù)和資源投放等等方面。辟如零售業(yè)的應(yīng)用領(lǐng)域,亞馬遜就是其中數(shù)據(jù)挖掘的應(yīng)用平臺(tái)。由于在日常的零售業(yè)務(wù)中,它能夠獲得大量的零售數(shù)據(jù),而這些數(shù)據(jù)都是能夠反映客戶的購(gòu)買(mǎi)特征和購(gòu)買(mǎi)需要,而通過(guò)利用數(shù)據(jù)挖掘去分析這一類的數(shù)據(jù),便能夠準(zhǔn)確地找出那些有價(jià)值的客戶并且能夠了解他們的購(gòu)買(mǎi)模式,從而判斷出客戶的購(gòu)買(mǎi)趨勢(shì),制定有針對(duì)性的營(yíng)銷(xiāo)策略。
而在銀行方面,則主要側(cè)重于客戶關(guān)系模式的應(yīng)用,許多知名軟件提供商都有自己銀行業(yè)數(shù)據(jù)挖掘解決方案,如:SYSBASE、ORACLE、IBM SPSS等。通過(guò)軟件商提供的數(shù)據(jù)挖掘解決方案,銀行可以把客戶進(jìn)行分類,實(shí)行差別化服務(wù)。這些都是對(duì)于數(shù)據(jù)挖掘應(yīng)用的體現(xiàn)。
就目前國(guó)內(nèi)的情況來(lái)看,雖然大部分企業(yè)都開(kāi)始認(rèn)識(shí)到要利用數(shù)據(jù)挖掘去指導(dǎo)企業(yè)營(yíng)銷(xiāo)方向,但由于我們的數(shù)據(jù)挖掘技術(shù)發(fā)展比國(guó)外要慢,而且沒(méi)有國(guó)外的成熟,加上很多企業(yè)系統(tǒng)建立已久,都不是面向數(shù)據(jù)挖掘的,它跟真正的數(shù)據(jù)挖掘應(yīng)用還存在一大段的距離。在這樣的情況下,企業(yè)要想真正的利用數(shù)據(jù)挖掘技術(shù)為其帶來(lái)好處,則必須要建立集中式數(shù)據(jù)存儲(chǔ)的數(shù)據(jù)倉(cāng)庫(kù),才能夠充分享受數(shù)據(jù)挖掘所帶來(lái)的效果。
....................
第二章 聚類分析法的應(yīng)用研究
2.1 數(shù)據(jù)挖掘方法的研究與分析
2.1.1 聚類分析同類方法的比較與分析
聚類是把大量的數(shù)據(jù)樣本按照指定的參數(shù)變量進(jìn)行劃分并把數(shù)據(jù)樣本中類似的數(shù)據(jù)歸為一類,而不同類別之前的數(shù)據(jù)樣本是不類似的。數(shù)據(jù)樣本之間是否相似是按照選定的數(shù)據(jù)指標(biāo)參數(shù)來(lái)衡量,而數(shù)據(jù)樣本間的相似度我們可以用距離來(lái)表示。聚類的過(guò)程其實(shí)可以簡(jiǎn)單理解為逐步合并類的過(guò)程,首先每一個(gè)數(shù)據(jù)樣本都?xì)w為一類,然后將相似度最高也就是距離最短的數(shù)據(jù)樣本合并成一類,,然后再與其它類進(jìn)行合并。如此反復(fù),則每一次合并,其類別的個(gè)數(shù)都會(huì)減少一個(gè),直到所有樣本數(shù)據(jù)都合并成為一個(gè)類,不過(guò)如果只合并為一類就會(huì)使聚類失去了意義,所以當(dāng)所有數(shù)據(jù)樣本聚類到某一水平的時(shí)候,便可以停止繼續(xù)合并。而這個(gè)時(shí)候得到的類別就是聚類分析的結(jié)果。
當(dāng)聚類分析具體應(yīng)用到客戶分類中的時(shí)候,我們可以將不同的賬戶日均余額、轉(zhuǎn)帳總金額、客戶年齡等的指標(biāo)加以表現(xiàn)。那么用數(shù)學(xué)符號(hào)就可以將客戶分類表示如下:
.........................
2.2 聚類分析技術(shù)的應(yīng)用研究
2.2.1 聚類分析的典型應(yīng)用場(chǎng)景
對(duì)于銀行的營(yíng)運(yùn)團(tuán)隊(duì)來(lái)說(shuō)聚類分析的典型應(yīng)用場(chǎng)景是十分的廣泛,他們幾乎每次的營(yíng)銷(xiāo)活動(dòng)也需要使用到。例如,把銀行客戶按照指定的維度僻如有客戶的利潤(rùn)貢獻(xiàn)、客戶賬戶的日均余額、客戶類型以及客戶的年齡等去進(jìn)行聚類細(xì)分,從而把客戶細(xì)分成不同的群體。假如將客戶分成兩上個(gè)群體,其中一個(gè)群體占總數(shù)的 70%,年齡在 27 歲左右,他們對(duì)銀行的貢獻(xiàn)不大,但是他們卻經(jīng)常購(gòu)買(mǎi)和使用銀行服務(wù);另一個(gè)群體只占總數(shù)的 30%,這個(gè)群體的年齡大概在 45 歲左右,他們使用銀行服務(wù)不多但是貢獻(xiàn)卻是最大。對(duì)于這兩類的客戶群體,他們都是銀行的目標(biāo)群體,但銀行在制定營(yíng)銷(xiāo)策略時(shí)就應(yīng)該有不同。對(duì)于第一個(gè)群體來(lái)說(shuō),雖然他們貢獻(xiàn)不大,但從他們購(gòu)買(mǎi)銀行產(chǎn)品和使用銀行服務(wù)的頻率來(lái)看,這類群體表現(xiàn)出極其忠誠(chéng),而忠誠(chéng)的客戶對(duì)于銀行來(lái)說(shuō)是非常寶貴的財(cái)產(chǎn)。所以,對(duì)于這個(gè)群體銀行應(yīng)該是要密切關(guān)注,防止客戶流失,并進(jìn)一步分析這個(gè)群體的其它特征,逐步把他們向高價(jià)值客戶轉(zhuǎn)變。而另一個(gè)群體雖然貢獻(xiàn)比較大,但由于他們使用銀行的產(chǎn)品和服務(wù)頻率較低,表現(xiàn)出其忠誠(chéng)度不高,所以對(duì)于這個(gè)群體營(yíng)運(yùn)的重點(diǎn)是積極地向他們介紹合適的銀行產(chǎn)品與服務(wù),以此來(lái)提升他們對(duì)銀行的忠誠(chéng)度。由于這類群體的年齡在 45 歲左右,因此運(yùn)營(yíng)團(tuán)隊(duì)也會(huì)根據(jù)這一特點(diǎn)去設(shè)計(jì)和制定相應(yīng)的營(yíng)銷(xiāo)策略。
從上面的一個(gè)普通案例可以看出,聚類分析其實(shí)就是按照一定的指標(biāo)來(lái)將目標(biāo)的群體進(jìn)行不同類別的劃分,而這種類別劃分往往就是銀行精細(xì)化營(yíng)運(yùn),差別化服務(wù)的重要手段。因?yàn)橹挥型ㄟ^(guò)分類分析,才能找出不同群體間的差別與其各自的特征,才能為營(yíng)銷(xiāo)策略提供指導(dǎo)方向。
除了上述的應(yīng)用場(chǎng)景外,聚類分析在數(shù)據(jù)化運(yùn)營(yíng)的實(shí)踐中還有以下比較常見(jiàn)的業(yè)務(wù)應(yīng)用場(chǎng)景:
目標(biāo)客戶的群體分類:根據(jù)業(yè)務(wù)發(fā)展需要篩選出合適的指標(biāo)變量來(lái)對(duì)客戶群體實(shí)行聚類分析,把那些具有明顯特征的目標(biāo)客戶群體挑選出來(lái),然后針對(duì)這些目標(biāo)戶群體制定不同營(yíng)銷(xiāo)策略與方針,實(shí)現(xiàn)差別化、個(gè)性化服務(wù),提升銀行的營(yíng)運(yùn)效果。
不同產(chǎn)品的價(jià)值組合:銀行除了能夠?qū)蛻暨M(jìn)行聚類之外,還可以對(duì)其自身設(shè)計(jì)的產(chǎn)品進(jìn)行聚類分析。通過(guò)把不同的產(chǎn)品按照特定的指標(biāo)變量進(jìn)行聚類,將看似沒(méi)有關(guān)聯(lián)的產(chǎn)品組合起來(lái),實(shí)現(xiàn)交叉銷(xiāo)售。
發(fā)現(xiàn)孤立點(diǎn)和異常值:在聚類的過(guò)程中,有時(shí)候會(huì)發(fā)現(xiàn)有些數(shù)據(jù)樣本的行為特征和整體數(shù)據(jù)樣本的行為特征極不相似。通常我們會(huì)把這種數(shù)據(jù)樣本剔除掉,但其實(shí)這樣的數(shù)據(jù)樣本價(jià)值也非常重要。它可以發(fā)現(xiàn)在日常業(yè)務(wù)中一些特殊的,為銀行的風(fēng)險(xiǎn)管理帶來(lái)參考意義。
.....................
第三章 H 銀行客戶分類現(xiàn)狀及解決方案 ............. 14
3.1 H 銀行客戶分類項(xiàng)目背景 ....................... 14
3.2 H 銀行客戶分類項(xiàng)目需求分析 ........................ 14
第四章 聚類分析在客戶分類中的應(yīng)用 ............... 21
4.1 聚類分析指標(biāo)體系的建立 .................. 21
4.1.1 銀行客戶分類聚類分析指標(biāo)系統(tǒng) .................... 21
4.1.2 H 銀行客戶分類指標(biāo)建立 .................. 22
第四章 聚類分析在客戶分類中的應(yīng)用
4.1 聚類分析指標(biāo)體系的建立
4.1.1 銀行客戶分類聚類分析指標(biāo)系統(tǒng)
利用聚類分析,首先要對(duì)研究的對(duì)象進(jìn)行分類,然后再量化分析與研究,所以要先建立相應(yīng)的評(píng)價(jià)指標(biāo)。至于怎么去選取有效的信息去建立指標(biāo)體系,必須要根據(jù)業(yè)務(wù)邏輯推測(cè)和業(yè)務(wù)經(jīng)驗(yàn)判斷,決不能隨便去選擇變量指標(biāo),否則會(huì)嚴(yán)重?fù)p害聚類的效果,使得聚類失去意義。對(duì)于銀行客戶的分類,影響的因素有很多,例如客戶的存款、理財(cái)總值、負(fù)債、甚至客戶的性別、年齡等,都能夠影響分類的結(jié)果。如下圖 4-1 所示,該圖概括了比較銀行行業(yè)里比較常用的客戶分類指標(biāo)變量。
......................
結(jié)論與啟示
聚類分析是數(shù)據(jù)挖掘領(lǐng)域中一項(xiàng)重要的研究課題,它能作為單獨(dú)的工具以發(fā)現(xiàn)數(shù)據(jù)源數(shù)據(jù)的分布信息,是對(duì)客戶分類的一種有效手段。本文正是通過(guò)對(duì)聚類算法的分析研究,將其應(yīng)用于 H 銀行客戶分類項(xiàng)目中,為銀行篩選出有價(jià)值的客戶群體,并將分類結(jié)果應(yīng)用于市場(chǎng)營(yíng)銷(xiāo)中,為企業(yè)制定營(yíng)銷(xiāo)計(jì)劃、實(shí)現(xiàn)數(shù)據(jù)化運(yùn)營(yíng)提供了非常有價(jià)值的實(shí)踐。
1. 本文的主要工作:
1) 研究了聚類分析算法的概念,對(duì)聚類分析算法進(jìn)行了深入研究,對(duì)聚類分析算法的應(yīng)用進(jìn)行了研究。
2) 系統(tǒng)介紹了聚類分析中常用的聚類算法,分析了各自的優(yōu)缺點(diǎn)以及適用條件,為人們快速準(zhǔn)確地找到適合特定領(lǐng)域的聚類算法提供了參考。
3) 重點(diǎn)研究聚類分析法中的系統(tǒng)聚類算法,并把該算法應(yīng)用于 H 銀行客戶分類項(xiàng)目中。本文用于聚類的數(shù)據(jù)是銀行客戶數(shù)據(jù),著重討論了如何建立數(shù)據(jù)市集、對(duì)數(shù)據(jù)進(jìn)行預(yù)處理、異常數(shù)據(jù)的處理和分類指標(biāo)體系的建立。并對(duì)客戶分類的全過(guò)程進(jìn)行了詳細(xì)的論述。
4) 分析論證聚類的結(jié)果,并對(duì)聚類算法篩選出的有價(jià)值客戶群體進(jìn)行定向推廣。分析實(shí)行定向推廣后的付費(fèi)客戶增長(zhǎng)率,驗(yàn)證聚類算法在市場(chǎng)營(yíng)銷(xiāo)中的適用性。
2. 今后的研究計(jì)劃:
1) 現(xiàn)有的聚類算法在研究還需要繼續(xù)深入。在數(shù)據(jù)挖掘的理論和實(shí)踐中,人們已經(jīng)提出許多聚類算法,但每一種的算法都有某種優(yōu)點(diǎn)但同時(shí)也存在著某些不足,可能適于用處理某類問(wèn)題卻無(wú)法處理另一類情況,沒(méi)有一種聚類算法可以適用于全部情況。
2) 就聚類分析的對(duì)象而言,本文僅針對(duì)網(wǎng)上轉(zhuǎn)賬系統(tǒng)中的客戶進(jìn)行分類,聚類指標(biāo)變量選取有一定的局限性,在今后在研究中,應(yīng)考慮客戶在銀行中的其它屬性,使聚類的指標(biāo)變量更全面,聚類結(jié)果更加真實(shí)有效。
3) 本文應(yīng)用的聚類算法只實(shí)現(xiàn)了二維空間上的聚類,通過(guò)參考相關(guān)資料和前人經(jīng)驗(yàn),聚類還能實(shí)現(xiàn)高維空間聚類,如何利用這種高維聚類算法,也是今后的主要任務(wù)之一。
參考文獻(xiàn)(略)
本文編號(hào):75992
本文鏈接:http://sikaile.net/wenshubaike/lwfw/75992.html