基于客戶交易數(shù)據(jù)的購(gòu)買樹譜聚類算法研究
發(fā)布時(shí)間:2021-05-21 09:06
大數(shù)據(jù)時(shí)代網(wǎng)絡(luò)的高速發(fā)展使市場(chǎng)經(jīng)濟(jì)呈現(xiàn)白熾化的競(jìng)爭(zhēng)狀態(tài),新一代的消費(fèi)者對(duì)服務(wù)的要求也更細(xì)致,如何制定高效的營(yíng)銷策略成為各個(gè)公司需要思考的問(wèn)題。雖然今天有很多方法可用于客戶細(xì)分,但其中大多數(shù)強(qiáng)調(diào)數(shù)值計(jì)算而不是商業(yè)目標(biāo)?蛻艚灰讛(shù)據(jù)是零售公司的銷售數(shù)據(jù),累積成客戶日常購(gòu)物交易的大數(shù)據(jù)。為了使這些客戶歷史數(shù)據(jù)產(chǎn)生營(yíng)銷價(jià)值,使用聚類的方式對(duì)其進(jìn)行處理?蛻艚灰讛(shù)據(jù)是零售公司記錄客戶購(gòu)買數(shù)據(jù)的集合。早期的統(tǒng)計(jì)學(xué)變量收集便捷易于使用,所以成為最初的研究方式。隨著客戶購(gòu)買交易數(shù)據(jù)的迅速增加,新的研究轉(zhuǎn)向使用特定的產(chǎn)品變量,如購(gòu)買的商品。盡管已經(jīng)有一些數(shù)據(jù)聚類的方法,但這些方法耗時(shí)并且無(wú)法處理大量的事務(wù)記錄。大多數(shù)工作采用層次聚類算法,不能擴(kuò)展到大規(guī)模交易數(shù)據(jù)。PurTreeClust聚類算法使用購(gòu)買樹結(jié)構(gòu)對(duì)客戶交易大數(shù)據(jù)進(jìn)行聚類,但是還存在以下兩個(gè)問(wèn)題,首先在購(gòu)買樹距離上調(diào)整層次權(quán)重是困難的,其次沒有對(duì)聚類性能進(jìn)行優(yōu)化。本文提出兩個(gè)新方法解決PurTreeClust存在的問(wèn)題:第一,本文針對(duì)難以調(diào)整購(gòu)買樹層次權(quán)重的問(wèn)題,提出一種局部的購(gòu)買樹譜聚類方法Local PurTree Spectral Cl...
【文章來(lái)源】:深圳大學(xué)廣東省
【文章頁(yè)數(shù)】:60 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 研究背景和意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.3 本文的主要研究?jī)?nèi)容
1.4 本文的組織結(jié)構(gòu)
第2章 基于傳統(tǒng)的購(gòu)買樹譜聚類算法理論
2.1 商品樹和購(gòu)買樹概念
2.2 購(gòu)買樹距離(PurTreemetricdistance)
2.3 購(gòu)買樹的索引結(jié)構(gòu)CoverTree的概念
2.4 傳統(tǒng)的PurTreeClust算法
2.5 本章小結(jié)
第3章 局部購(gòu)買樹的譜聚類方法(LPS)
3.1 LPS目標(biāo)函數(shù)
3.2 LPS優(yōu)化算法
3.2.1 參數(shù)F的優(yōu)化
3.2.2 參數(shù)P的優(yōu)化
3.2.3 參數(shù)w的優(yōu)化
3.2.4 計(jì)算λ的缺省值
3.2.5 計(jì)算η的缺省值
3.2.6 LPS優(yōu)化算法偽代碼
3.3 實(shí)驗(yàn)結(jié)果與分析
3.3.1 基準(zhǔn)數(shù)據(jù)集和評(píng)估方法
3.3.2 LPS參數(shù)敏感性研究和權(quán)重分析
3.3.3 LPS對(duì)比實(shí)驗(yàn)結(jié)果
3.4 本章小結(jié)
第4章 雙層子空間譜聚類方法(TSW)
4.1 TSW目標(biāo)函數(shù)
4.2 TWS優(yōu)化算法
4.2.1 固定P,a和w更新F
4.2.2 固定F,a和w更新P
4.2.3 固定P,F和w更新a
4.2.4 固定P,F和a更新w
4.2.5 計(jì)算λ的缺省值
4.2.6 TSW優(yōu)化算法偽代碼
4.3 實(shí)驗(yàn)結(jié)果與分析
4.3.1 基準(zhǔn)數(shù)據(jù)集和評(píng)估方法
4.3.2 參數(shù)敏感性研究
4.3.3 權(quán)重分析
4.3.4 TSW對(duì)比實(shí)驗(yàn)結(jié)果
4.4 本章小結(jié)
第5章 總結(jié)與展望
5.1 總結(jié)
5.2 展望
參考文獻(xiàn)
致謝
攻讀碩士學(xué)位期間的研究成果
【參考文獻(xiàn)】:
期刊論文
[1]譜聚類算法綜述[J]. 蔡曉妍,戴冠中,楊黎斌. 計(jì)算機(jī)科學(xué). 2008(07)
博士論文
[1]面向大規(guī)模數(shù)據(jù)集的譜聚類方法研究[D]. 陳麗敏.哈爾濱工程大學(xué) 2015
本文編號(hào):3199438
【文章來(lái)源】:深圳大學(xué)廣東省
【文章頁(yè)數(shù)】:60 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 研究背景和意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.3 本文的主要研究?jī)?nèi)容
1.4 本文的組織結(jié)構(gòu)
第2章 基于傳統(tǒng)的購(gòu)買樹譜聚類算法理論
2.1 商品樹和購(gòu)買樹概念
2.2 購(gòu)買樹距離(PurTreemetricdistance)
2.3 購(gòu)買樹的索引結(jié)構(gòu)CoverTree的概念
2.4 傳統(tǒng)的PurTreeClust算法
2.5 本章小結(jié)
第3章 局部購(gòu)買樹的譜聚類方法(LPS)
3.1 LPS目標(biāo)函數(shù)
3.2 LPS優(yōu)化算法
3.2.1 參數(shù)F的優(yōu)化
3.2.2 參數(shù)P的優(yōu)化
3.2.3 參數(shù)w的優(yōu)化
3.2.4 計(jì)算λ的缺省值
3.2.5 計(jì)算η的缺省值
3.2.6 LPS優(yōu)化算法偽代碼
3.3 實(shí)驗(yàn)結(jié)果與分析
3.3.1 基準(zhǔn)數(shù)據(jù)集和評(píng)估方法
3.3.2 LPS參數(shù)敏感性研究和權(quán)重分析
3.3.3 LPS對(duì)比實(shí)驗(yàn)結(jié)果
3.4 本章小結(jié)
第4章 雙層子空間譜聚類方法(TSW)
4.1 TSW目標(biāo)函數(shù)
4.2 TWS優(yōu)化算法
4.2.1 固定P,a和w更新F
4.2.2 固定F,a和w更新P
4.2.3 固定P,F和w更新a
4.2.4 固定P,F和a更新w
4.2.5 計(jì)算λ的缺省值
4.2.6 TSW優(yōu)化算法偽代碼
4.3 實(shí)驗(yàn)結(jié)果與分析
4.3.1 基準(zhǔn)數(shù)據(jù)集和評(píng)估方法
4.3.2 參數(shù)敏感性研究
4.3.3 權(quán)重分析
4.3.4 TSW對(duì)比實(shí)驗(yàn)結(jié)果
4.4 本章小結(jié)
第5章 總結(jié)與展望
5.1 總結(jié)
5.2 展望
參考文獻(xiàn)
致謝
攻讀碩士學(xué)位期間的研究成果
【參考文獻(xiàn)】:
期刊論文
[1]譜聚類算法綜述[J]. 蔡曉妍,戴冠中,楊黎斌. 計(jì)算機(jī)科學(xué). 2008(07)
博士論文
[1]面向大規(guī)模數(shù)據(jù)集的譜聚類方法研究[D]. 陳麗敏.哈爾濱工程大學(xué) 2015
本文編號(hào):3199438
本文鏈接:http://sikaile.net/guanlilunwen/kehuguanxiguanli/3199438.html
最近更新
教材專著