天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于混合類型數(shù)據(jù)分析的用戶聚類方法研究及應(yīng)用

發(fā)布時(shí)間:2023-11-28 19:58
  用戶聚類分析的目的是分析核心用戶群體的特征,可以應(yīng)用于精準(zhǔn)營(yíng)銷、商業(yè)決策、安全預(yù)警等領(lǐng)域。有關(guān)用戶的數(shù)據(jù)通常是混合型數(shù)據(jù),包括數(shù)值類型、分類類型和多維非對(duì)稱特征,即多值離散特征,如興趣、愛(ài)好等。然而,在使用K-means等傳統(tǒng)聚類算法對(duì)用戶進(jìn)行聚類分析時(shí)無(wú)法深層次挖掘多值離散特征包含的信息。針對(duì)這一問(wèn)題,本文構(gòu)建了一種結(jié)合關(guān)聯(lián)規(guī)則與多值離散特征的聚類方法(A Clustering Method that Combines Association Rule and Multi-valued Discrete Features,ARMDKM),提高了用戶聚類的質(zhì)量。同時(shí),針對(duì)當(dāng)前用戶聚類分析沒(méi)有考慮用戶行為之間的關(guān)聯(lián)與重要性的問(wèn)題,構(gòu)造了一種基于用戶特征重要性的用戶聚類算法,提高了聚類分析的準(zhǔn)確度。本文主要研究工作如下:1.構(gòu)建一種結(jié)合關(guān)聯(lián)規(guī)則的用戶聚類方法。當(dāng)前用戶聚類算法無(wú)法有效地分析用戶數(shù)據(jù)中存在的多值離散特征,這導(dǎo)致數(shù)據(jù)的利用率以及用戶相似度計(jì)算的準(zhǔn)確性降低。本文將關(guān)聯(lián)規(guī)則(Association Rules,AR)引入到Jaccard距離的計(jì)算過(guò)程中,構(gòu)造了一種用戶之間相似性度量...

【文章頁(yè)數(shù)】:64 頁(yè)

【學(xué)位級(jí)別】:碩士

【文章目錄】:
摘要
abstract
第1章 引言
    1.1 研究背景及意義
    1.2 國(guó)內(nèi)外研究現(xiàn)狀
        1.2.1 用戶聚類分析
        1.2.2 無(wú)監(jiān)督特征選擇方法
    1.3 存在的問(wèn)題
    1.4 研究?jī)?nèi)容及技術(shù)路線
        1.4.1 研究?jī)?nèi)容
        1.4.2 技術(shù)路線
    1.5 論文組織結(jié)構(gòu)
第2章 相關(guān)理論基礎(chǔ)
    2.1 聚類分析
        2.1.1 K-modes算法
        2.1.2 譜聚類
        2.1.3 相似性度量
        2.1.4 聚類質(zhì)量評(píng)價(jià)指標(biāo)
    2.2 關(guān)聯(lián)規(guī)則挖掘
        2.2.1 頻繁項(xiàng)集
        2.2.2 關(guān)聯(lián)規(guī)則
    2.3 隨機(jī)森林
    2.4 本章小結(jié)
第3章 結(jié)合關(guān)聯(lián)規(guī)則的用戶聚類方法
    3.1 改進(jìn)分析
    3.2 結(jié)合關(guān)聯(lián)規(guī)則與多值離散特征的用戶聚類算法
        3.2.1 ARMDKM算法流程
        3.2.2 基于關(guān)聯(lián)規(guī)則和Jaccard距離的相似性度量方法
        3.2.3 聚類中心更新方法
        3.2.4 方法建模
    3.3 實(shí)驗(yàn)設(shè)計(jì)與分析
        3.3.1 實(shí)驗(yàn)環(huán)境與數(shù)據(jù)集
        3.3.2 外部評(píng)價(jià)
        3.3.3 內(nèi)部評(píng)價(jià)
    3.4 本章小結(jié)
第4章 結(jié)合特征重要性的雙層用戶聚類方法
    4.1 改進(jìn)分析
    4.2 結(jié)合特征重要性的雙層用戶聚類方法
        4.2.1 TL-FIUC算法流程
        4.2.2 結(jié)合K-means++和隨機(jī)森林的無(wú)監(jiān)督特征選擇方法
        4.2.3 基于譜聚類的用戶聚類算法
    4.3 實(shí)驗(yàn)設(shè)計(jì)與分析
        4.3.1 實(shí)驗(yàn)環(huán)境與數(shù)據(jù)集
        4.3.2 實(shí)驗(yàn)分析
    4.4 本章小結(jié)
第5章 基于聚類分析的用戶群體發(fā)現(xiàn)應(yīng)用
    5.1 應(yīng)用實(shí)例
        5.1.1 數(shù)據(jù)獲取
        5.1.2 聚類數(shù)k的確定
        5.1.3 聚類效果分析
    5.2 本章小結(jié)
第6章 總結(jié)與展望
    6.1 研究工作總結(jié)與創(chuàng)新
    6.2 未來(lái)研究展望
參考文獻(xiàn)
致謝
攻讀碩士學(xué)位期間從事的科研工作及取得的成果



本文編號(hào):3868838

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3868838.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶ab64f***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com