天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于分布式計(jì)算的關(guān)聯(lián)規(guī)則挖掘算法研究與應(yīng)用

發(fā)布時(shí)間:2023-11-17 18:11
  數(shù)據(jù)挖掘是從大量數(shù)據(jù)中通過(guò)算法挖掘出有利于決策的信息的過(guò)程,關(guān)聯(lián)規(guī)則挖掘作為數(shù)據(jù)挖掘的一個(gè)有效方法,能便捷地從數(shù)據(jù)中提取有用的知識(shí)。但是,傳統(tǒng)的關(guān)聯(lián)規(guī)則挖掘方法在處理至少數(shù)百萬(wàn)的大數(shù)據(jù)時(shí)挖掘速度較慢,且容易挖掘到冗余的關(guān)聯(lián)規(guī)則。而且,傳統(tǒng)方法在處理增量式數(shù)據(jù)時(shí)存在歷史數(shù)據(jù)重復(fù)挖掘、規(guī)則挖掘準(zhǔn)確率不高的問題。針對(duì)以上問題,本文基于分布式計(jì)算的思想,分別在針對(duì)關(guān)聯(lián)規(guī)則的去冗余方面和對(duì)大數(shù)據(jù)的關(guān)聯(lián)規(guī)則挖掘的速度優(yōu)化方面進(jìn)行了研究和探索,并且研究了一種增量關(guān)聯(lián)規(guī)則挖掘算法,最后將算法應(yīng)用到在線零售上為上層決策者提供有用的信息。本文主要工作如下:1.構(gòu)建了一種基于分布式計(jì)算的較優(yōu)關(guān)聯(lián)規(guī)則挖掘算法。針對(duì)現(xiàn)有方法在大數(shù)據(jù)環(huán)境下挖掘速度較慢且挖掘到的關(guān)聯(lián)規(guī)則存在大量冗余的問題,基于分布式計(jì)算將數(shù)據(jù)分為多個(gè)部分,采用針對(duì)不同項(xiàng)集長(zhǎng)度的頻繁項(xiàng)集挖掘方法從各個(gè)部分挖掘局部頻繁項(xiàng)集并進(jìn)行整合;然后結(jié)合深度優(yōu)先搜索從最大頻繁項(xiàng)集出發(fā),根據(jù)提升度計(jì)算項(xiàng)集質(zhì)量,根據(jù)相對(duì)質(zhì)量大小去除冗余項(xiàng)集;最后僅對(duì)剩下的項(xiàng)集進(jìn)行挖掘并生成相應(yīng)的關(guān)聯(lián)規(guī)則,而不是根據(jù)置信度生成規(guī)則。該方法減少了對(duì)冗余頻繁項(xiàng)集的挖掘而產(chǎn)生的計(jì)算資源的浪...

【文章頁(yè)數(shù)】:71 頁(yè)

【學(xué)位級(jí)別】:碩士

【文章目錄】:
摘要
abstract
注釋表
第1章 引言
    1.1 研究背景及意義
    1.2 國(guó)內(nèi)外研究現(xiàn)狀
        1.2.1 關(guān)聯(lián)規(guī)則挖掘算法
        1.2.2 分布式計(jì)算相關(guān)算法
    1.3 存在的主要問題
    1.4 研究?jī)?nèi)容及技術(shù)路線
        1.4.1 主要研究?jī)?nèi)容
        1.4.2 技術(shù)路線
    1.5 論文組織結(jié)構(gòu)
第2章 相關(guān)理論基礎(chǔ)
    2.1 關(guān)聯(lián)規(guī)則挖掘基礎(chǔ)
    2.2 關(guān)聯(lián)規(guī)則挖掘算法
        2.2.1 Apriori算法
        2.2.2 FP-Growth算法
    2.3 分布式計(jì)算模型
    2.4 本章小結(jié)
第3章 基于分布式計(jì)算的關(guān)聯(lián)規(guī)則挖掘算法
    3.1 最大頻繁項(xiàng)集挖掘算法
        3.1.1 整體框架設(shè)計(jì)
        3.1.2 算法分析
    3.2 基于分布式計(jì)算的關(guān)聯(lián)規(guī)則挖掘算法優(yōu)化
        3.2.1 整體框架設(shè)計(jì)
        3.2.2 算法詳細(xì)描述
        3.2.3 時(shí)間復(fù)雜度分析
    3.3 實(shí)驗(yàn)設(shè)計(jì)與結(jié)果分析
        3.3.1 實(shí)驗(yàn)環(huán)境和數(shù)據(jù)集
        3.3.2 運(yùn)行時(shí)間對(duì)比
        3.3.3 關(guān)聯(lián)規(guī)則質(zhì)量對(duì)比
    3.4 本章小結(jié)
第4章 增量關(guān)聯(lián)規(guī)則挖掘算法
    4.1 并行增量頻繁項(xiàng)集挖掘算法
        4.1.1 整體框架設(shè)計(jì)
        4.1.2 算法分析
    4.2 基于分布式計(jì)算的增量關(guān)聯(lián)規(guī)則挖掘算法優(yōu)化
        4.2.1 整體框架設(shè)計(jì)
        4.2.2 算法詳細(xì)設(shè)計(jì)
    4.3 實(shí)驗(yàn)設(shè)計(jì)與結(jié)果分析
        4.3.1 實(shí)驗(yàn)環(huán)境及數(shù)據(jù)集
        4.3.2 速度提升對(duì)比
        4.3.3 頻繁項(xiàng)集準(zhǔn)確率對(duì)比
    4.4 本章小結(jié)
第5章 基于關(guān)聯(lián)規(guī)則挖掘的在線零售應(yīng)用
    5.1 在線零售的應(yīng)用背景
    5.2 應(yīng)用實(shí)例
        5.2.1 基于MR-IARM算法的在線零售決策過(guò)程
        5.2.2 結(jié)果分析
    5.3 本章小結(jié)
第6章 總結(jié)與展望
    6.1 研究工作總結(jié)與創(chuàng)新
    6.2 未來(lái)研究展望
參考文獻(xiàn)
致謝
攻讀碩士學(xué)位期間從事的科研工作及取得的成果



本文編號(hào):3864631

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3864631.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶ffeed***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com