天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

基于緊湊模式樹和多最小支持度的頻繁模式挖掘算法研究

發(fā)布時間:2021-05-16 19:22
  大數(shù)據(jù)時代最典型的特征是“數(shù)據(jù)爆炸,信息匱乏”,因此對數(shù)據(jù)的分析挖掘提出了更高的要求。數(shù)據(jù)挖掘旨在把隱藏在海量且雜亂數(shù)據(jù)背后的知識和信息提取出來,并歸納出隱含在其中的內(nèi)在規(guī)律,為后續(xù)決策做出科學(xué)性地指導(dǎo)。頻繁模式挖掘作為數(shù)據(jù)挖掘過程中最基本和最關(guān)鍵的步驟,一直以來都是最熱門的研究領(lǐng)域之一,許多學(xué)者都對其進(jìn)行了深入研究,但仍有許多問題亟待解決與完善。本文在單支持度和多支持度頻繁模式挖掘算法的基礎(chǔ)上,對頻繁模式挖掘算法進(jìn)行了相應(yīng)改進(jìn)。具體研究內(nèi)容和研究成果如下:(1)提出了一種基于改進(jìn)緊湊模式樹的Apriori頻繁模式挖掘算法ICP-tree。首先,在Apriori算法的連接步前加入連接預(yù)處理操作,控制參與自連接的頻繁項(xiàng)集的數(shù)量,約減生成的候選項(xiàng)集的數(shù)量;其次,將緊湊模式樹(CP-tree)進(jìn)行擴(kuò)展,構(gòu)造了一個新的樹結(jié)構(gòu)ECP-tree,新的樹結(jié)構(gòu)只需對數(shù)據(jù)庫進(jìn)行一次遍歷,且能有效處理數(shù)據(jù)流問題;然后,將改進(jìn)點(diǎn)與APFT算法結(jié)合,用于挖掘頻繁模式;最后,通過對兩種不同類型的數(shù)據(jù)集進(jìn)行實(shí)驗(yàn),將ICP-tree算法與Apriori算法、FP-growth算法、APFT算法以及文獻(xiàn)60提出的算法... 

【文章來源】:西安理工大學(xué)陜西省

【文章頁數(shù)】:76 頁

【學(xué)位級別】:碩士

【文章目錄】:
摘要
Abstract
1 緒論
    1.1 研究背景與意義
        1.1.1 研究背景
        1.1.2 研究意義
    1.2 國內(nèi)外研究現(xiàn)狀
        1.2.1 基于單支持度頻繁模式挖掘算法國內(nèi)外研究現(xiàn)狀
        1.2.2 基于多最小支持度的頻繁模式挖掘算法國內(nèi)外研究現(xiàn)狀
    1.3 本文研究結(jié)構(gòu)
        1.3.1 論文主要研究工作
        1.3.2 論文組織結(jié)構(gòu)
2 預(yù)備知識
    2.1 頻繁模式挖掘相關(guān)定義
    2.2 Apriori算法
    2.3 FP-growth算法
        2.3.1 構(gòu)造FP-tree
        2.3.2 FP-tree的頻繁模式挖掘
    2.4 多最小支持度的相關(guān)定義
        2.4.1 頻繁模式的多最小支持度
        2.4.2 多最小支持度定義
        2.4.3 多最小支持度算法
    2.5 本章小結(jié)
3 基于改進(jìn)緊湊模式樹的Apriori頻繁模式挖掘算法
    3.1 算法改進(jìn)動機(jī)
    3.2 算法改進(jìn)思想
        3.2.1 緊湊模式樹介紹
        3.2.2 APFT算法介紹
    3.3 算法改進(jìn)方案
        3.3.1 優(yōu)化連接步
        3.3.2 擴(kuò)展緊湊模式樹
    3.4 算法性能分析
        3.4.1 實(shí)驗(yàn)環(huán)境與數(shù)據(jù)集
        3.4.2 樹構(gòu)造實(shí)驗(yàn)
        3.4.3 運(yùn)行時間
    3.5 本章小結(jié)
4 基于多最小支持度的頻繁模式挖掘算法
    4.1 算法改進(jìn)動機(jī)
    4.2 算法改進(jìn)思想
        4.2.1 構(gòu)造緊湊MIS-tree
    4.3 算法改進(jìn)方案
        4.3.1 構(gòu)建最小頻繁項(xiàng)表
        4.3.2 構(gòu)造IMIS-tree
    4.4 從IMIS-tree中挖掘頻繁模式
    4.5 算法性能分析
        4.5.1 實(shí)驗(yàn)環(huán)境與數(shù)據(jù)集
        4.5.2 運(yùn)行時間
        4.5.3 內(nèi)存消耗
        4.5.4 可擴(kuò)展性
        4.5.5 結(jié)果分析
    4.6 本章小結(jié)
5 總結(jié)與展望
    5.1 主要研究結(jié)果
    5.2 展望
致謝
參考文獻(xiàn)
攻讀碩士學(xué)位期間主要研究成果


【參考文獻(xiàn)】:
期刊論文
[1]頻繁項(xiàng)集挖掘的研究進(jìn)展及主流方法[J]. 李廣璞,黃妙華.  計(jì)算機(jī)科學(xué). 2018(S2)
[2]基于矩陣相乘的Apriori改進(jìn)算法[J]. 王蒙,方睿,鄒書蓉.  計(jì)算機(jī)與數(shù)字工程. 2018(10)
[3]基于Spark的并行FP-Growth算法優(yōu)化及實(shí)現(xiàn)[J]. 顧軍華,武君艷,許馨勻,謝志堅(jiān),張素琪.  計(jì)算機(jī)應(yīng)用. 2018(11)
[4]一種基于fp-tree的Apriori算法改進(jìn)研究[J]. 倪政君,夏哲雷.  中國計(jì)量大學(xué)學(xué)報(bào). 2018(01)
[5]基于事務(wù)映射區(qū)間求交的高效頻繁模式挖掘算法[J]. 吳磊,程良倫,王濤.  計(jì)算機(jī)應(yīng)用研究. 2019(04)
[6]一種基于預(yù)判篩選的頻繁項(xiàng)集挖掘算法[J]. 李德辰,呂一帆,趙學(xué)健.  計(jì)算機(jī)技術(shù)與發(fā)展. 2018(05)
[7]基于節(jié)點(diǎn)表的FP-Growth算法改進(jìn)[J]. 王建明,袁偉.  計(jì)算機(jī)工程與設(shè)計(jì). 2018(01)
[8]基于二維數(shù)組和十字鏈表的Apriori算法[J]. 陳衡,劉玉文.  德州學(xué)院學(xué)報(bào). 2017(02)
[9]基于Hadoop的FP-Growth關(guān)聯(lián)規(guī)則并行改進(jìn)算法[J]. 厙向陽,張玲.  計(jì)算機(jī)應(yīng)用研究. 2018(01)
[10]基于矩陣的Apriori算法改進(jìn)[J]. 宋文慧,高建瓴.  計(jì)算機(jī)技術(shù)與發(fā)展. 2016(06)

碩士論文
[1]關(guān)聯(lián)規(guī)則算法的研究與改進(jìn)[D]. 張盼.西安電子科技大學(xué) 2015
[2]基于壓縮FP-tree的頻繁項(xiàng)集快速挖掘算法研究[D]. 吳倩.華東理工大學(xué) 2015



本文編號:3190257

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3190257.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶05110***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com