天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 管理論文 > 營銷論文 >

頻繁閉項集挖掘算法研究

發(fā)布時間:2017-03-25 13:15

  本文關(guān)鍵詞:頻繁閉項集挖掘算法研究,由筆耕文化傳播整理發(fā)布。


【摘要】:在大數(shù)據(jù)的時代背景下,人們被淹沒在信息之中,卻得不到更多有用的知識。數(shù)據(jù)挖掘技術(shù)由此應(yīng)運而生。近年來,關(guān)聯(lián)規(guī)則挖掘研究已經(jīng)成為數(shù)據(jù)挖掘中的一個熱門問題,并被廣泛應(yīng)用于金融、市場營銷、事務(wù)分析等領(lǐng)域。傳統(tǒng)的關(guān)聯(lián)規(guī)則挖掘算法主要任務(wù)是挖掘頻繁項集,然而挖掘所有頻繁項集會產(chǎn)生太多的冗余。由于頻繁閉項集的數(shù)量級遠小于所有頻繁項集的數(shù)量,而且頻繁閉項集不會丟失項集的信息,所以不用挖掘所有的頻繁項集,用挖掘頻繁閉項集來代替是一個很好的選擇。近年來,不確定性數(shù)據(jù)得到了越來越廣泛的重視。不確定性數(shù)據(jù)廣泛出現(xiàn)在經(jīng)濟、金融、電信、物流等領(lǐng)域中,不確定數(shù)據(jù)挖掘已經(jīng)成為數(shù)據(jù)挖掘領(lǐng)域中一個非常重要的研究課題,其中頻繁項集挖掘是重點研究的問題之一。因此,本文主要研究了在確定性數(shù)據(jù)和不確定性數(shù)據(jù)上來挖掘頻繁閉項集的問題。本文主要工作包括:(1)詳細說明了在確定性數(shù)據(jù)和不確定性數(shù)據(jù)上挖掘頻繁閉項集的有關(guān)概念和相關(guān)理論;(2)總結(jié)了之前已有的兩類主流頻繁項集挖掘框架:基于Apriori的寬度優(yōu)先挖掘和基于FP樹的深度優(yōu)先挖掘;(3)詳細介紹了確定性數(shù)據(jù)上的頻繁閉項集挖掘算法,總結(jié)了相關(guān)算法的優(yōu)缺點,并通過實驗對比證明了各算法的性能;(4)針對最新的不確定數(shù)據(jù)上的頻繁閉項集挖掘算法A-PFCIM算法進行了深入分析;(5)提出了一種新的頻繁閉項集挖掘算法NA-PFCIM。該算法將項集挖掘過程中項集的出現(xiàn)次數(shù)看作一個概率分布函數(shù),考慮到基于正態(tài)分布模型的方法提取的頻繁項集精確度較高,而且支持大型數(shù)據(jù)庫,所以我們采用了正態(tài)分布模型提取頻繁項集。同時,為了減少搜索空間以及避免冗余計算,利用基于深度優(yōu)先搜索的策略來獲得所有的概率頻繁閉項集。算法還設(shè)計了兩個剪枝策略:超集修剪和子集修剪。最后,在常用的數(shù)據(jù)集上,將提出的NA-PFCIM算法和基于泊松分布的A-PFCIM算法進行比較。實驗結(jié)果表明,NA-PFCIM算法能夠減少所要擴展的項集,同時減少項集頻繁概率的計算,其性能優(yōu)于對比算法。
【關(guān)鍵詞】:關(guān)聯(lián)規(guī)則 頻繁項集 頻繁閉項集 深度優(yōu)先策略 不確定性數(shù)據(jù)
【學(xué)位授予單位】:安徽大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP311.13
【目錄】:
  • 摘要3-4
  • Abstract4-9
  • 第一章 緒論9-13
  • 1.1 研究背景及意義9
  • 1.2 國內(nèi)外研究現(xiàn)狀9-11
  • 1.3 本文的主要創(chuàng)新點11
  • 1.4 本文的主要內(nèi)容及組織結(jié)構(gòu)11-12
  • 1.5 本章小結(jié)12-13
  • 第二章 相關(guān)理論13-21
  • 2.1 基本概念介紹13-16
  • 2.1.1 確定性數(shù)據(jù)上的頻繁閉項集13
  • 2.1.2 不確定性數(shù)據(jù)上的頻繁閉項集13-14
  • 2.1.3 舉例說明14-16
  • 2.2 頻繁閉項集挖掘框架介紹16-20
  • 2.2.1 Apriori算法16-18
  • 2.2.2 FP-Growth算法18-20
  • 2.3 本章小結(jié)20-21
  • 第三章 確定性數(shù)據(jù)頻繁閉項集挖掘算法21-32
  • 3.1 Moment算法21-25
  • 3.1.1 Moment算法主要內(nèi)容21-23
  • 3.1.2 Moment算法舉例23-25
  • 3.2 NewMoment算法25-27
  • 3.2.1 NewMoment算法主要內(nèi)容25-27
  • 3.2.2 NewMoment算法舉例27
  • 3.3 TMoment算法27-29
  • 3.3.1 TMoment算法主要內(nèi)容28
  • 3.3.2 TMoment算法舉例28-29
  • 3.4 實驗結(jié)果及分析29-31
  • 3.4.1 實驗環(huán)境設(shè)置29
  • 3.4.2 運行時間及內(nèi)存使用對比29-31
  • 3.5 本章小結(jié)31-32
  • 第四章 不確定性數(shù)據(jù)頻繁閉項集挖掘算法32-49
  • 4.1 數(shù)據(jù)的不確定性32-36
  • 4.1.1 不確定性數(shù)據(jù)的產(chǎn)生原因32
  • 4.1.2 不確定性數(shù)據(jù)的表現(xiàn)形式32-33
  • 4.1.3 不確定性數(shù)據(jù)的處理模型33-36
  • 4.2 A-PFCIM算法36-39
  • 4.3 NA-PFCIM算法39-43
  • 4.3.1 算法主要思想39
  • 4.3.2 基于正態(tài)分布模型計算項集的概率支持度39-41
  • 4.3.3 基于深度優(yōu)先搜索策略的挖掘樹41-43
  • 4.4 實驗結(jié)果及分析43-48
  • 4.4.1 實驗環(huán)境設(shè)置43
  • 4.4.2 運行時間對比43-46
  • 4.4.3 近似質(zhì)量評價:查準率和查全率46-47
  • 4.4.4 挖掘結(jié)果壓縮質(zhì)量評價47-48
  • 4.5 本章小結(jié)48-49
  • 第五章 總結(jié)與展望49-51
  • 5.1 總結(jié)49
  • 5.2 展望49-51
  • 參考文獻51-55
  • 致謝55-56
  • 附錄56-57
  • 附錄A 圖索引56
  • 附錄B 表索引56-57
  • Appendix57-58
  • Appendix A Figure Index57
  • Appendix B Table Index57-58
  • 碩士學(xué)位期間發(fā)表的論文及科研情況58

【參考文獻】

中國期刊全文數(shù)據(jù)庫 前4條

1 劉慧婷;沈盛霞;趙鵬;姚晟;;不確定數(shù)據(jù)頻繁閉項集挖掘算法[J];計算機應(yīng)用;2015年10期

2 李學(xué)明;楊陽;秦東霞;周尚波;;基于頻繁閉項集的新關(guān)聯(lián)分類算法ACCF[J];電子科技大學(xué)學(xué)報;2012年01期

3 周傲英;金澈清;王國仁;李建中;;不確定性數(shù)據(jù)管理技術(shù)研究綜述[J];計算機學(xué)報;2009年01期

4 劉旭;毛國君;孫岳;劉椿年;;數(shù)據(jù)流中頻繁閉項集的近似挖掘算法[J];電子學(xué)報;2007年05期

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前3條

1 汪金苗;基于不確定數(shù)據(jù)的頻繁項集挖掘算法的研究[D];山東理工大學(xué);2012年

2 李雪;不確定數(shù)據(jù)聚類研究[D];大連理工大學(xué);2009年

3 張賀;挖掘頻繁閉項集并構(gòu)建其格的快速算法研究[D];重慶大學(xué);2008年


  本文關(guān)鍵詞:頻繁閉項集挖掘算法研究,由筆耕文化傳播整理發(fā)布。

,

本文編號:267272

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/yingxiaoguanlilunwen/267272.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶fd25d***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com