天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 管理論文 > 營銷論文 >

頻繁閉項(xiàng)集挖掘算法研究

發(fā)布時(shí)間:2017-03-25 13:15

  本文關(guān)鍵詞:頻繁閉項(xiàng)集挖掘算法研究,由筆耕文化傳播整理發(fā)布。


【摘要】:在大數(shù)據(jù)的時(shí)代背景下,人們被淹沒在信息之中,卻得不到更多有用的知識(shí)。數(shù)據(jù)挖掘技術(shù)由此應(yīng)運(yùn)而生。近年來,關(guān)聯(lián)規(guī)則挖掘研究已經(jīng)成為數(shù)據(jù)挖掘中的一個(gè)熱門問題,并被廣泛應(yīng)用于金融、市場營銷、事務(wù)分析等領(lǐng)域。傳統(tǒng)的關(guān)聯(lián)規(guī)則挖掘算法主要任務(wù)是挖掘頻繁項(xiàng)集,然而挖掘所有頻繁項(xiàng)集會(huì)產(chǎn)生太多的冗余。由于頻繁閉項(xiàng)集的數(shù)量級(jí)遠(yuǎn)小于所有頻繁項(xiàng)集的數(shù)量,而且頻繁閉項(xiàng)集不會(huì)丟失項(xiàng)集的信息,所以不用挖掘所有的頻繁項(xiàng)集,用挖掘頻繁閉項(xiàng)集來代替是一個(gè)很好的選擇。近年來,不確定性數(shù)據(jù)得到了越來越廣泛的重視。不確定性數(shù)據(jù)廣泛出現(xiàn)在經(jīng)濟(jì)、金融、電信、物流等領(lǐng)域中,不確定數(shù)據(jù)挖掘已經(jīng)成為數(shù)據(jù)挖掘領(lǐng)域中一個(gè)非常重要的研究課題,其中頻繁項(xiàng)集挖掘是重點(diǎn)研究的問題之一。因此,本文主要研究了在確定性數(shù)據(jù)和不確定性數(shù)據(jù)上來挖掘頻繁閉項(xiàng)集的問題。本文主要工作包括:(1)詳細(xì)說明了在確定性數(shù)據(jù)和不確定性數(shù)據(jù)上挖掘頻繁閉項(xiàng)集的有關(guān)概念和相關(guān)理論;(2)總結(jié)了之前已有的兩類主流頻繁項(xiàng)集挖掘框架:基于Apriori的寬度優(yōu)先挖掘和基于FP樹的深度優(yōu)先挖掘;(3)詳細(xì)介紹了確定性數(shù)據(jù)上的頻繁閉項(xiàng)集挖掘算法,總結(jié)了相關(guān)算法的優(yōu)缺點(diǎn),并通過實(shí)驗(yàn)對(duì)比證明了各算法的性能;(4)針對(duì)最新的不確定數(shù)據(jù)上的頻繁閉項(xiàng)集挖掘算法A-PFCIM算法進(jìn)行了深入分析;(5)提出了一種新的頻繁閉項(xiàng)集挖掘算法NA-PFCIM。該算法將項(xiàng)集挖掘過程中項(xiàng)集的出現(xiàn)次數(shù)看作一個(gè)概率分布函數(shù),考慮到基于正態(tài)分布模型的方法提取的頻繁項(xiàng)集精確度較高,而且支持大型數(shù)據(jù)庫,所以我們采用了正態(tài)分布模型提取頻繁項(xiàng)集。同時(shí),為了減少搜索空間以及避免冗余計(jì)算,利用基于深度優(yōu)先搜索的策略來獲得所有的概率頻繁閉項(xiàng)集。算法還設(shè)計(jì)了兩個(gè)剪枝策略:超集修剪和子集修剪。最后,在常用的數(shù)據(jù)集上,將提出的NA-PFCIM算法和基于泊松分布的A-PFCIM算法進(jìn)行比較。實(shí)驗(yàn)結(jié)果表明,NA-PFCIM算法能夠減少所要擴(kuò)展的項(xiàng)集,同時(shí)減少項(xiàng)集頻繁概率的計(jì)算,其性能優(yōu)于對(duì)比算法。
【關(guān)鍵詞】:關(guān)聯(lián)規(guī)則 頻繁項(xiàng)集 頻繁閉項(xiàng)集 深度優(yōu)先策略 不確定性數(shù)據(jù)
【學(xué)位授予單位】:安徽大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP311.13
【目錄】:
  • 摘要3-4
  • Abstract4-9
  • 第一章 緒論9-13
  • 1.1 研究背景及意義9
  • 1.2 國內(nèi)外研究現(xiàn)狀9-11
  • 1.3 本文的主要?jiǎng)?chuàng)新點(diǎn)11
  • 1.4 本文的主要內(nèi)容及組織結(jié)構(gòu)11-12
  • 1.5 本章小結(jié)12-13
  • 第二章 相關(guān)理論13-21
  • 2.1 基本概念介紹13-16
  • 2.1.1 確定性數(shù)據(jù)上的頻繁閉項(xiàng)集13
  • 2.1.2 不確定性數(shù)據(jù)上的頻繁閉項(xiàng)集13-14
  • 2.1.3 舉例說明14-16
  • 2.2 頻繁閉項(xiàng)集挖掘框架介紹16-20
  • 2.2.1 Apriori算法16-18
  • 2.2.2 FP-Growth算法18-20
  • 2.3 本章小結(jié)20-21
  • 第三章 確定性數(shù)據(jù)頻繁閉項(xiàng)集挖掘算法21-32
  • 3.1 Moment算法21-25
  • 3.1.1 Moment算法主要內(nèi)容21-23
  • 3.1.2 Moment算法舉例23-25
  • 3.2 NewMoment算法25-27
  • 3.2.1 NewMoment算法主要內(nèi)容25-27
  • 3.2.2 NewMoment算法舉例27
  • 3.3 TMoment算法27-29
  • 3.3.1 TMoment算法主要內(nèi)容28
  • 3.3.2 TMoment算法舉例28-29
  • 3.4 實(shí)驗(yàn)結(jié)果及分析29-31
  • 3.4.1 實(shí)驗(yàn)環(huán)境設(shè)置29
  • 3.4.2 運(yùn)行時(shí)間及內(nèi)存使用對(duì)比29-31
  • 3.5 本章小結(jié)31-32
  • 第四章 不確定性數(shù)據(jù)頻繁閉項(xiàng)集挖掘算法32-49
  • 4.1 數(shù)據(jù)的不確定性32-36
  • 4.1.1 不確定性數(shù)據(jù)的產(chǎn)生原因32
  • 4.1.2 不確定性數(shù)據(jù)的表現(xiàn)形式32-33
  • 4.1.3 不確定性數(shù)據(jù)的處理模型33-36
  • 4.2 A-PFCIM算法36-39
  • 4.3 NA-PFCIM算法39-43
  • 4.3.1 算法主要思想39
  • 4.3.2 基于正態(tài)分布模型計(jì)算項(xiàng)集的概率支持度39-41
  • 4.3.3 基于深度優(yōu)先搜索策略的挖掘樹41-43
  • 4.4 實(shí)驗(yàn)結(jié)果及分析43-48
  • 4.4.1 實(shí)驗(yàn)環(huán)境設(shè)置43
  • 4.4.2 運(yùn)行時(shí)間對(duì)比43-46
  • 4.4.3 近似質(zhì)量評(píng)價(jià):查準(zhǔn)率和查全率46-47
  • 4.4.4 挖掘結(jié)果壓縮質(zhì)量評(píng)價(jià)47-48
  • 4.5 本章小結(jié)48-49
  • 第五章 總結(jié)與展望49-51
  • 5.1 總結(jié)49
  • 5.2 展望49-51
  • 參考文獻(xiàn)51-55
  • 致謝55-56
  • 附錄56-57
  • 附錄A 圖索引56
  • 附錄B 表索引56-57
  • Appendix57-58
  • Appendix A Figure Index57
  • Appendix B Table Index57-58
  • 碩士學(xué)位期間發(fā)表的論文及科研情況58

【參考文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前4條

1 劉慧婷;沈盛霞;趙鵬;姚晟;;不確定數(shù)據(jù)頻繁閉項(xiàng)集挖掘算法[J];計(jì)算機(jī)應(yīng)用;2015年10期

2 李學(xué)明;楊陽;秦東霞;周尚波;;基于頻繁閉項(xiàng)集的新關(guān)聯(lián)分類算法ACCF[J];電子科技大學(xué)學(xué)報(bào);2012年01期

3 周傲英;金澈清;王國仁;李建中;;不確定性數(shù)據(jù)管理技術(shù)研究綜述[J];計(jì)算機(jī)學(xué)報(bào);2009年01期

4 劉旭;毛國君;孫岳;劉椿年;;數(shù)據(jù)流中頻繁閉項(xiàng)集的近似挖掘算法[J];電子學(xué)報(bào);2007年05期

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前3條

1 汪金苗;基于不確定數(shù)據(jù)的頻繁項(xiàng)集挖掘算法的研究[D];山東理工大學(xué);2012年

2 李雪;不確定數(shù)據(jù)聚類研究[D];大連理工大學(xué);2009年

3 張賀;挖掘頻繁閉項(xiàng)集并構(gòu)建其格的快速算法研究[D];重慶大學(xué);2008年


  本文關(guān)鍵詞:頻繁閉項(xiàng)集挖掘算法研究,由筆耕文化傳播整理發(fā)布。

,

本文編號(hào):267272

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/yingxiaoguanlilunwen/267272.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶fd25d***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com