天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 管理論文 > 物流管理論文 >

不確定頻繁閉項(xiàng)集挖掘算法研究

發(fā)布時(shí)間:2017-09-22 03:18

  本文關(guān)鍵詞:不確定頻繁閉項(xiàng)集挖掘算法研究


  更多相關(guān)文章: 數(shù)據(jù)挖掘 頻繁閉項(xiàng)集 不確定性數(shù)據(jù) 期望支持度


【摘要】:隨著互聯(lián)網(wǎng)的發(fā)展和科學(xué)技術(shù)的不斷進(jìn)步,各行各業(yè)都出現(xiàn)了海量的數(shù)據(jù),這些數(shù)據(jù)是傳統(tǒng)的技術(shù)所無(wú)法處理的。例如在經(jīng)濟(jì)、金融、電信等行業(yè)都出現(xiàn)了海量的數(shù)據(jù)。在這樣的大數(shù)據(jù)背景下如何挖掘出有用的知識(shí)變得越來(lái)越有意義。它可以有效的解決當(dāng)前數(shù)據(jù)豐富而知識(shí)匱乏的問(wèn)題。挖掘頻繁項(xiàng)集一直以來(lái)都是數(shù)據(jù)挖掘技術(shù)中的重點(diǎn)問(wèn)題。挖掘得出的頻繁項(xiàng)集可以更好的指導(dǎo)更有效的方案的制定。例如經(jīng)典的啤酒和尿布的案例。然而數(shù)據(jù)挖掘的結(jié)果往往不盡如人意,由于海量的數(shù)據(jù)以及支持度較低的時(shí)候挖掘出的頻繁項(xiàng)集的數(shù)量和關(guān)聯(lián)規(guī)則的數(shù)量往往也是巨大的,顯然這不是我們想要的結(jié)果,一般的解決思路就是讓結(jié)果只產(chǎn)生更具有代表性的子集,例如挖掘最大頻繁項(xiàng)集或者挖掘頻繁閉項(xiàng)集,但是最大頻繁項(xiàng)集將會(huì)丟失重要的信息,所以我們選擇使用頻繁閉項(xiàng)集來(lái)代替海量的頻繁項(xiàng)集。近些年來(lái),數(shù)據(jù)在傳感器網(wǎng)絡(luò)、衛(wèi)星圖像信息、Web應(yīng)用領(lǐng)域、無(wú)限射頻技術(shù)以及經(jīng)濟(jì)、物流、電信等應(yīng)用中都表現(xiàn)出了一種不確定性。因此在不確定性數(shù)據(jù)集中如何運(yùn)用數(shù)據(jù)挖掘技術(shù)變得十分迫切。然而目前經(jīng)典的挖掘算法都是針對(duì)確定的數(shù)據(jù)集進(jìn)行數(shù)據(jù)挖掘的。針對(duì)目前不確定性的數(shù)據(jù)集我們需要提出新的數(shù)據(jù)模型來(lái)應(yīng)對(duì)數(shù)據(jù)的復(fù)雜性。本文深入學(xué)習(xí)研究頻繁閉項(xiàng)集的挖掘算法之后提出改進(jìn)策略,并且對(duì)當(dāng)前廣泛出現(xiàn)的不確定性數(shù)據(jù)模型深入學(xué)習(xí),閱讀大量文獻(xiàn)之后提出了一種不確定頻繁閉項(xiàng)集挖掘算法。主要研究成果如下:1、頻繁項(xiàng)集挖掘的兩種策略。深入研究學(xué)習(xí)了大量的頻繁項(xiàng)集挖掘算法之后,頻繁項(xiàng)集挖掘領(lǐng)域的經(jīng)典算法主要有兩類(lèi),一是Apriori算法以及以Apriori算法為基礎(chǔ)的以層次迭代為策略來(lái)求取頻繁項(xiàng)集的挖掘算法。該算法的主要的不足之處就是必須多次訪問(wèn)事務(wù)數(shù)據(jù)庫(kù)和產(chǎn)生大量的候選項(xiàng)集,這無(wú)疑增加了大量的時(shí)空開(kāi)銷(xiāo)。二是FP-Growth算法以及基于FP-Tree結(jié)構(gòu)的算法。該類(lèi)算法采用深度優(yōu)先遍歷FP-Tree的策略,只需要訪問(wèn)一次事務(wù)數(shù)據(jù)庫(kù)并且完全避免了利用候選項(xiàng)集的策略,時(shí)空效率得到了大大的提高。2、頻繁閉項(xiàng)集挖掘的兩種策略。用來(lái)代替頻繁項(xiàng)集而出現(xiàn)的頻繁閉項(xiàng)集的挖掘算法主要分為兩類(lèi),一是類(lèi)Apriori算法,二是類(lèi)FP-Growth算法,在第二類(lèi)算法中挖掘頻繁閉項(xiàng)集效率最高的算法就是DCI_Closed算法,該算法提出這樣的概念:生成子是保序的,并且證明得出每個(gè)閉項(xiàng)集都有唯一保序的生成子序列。利用這一性質(zhì)來(lái)達(dá)到剪枝的目的,提高了的算法運(yùn)行的時(shí)間效率。3、提出了一種改進(jìn)的DCI_Closed算法,針對(duì)當(dāng)前頻繁閉項(xiàng)集高效挖掘算法DCI_Closed在挖掘過(guò)程中存在一定的不足之處,本文在DCI_Closed算法的基礎(chǔ)之上提出了一種改進(jìn)的DCI_Closed算法,在算法中引入共生項(xiàng)集和雙生項(xiàng)集的概念,在構(gòu)造FP-Tree結(jié)構(gòu)的時(shí)候?qū)蜻x的1-項(xiàng)集進(jìn)行有效的剪枝操作,以此來(lái)提高算法的時(shí)空效率。4、提出了一種新算法U_DCI_Closed算法,不確定性數(shù)據(jù)集下挖掘頻繁項(xiàng)集已經(jīng)成為數(shù)據(jù)挖掘領(lǐng)域中熱點(diǎn)問(wèn)題,然而在不確定性數(shù)據(jù)集下挖掘最大頻繁項(xiàng)集和頻繁閉項(xiàng)集的算法并不多見(jiàn)。在深入了解不確定性數(shù)據(jù)領(lǐng)域中的數(shù)學(xué)模型以及認(rèn)真研究頻繁閉項(xiàng)集挖掘的經(jīng)典算法之后,發(fā)現(xiàn)利用可能世界模型理論將不確定性事務(wù)數(shù)據(jù)轉(zhuǎn)換為確定的事務(wù)數(shù)據(jù),可以保留原先數(shù)據(jù)的不確定性,結(jié)合經(jīng)典的閉項(xiàng)集挖掘算法DCI_Closed提出了一種新算法U_DCI_Closed算法,實(shí)驗(yàn)表明新算法能夠在不確定數(shù)據(jù)集下高效的挖掘頻繁閉項(xiàng)集。
【關(guān)鍵詞】:數(shù)據(jù)挖掘 頻繁閉項(xiàng)集 不確定性數(shù)據(jù) 期望支持度
【學(xué)位授予單位】:山東師范大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類(lèi)號(hào)】:TP311.13
【目錄】:
  • 摘要5-7
  • ABSTRACT7-9
  • 第一章 緒論9-14
  • 1.1 研究背景及意義9-10
  • 1.2 國(guó)內(nèi)外研究現(xiàn)狀10-12
  • 1.2.1 頻繁項(xiàng)集挖掘研究現(xiàn)狀10-11
  • 1.2.2 不確定頻繁項(xiàng)集挖掘研究現(xiàn)狀11-12
  • 1.3 主要?jiǎng)?chuàng)新點(diǎn)12
  • 1.4 主要內(nèi)容和組織結(jié)構(gòu)12-14
  • 第二章 頻繁項(xiàng)集挖掘相關(guān)技術(shù)14-25
  • 2.1 頻繁項(xiàng)集挖掘基本知識(shí)14-19
  • 2.1.1 頻繁項(xiàng)集挖掘的定義14-16
  • 2.1.2 頻繁項(xiàng)集挖掘基本概念16-17
  • 2.1.3 Apriori算法17-18
  • 2.1.4 FP-growth算法18-19
  • 2.2 頻繁閉項(xiàng)集挖掘算法分析19-21
  • 2.2.1 Aclose算法19-20
  • 2.2.2 Closet算法20-21
  • 2.3 不確定數(shù)據(jù)頻繁項(xiàng)集挖掘算法21-24
  • 2.3.1 不確定數(shù)據(jù)產(chǎn)生原因21-22
  • 2.3.2 不確定數(shù)據(jù)的表現(xiàn)形式22-23
  • 2.3.3 U-Apriori算法分析23-24
  • 2.3.4 UF-growth算法分析24
  • 2.4 本章小結(jié)24-25
  • 第三章 DCI_Closed算法的一種改進(jìn)25-33
  • 3.1 DCI_Closed算法分析25-27
  • 3.1.1 算法思路25-26
  • 3.1.2 算法描述與分析26-27
  • 3.2 DCI_Closed算法改進(jìn)27-31
  • 3.2.1 相關(guān)概念定義及性質(zhì)27-28
  • 3.2.2 改進(jìn)的DCI_Closed算法28-30
  • 3.2.3 改進(jìn)算法描述30-31
  • 3.3 實(shí)驗(yàn)結(jié)果及分析31-32
  • 3.4 本章小結(jié)32-33
  • 第四章 一種不確定頻繁閉項(xiàng)集挖掘算法33-40
  • 4.1 不確定頻繁項(xiàng)集挖掘相關(guān)概念33-35
  • 4.1.1 基本概念33
  • 4.1.2 可能性世界模型理論33-35
  • 4.2 不確定頻繁閉項(xiàng)集挖掘算法U_DCI_Closed35-38
  • 4.2.1 U_DCI_Closed算法思路35-36
  • 4.2.2 抽樣方法分析36-37
  • 4.2.3 算法描述37-38
  • 4.3 實(shí)驗(yàn)結(jié)果及分析38-39
  • 4.4 本章小結(jié)39-40
  • 第五章 總結(jié)與展望40-42
  • 5.1 總結(jié)40-41
  • 5.2 展望41-42
  • 參考文獻(xiàn)42-45
  • 攻讀碩士學(xué)位期間取得的科研成果45-46
  • 致謝46

【相似文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條

1 李力,翟東海,靳蕃;基于圖的頻繁閉項(xiàng)集挖掘算法[J];西南交通大學(xué)學(xué)報(bào);2004年03期

2 陳凱,馮全源;一個(gè)頻繁閉項(xiàng)集高效挖掘算法[J];計(jì)算機(jī)與數(shù)字工程;2005年09期

3 戰(zhàn)立強(qiáng);劉大昕;;基于概念格的頻繁閉項(xiàng)集增量挖掘算法研究[J];哈爾濱工程大學(xué)學(xué)報(bào);2007年02期

4 宋旭東;翟坤;劉曉冰;;基于圖論的頻繁閉項(xiàng)集挖掘[J];微電子學(xué)與計(jì)算機(jī);2007年08期

5 宋威;楊炳儒;徐章艷;高靜;;一種改進(jìn)的頻繁閉項(xiàng)集挖掘算法[J];計(jì)算機(jī)研究與發(fā)展;2008年02期

6 董杰;韓敏;;挖掘事務(wù)間頻繁閉項(xiàng)集的高效率算法[J];控制與決策;2008年09期

7 吳春旭;陳家耀;劉博文;;一種挖掘頻繁閉項(xiàng)集的改進(jìn)算法[J];計(jì)算機(jī)系統(tǒng)應(yīng)用;2008年10期

8 譚峻松;首照宇;;一種分布式環(huán)境下動(dòng)態(tài)挖掘頻繁閉項(xiàng)集算法[J];大眾科技;2010年09期

9 延皓;張博;劉芳;雷振明;;基于量值的頻繁閉項(xiàng)集層次聚類(lèi)算法[J];北京郵電大學(xué)學(xué)報(bào);2011年06期

10 章淑云;張守志;;基于不確定性數(shù)據(jù)的頻繁閉項(xiàng)集挖掘算法[J];計(jì)算機(jī)工程;2014年03期

中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前5條

1 黃國(guó)言;王立波;任家東;;一種基于滑動(dòng)窗口的數(shù)據(jù)流頻繁閉項(xiàng)集挖掘算法[A];第26屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(B輯)[C];2009年

2 曹?chē)?guó)棟;郭景峰;;一種基于定量更新滑動(dòng)窗口頻繁閉項(xiàng)集挖掘算法[A];第二十三屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2006年

3 吳春旭;陳家耀;劉博文;;一種改進(jìn)CLOSET算法[A];第十屆中國(guó)管理科學(xué)學(xué)術(shù)年會(huì)論文集[C];2008年

4 任家東;馮佳音;李可;;FCISW:數(shù)據(jù)流中增量挖掘頻繁閉項(xiàng)集的新方法[A];第二十四屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2007年

5 莫曉靜;史嵐;許光宇;趙宇海;王國(guó)仁;喬建忠;;MFCC:一種高效的三維頻繁閉項(xiàng)集挖掘算法[A];第二十四屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2007年

中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條

1 沈盛霞;頻繁閉項(xiàng)集挖掘算法研究[D];安徽大學(xué);2016年

2 苗永明;不確定頻繁閉項(xiàng)集挖掘算法研究[D];山東師范大學(xué);2016年

3 張賀;挖掘頻繁閉項(xiàng)集并構(gòu)建其格的快速算法研究[D];重慶大學(xué);2008年

4 余春;頻繁閉項(xiàng)集并行挖掘算法的研究與實(shí)現(xiàn)[D];重慶大學(xué);2008年

5 胡冰;頻繁閉項(xiàng)集的挖掘算法及內(nèi)容分析[D];河南大學(xué);2009年

6 秦東霞;基于頻繁閉項(xiàng)集的關(guān)聯(lián)分類(lèi)算法研究[D];重慶大學(xué);2009年

7 趙留長(zhǎng);基因表達(dá)數(shù)據(jù)中高支持度頻繁閉合模式的挖掘[D];哈爾濱工業(yè)大學(xué);2010年

8 賴(lài)勝;數(shù)據(jù)流頻繁閉項(xiàng)集挖掘算法研究[D];蘭州理工大學(xué);2011年

9 張博;寬帶網(wǎng)絡(luò)用戶Web業(yè)務(wù)分析[D];北京郵電大學(xué);2012年

10 陳凱;關(guān)聯(lián)規(guī)則挖掘算法研究[D];西南交通大學(xué);2005年



本文編號(hào):898481

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/wuliuguanlilunwen/898481.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶35103***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com