天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 搜索引擎論文 >

析取空間中頻繁項(xiàng)集精簡(jiǎn)表示模型研究

發(fā)布時(shí)間:2020-06-05 21:21
【摘要】:頻繁模式挖掘是數(shù)據(jù)挖掘領(lǐng)域的經(jīng)典課題。頻繁模式挖掘在實(shí)際應(yīng)用中的基本問(wèn)題是頻繁模式通常數(shù)量龐大,冗余嚴(yán)重。究其原因,主要是因?yàn)閭鹘y(tǒng)挖掘方法基于剛性的支持度-置信度閾值來(lái)區(qū)分模式,由于受到數(shù)據(jù)中隨機(jī)噪聲的影響,容易導(dǎo)致實(shí)際相同的模式因?yàn)榧?xì)微差異而被挖掘系統(tǒng)認(rèn)作了不同的模式。為此本文致力于研究利用析取空間的項(xiàng)集模式來(lái)設(shè)計(jì)頻繁模式精簡(jiǎn)表示模型,以消除頻繁模式挖掘結(jié)果集中存在的冗余。本文的主要研究工作如下:(1)針對(duì)析取空間中的析取模式,本文研究發(fā)現(xiàn),析取模式集中仍然存在著模式冗余現(xiàn)象,因隨機(jī)噪聲造成的這一類冗余,具有局部和擾動(dòng)量微小等特點(diǎn)。為此,本文引入析取模式的δ-鄰域概念,以消除隨機(jī)噪聲造成的冗余,并以此為基礎(chǔ),提出一種新的頻繁模式精簡(jiǎn)表示模型。分析了此模型的性質(zhì)和頻繁模式恢復(fù)的精度和算法策略等問(wèn)題,并利用深度優(yōu)先遞歸搜索方法,輔以啟發(fā)性策略,設(shè)計(jì)了高效率的精簡(jiǎn)的析取模式集挖掘算法DCPM。實(shí)驗(yàn)結(jié)果表明,通過(guò)該模型得到的精簡(jiǎn)集,規(guī)模比傳統(tǒng)析取閉合項(xiàng)集明顯減少,并且恢復(fù)全體頻繁項(xiàng)集的支持度錯(cuò)誤也較小。(2)在δ-鄰域劃分過(guò)程中,本文研究發(fā)現(xiàn),多組不同δ-鄰域之間會(huì)存在重疊現(xiàn)象,而且這種重疊現(xiàn)象十分廣泛,對(duì)于重疊現(xiàn)象處理不當(dāng),會(huì)導(dǎo)致支持度恢復(fù)誤差加大,甚至在最終結(jié)果集中引入冗余。本文提出從中繼節(jié)點(diǎn)、交叉節(jié)點(diǎn)和替代集析取支持度等三個(gè)方面,來(lái)解決δ-鄰域劃分的最優(yōu)化問(wèn)題,并據(jù)此對(duì)算法DCPM進(jìn)行改造形成了新算法NDCPM。利用DCPM算法中使用的有效技術(shù)改造MEP形成了算法NFMEP。實(shí)驗(yàn)結(jié)果表明,NDCPM算法挖掘結(jié)果更精確,NFMEP具有較高的執(zhí)行效率。
【圖文】:

流程圖,核心項(xiàng),流程,最小支持度


對(duì)于表2.1示例數(shù)據(jù)庫(kù)Z),給定最小支持度/m_mwp=0.125。以項(xiàng)集丨ACD}和逡逑{AC}為例,,分析它們是否是頻繁核心項(xiàng)集的過(guò)程。判斷她們是否是頻繁核心項(xiàng)集逡逑的過(guò)程如圖3.2所示。為了直觀地表示某個(gè)項(xiàng)4是否在事務(wù)中出現(xiàn),用0和1逡逑進(jìn)行描述。若項(xiàng)4在事務(wù)/;.中出現(xiàn),則它們之間構(gòu)成的二元關(guān)系的對(duì)應(yīng)位用1表逡逑不,否則用0表不。逡逑對(duì)于表2.1示例數(shù)據(jù)庫(kù),給定最小支持度Mfrawp=0.125。根據(jù)定理3.1,{AC}逡逑和{ACD丨是否是頻繁核心項(xiàng)集的判斷流程如下:{AC}e/,g(AC)Q/(A)={5,8},逡逑23逡逑

鄰域,性質(zhì),核心項(xiàng),深度優(yōu)先搜索樹


逑剪枝步3.2:由性質(zhì)3.6可知,在求解7的矣鄰域過(guò)程中,若Z逡逑的子集都不屬于7的鄰域。如圖3.3所示,/m>m(p=0.125,5=l時(shí),NBSct/?e/?(ABC,J),逡逑求解ABC的表鄰域時(shí),AB的子集都不需要進(jìn)行判斷。逡逑深度優(yōu)先搜索樹逡逑頻繁核心項(xiàng)集搜索過(guò)程中,存在路徑逡逑、I邋^邐root—>邋A—>邋ACr^邋ACD;逡逑3^-Lv邐有:ACcASwXvAQ^wAvACD),逡逑邐(A)邐則:ACD<zf。逡逑/"邐性質(zhì)3.5可知:ACD剪枝,不再向下拓展。逡逑irQp邋?逡逑H,邋T邐,邋^邐求ABC的鄰域時(shí),對(duì)于路徑逡逑(^ACD^)邐root->邋A->AB->邋ABC:逡逑VLy邐有:/r(ABC>=ABCD,AB<z/te/?(ABC,l),AeAB,逡逑*(ABC)={ABCD}邐性質(zhì)3.6可知:AB的子集不屬于ABC^J鄰域集合
【學(xué)位授予單位】:合肥工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2018
【分類號(hào)】:TP311.13

【參考文獻(xiàn)】

相關(guān)期刊論文 前10條

1 楊鵬坤;彭慧;周曉鋒;孫玉慶;;改進(jìn)的基于頻繁模式樹的最大頻繁項(xiàng)集挖掘算法——FP-MFIA[J];計(jì)算機(jī)應(yīng)用;2015年03期

2 田衛(wèi)東;陳浩;;一種精簡(jiǎn)的關(guān)聯(lián)規(guī)則表示模型[J];計(jì)算機(jī)應(yīng)用研究;2015年03期

3 田衛(wèi)東;紀(jì)允;;一種頻繁核心項(xiàng)集的快速挖掘算法[J];計(jì)算機(jī)工程;2014年06期

4 胡健;吳毛毛;;一種改進(jìn)的數(shù)據(jù)流最大頻繁項(xiàng)集挖掘算法[J];計(jì)算機(jī)工程與科學(xué);2014年05期

5 尹紹宏;單坤玉;范桂丹;;滑動(dòng)窗口中數(shù)據(jù)流最大頻繁項(xiàng)集挖掘算法研究[J];計(jì)算機(jī)工程與應(yīng)用;2015年22期

6 李海峰;章寧;;數(shù)據(jù)流上的最大頻繁項(xiàng)集挖掘方法[J];計(jì)算機(jī)工程;2012年21期

7 宋威;李晉宏;徐章艷;楊炳儒;;一種新的頻繁項(xiàng)集精簡(jiǎn)表示方法及其挖掘算法的研究[J];計(jì)算機(jī)研究與發(fā)展;2010年02期

8 俞揚(yáng)信;;基于語(yǔ)義相似度的信息檢索研究[J];情報(bào)雜志;2009年09期

9 陳晨;鞠時(shí)光;;基于改進(jìn)FP-tree的最大頻繁項(xiàng)集挖掘算法[J];計(jì)算機(jī)工程與設(shè)計(jì);2008年24期

10 程轉(zhuǎn)流;胡學(xué)鋼;;數(shù)據(jù)流中頻繁閉合模式的挖掘[J];計(jì)算機(jī)工程;2008年16期

相關(guān)碩士學(xué)位論文 前1條

1 許靜文;基于模糊等價(jià)類的頻繁項(xiàng)集精簡(jiǎn)表示算法研究[D];合肥工業(yè)大學(xué);2015年



本文編號(hào):2698631

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2698631.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶4d74f***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com