基于Nodeset的最大頻繁項(xiàng)集挖掘算法
本文關(guān)鍵詞:基于Nodeset的最大頻繁項(xiàng)集挖掘算法 出處:《計(jì)算機(jī)工程》2016年12期 論文類型:期刊論文
更多相關(guān)文章: 最大頻繁項(xiàng)集 關(guān)聯(lián)規(guī)則 剪枝技術(shù) 前綴樹 超集檢測(cè)
【摘要】:遞歸遍歷、條件FP-Tree構(gòu)建與超集檢測(cè)是多數(shù)基于FP-Tree最大頻繁項(xiàng)集挖掘算法的主要性能瓶頸。為此,提出一種基于Nodeset的最大頻繁項(xiàng)集挖掘算法——MFIN算法。該算法采用Nodeset數(shù)據(jù)結(jié)構(gòu)對(duì)POC-Tree的節(jié)點(diǎn)編碼,將集合枚舉樹作為搜索空間,避免遞歸遍歷和條件FP-Tree構(gòu)建的時(shí)間開銷。設(shè)計(jì)提前停止方法提高求解Nodeset交集的效率,采用父等價(jià)剪枝技術(shù)和前瞻剪枝技術(shù)縮小搜索空間。對(duì)基于MFI-Tree的投影策略進(jìn)行改進(jìn),提升超集檢測(cè)的速度。實(shí)驗(yàn)結(jié)果表明,MFIN算法在mushroom,pumsb,webdocs數(shù)據(jù)集上的運(yùn)行時(shí)間及執(zhí)行效率等總體性能明顯優(yōu)于基于FP-Tree的FP-Max算法。
【作者單位】: 華東師范大學(xué)計(jì)算機(jī)科學(xué)技術(shù)系;
【基金】:上海市國(guó)際科技合作項(xiàng)目(13430710100) 上海市科委科技創(chuàng)新行動(dòng)計(jì)劃項(xiàng)目(13511506201)
【分類號(hào)】:TP311.13
【正文快照】: 0概述1993年,Rakesh Agrawal等人[1]提出了關(guān)聯(lián)規(guī)則挖掘這一研究課題。作為數(shù)據(jù)挖掘中的一個(gè)重要研究方向,關(guān)聯(lián)規(guī)則挖掘已經(jīng)被普遍應(yīng)用于分類[2]、數(shù)據(jù)流時(shí)序規(guī)則[3]、網(wǎng)絡(luò)故障檢測(cè)[4]等。關(guān)聯(lián)規(guī)則挖掘一般分為挖掘頻繁項(xiàng)集與提取關(guān)聯(lián)規(guī)則2個(gè)步驟。其中,由于指數(shù)級(jí)別的搜索空
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 宋威;楊炳儒;徐章艷;侯偉;;基于索引數(shù)組與集合枚舉樹的最大頻繁項(xiàng)集挖掘算法[J];計(jì)算機(jī)科學(xué);2007年07期
2 陳晨;;最大頻繁項(xiàng)集挖掘算法綜述[J];電腦知識(shí)與技術(shù);2008年32期
3 劉紅星;王崇駿;謝俊元;;基于圖的最大頻繁項(xiàng)集的生成算法[J];南京大學(xué)學(xué)報(bào)(自然科學(xué)版);2008年05期
4 陳凱,馮全源;最大頻繁項(xiàng)集的高效挖掘[J];微電子學(xué)與計(jì)算機(jī);2005年08期
5 袁鼎榮;嚴(yán)小衛(wèi);;最大頻繁項(xiàng)集挖掘算法的分析研究[J];計(jì)算機(jī)應(yīng)用與軟件;2005年12期
6 顏躍進(jìn),李舟軍,陳火旺;一種挖掘最大頻繁項(xiàng)集的深度優(yōu)先算法[J];計(jì)算機(jī)研究與發(fā)展;2005年03期
7 顏躍進(jìn);李舟軍;陳火旺;;多層擴(kuò)展挖掘最大頻繁項(xiàng)集[J];計(jì)算機(jī)工程與科學(xué);2006年03期
8 胡斌;蔣外文;黃天強(qiáng);陳生萍;施淵;;一種最大頻繁項(xiàng)集快速更新算法[J];計(jì)算機(jī)應(yīng)用研究;2006年12期
9 郭有強(qiáng);胡學(xué)鋼;;基于項(xiàng)目增長(zhǎng)法高效求解最大頻繁項(xiàng)集[J];安徽科技學(xué)院學(xué)報(bào);2006年06期
10 胡斌;蔣外文;蔡國(guó)民;黃天強(qiáng);卓月明;;基于位陣的更新最大頻繁項(xiàng)集算法[J];計(jì)算機(jī)工程;2007年03期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前5條
1 楊君銳;趙群禮;杜建;;關(guān)于最大頻繁項(xiàng)集的增量式挖掘方法研究[A];第二十一屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2004年
2 楊仕博;賀彥琨;馬志新;;一種基于極大完全子圖的最大頻繁項(xiàng)集并行挖掘算法[A];2007年全國(guó)開放式分布與并行計(jì)算機(jī)學(xué)術(shù)會(huì)議論文集(下冊(cè))[C];2007年
3 黃紅星;鐘一文;黃習(xí)培;;挖掘最大頻繁項(xiàng)集的二進(jìn)制蟻群優(yōu)化算法[A];第四屆中國(guó)智能計(jì)算大會(huì)論文集[C];2010年
4 王卉;屈強(qiáng);;挖掘最大頻繁項(xiàng)集的并行化策略[A];2007年全國(guó)開放式分布與并行計(jì)算機(jī)學(xué)術(shù)會(huì)議論文集(上冊(cè))[C];2007年
5 任家東;霍聰;;數(shù)據(jù)流中基于PB-tree的當(dāng)前最大頻繁項(xiàng)集挖掘算法[A];第二十五屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(二)[C];2008年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前3條
1 王卉;最大頻繁項(xiàng)集挖掘算法及應(yīng)用研究[D];華中科技大學(xué);2004年
2 顏躍進(jìn);最大頻繁項(xiàng)集挖掘算法的研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2005年
3 敖富江;數(shù)據(jù)流頻繁模式挖掘關(guān)鍵算法及其仿真應(yīng)用研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2008年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 張進(jìn);微博炒作賬戶特征分析與群體發(fā)現(xiàn)技術(shù)研究[D];解放軍信息工程大學(xué);2014年
2 候明利;不確定數(shù)據(jù)流最大頻繁項(xiàng)集挖掘算法研究[D];安徽大學(xué);2016年
3 張心靜;最大頻繁項(xiàng)集挖掘算法的研究[D];長(zhǎng)春工業(yè)大學(xué);2016年
4 羅昌銀;一種基于動(dòng)態(tài)排序的最大頻繁項(xiàng)集挖掘算法[D];重慶大學(xué);2010年
5 劉華;蟻群算法在挖掘最大頻繁項(xiàng)集問(wèn)題中的應(yīng)用研究[D];河北工業(yè)大學(xué);2007年
6 宋曉輝;基于Web使用挖掘的個(gè)性化技術(shù)研究[D];燕山大學(xué);2009年
7 韓崇;最大頻繁項(xiàng)集和頻繁基項(xiàng)集挖掘算法研究[D];河南大學(xué);2010年
8 裴文柱;數(shù)據(jù)流最大頻繁項(xiàng)集挖掘算法的研究[D];東北大學(xué);2009年
9 姜晗;關(guān)聯(lián)規(guī)則的精簡(jiǎn)方法研究[D];浙江師范大學(xué);2007年
10 惠亮;關(guān)聯(lián)規(guī)則挖掘算法研究[D];江南大學(xué);2011年
,本文編號(hào):1317683
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1317683.html