基于MapReduce的top-k高效用模式挖掘算法
本文關(guān)鍵詞: 數(shù)據(jù)挖掘 top-k 高效用模式 MapReduce 并行算法 出處:《計(jì)算機(jī)應(yīng)用研究》2017年10期 論文類型:期刊論文
【摘要】:高效用模式挖掘被廣泛地應(yīng)用于數(shù)據(jù)挖掘領(lǐng)域。為了挖掘指定數(shù)量的高效用模式,一些基于樹結(jié)構(gòu)和效用表結(jié)構(gòu)的top-k高效用挖掘算法被提出,但前者在挖掘過程中產(chǎn)生了大量候選模式,后者在效用模式增長時(shí)需要進(jìn)行多次比較;同時(shí),由于在信息社會,數(shù)據(jù)量呈爆炸性增長,所以在數(shù)據(jù)集過大的情況下,挖掘高效用模式需以大量存儲空間以及計(jì)算開銷為代價(jià)。為了解決這兩個(gè)問題,基于MapReduce的top-k高效用模式挖掘算法(TKHUP_MaR)被提出。該算法通過兩次掃描數(shù)據(jù)庫,利用三次MapReduce來實(shí)現(xiàn)并行top-k高效用模式的挖掘。通過實(shí)驗(yàn)表明TKHUP_MaR算法在并行挖掘top-k高效用模式的過程中是有效的。
[Abstract]:High utility pattern mining is widely used in the field of data mining. In order to mine a specified number of high utility patterns, some top-k high utility mining algorithms based on tree structure and utility table structure are proposed. However, the former produces a large number of candidate patterns in the mining process, while the latter needs to be compared several times when the utility pattern grows. At the same time, because the data volume increases explosively in the information society, so the data set is too large. In order to solve these two problems, the top-k high utility pattern mining algorithm named TKHUPMaR based on MapReduce is proposed, which scans the database twice. Using cubic MapReduce to realize the mining of parallel top-k high utility pattern, the experiment shows that the TKHUP_MaR algorithm is effective in the process of parallel mining top-k high utility pattern.
【作者單位】: 華中師范大學(xué)計(jì)算機(jī)學(xué)院;華中師范大學(xué)科技處;
【基金】:國家自然科學(xué)基金資助項(xiàng)目(61370108)
【分類號】:TP311.13
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 吳進(jìn);宋順林;王迎春;;基于頻繁偏愛度的使用模式挖掘算法的研究[J];計(jì)算機(jī)應(yīng)用;2006年10期
2 王宇新;田佳;郭禾;吳樹朋;楊元生;;應(yīng)用模糊方法的設(shè)計(jì)模式挖掘策略研究[J];計(jì)算機(jī)工程與應(yīng)用;2010年02期
3 陸億紅;王子仁;黃燕;;適合稀少空間特征的同位模式挖掘算法[J];浙江工業(yè)大學(xué)學(xué)報(bào);2007年04期
4 郭燕萍;辛伯宇;;高選票例外模式挖掘研究與實(shí)現(xiàn)[J];電腦開發(fā)與應(yīng)用;2007年08期
5 徐顯九;楊燕;岳愛萍;;高效的用戶移動模式挖掘方法[J];計(jì)算機(jī)應(yīng)用研究;2007年09期
6 李帆;夏士雄;張磊;;基于模糊理論的不確定軌跡模式挖掘[J];微電子學(xué)與計(jì)算機(jī);2011年08期
7 李中元;邊馥苓;;空間同位模式挖掘研究進(jìn)展[J];地理空間信息;2013年06期
8 邢東山,沈鈞毅,宋擒豹;用戶瀏覽偏愛模式挖掘算法的研究[J];西安交通大學(xué)學(xué)報(bào);2002年04期
9 劉洪輝;吳岳芬;;用戶行為模式挖掘問題的研究[J];計(jì)算機(jī)技術(shù)與發(fā)展;2006年05期
10 付曉翠;許盈;車路;;游戲訪問模式挖掘的研究與應(yīng)用[J];鄭州大學(xué)學(xué)報(bào)(理學(xué)版);2007年04期
相關(guān)會議論文 前9條
1 王肅;杜軍平;高田;;基于本體與知識背景的模式挖掘框架研究[A];2009年中國智能自動化會議論文集(第二分冊)[C];2009年
2 繆裕青;尹東;;分布式存儲結(jié)構(gòu)的頻繁閉合模式挖掘并行算法[A];2007年全國開放式分布與并行計(jì)算機(jī)學(xué)術(shù)會議論文集(下冊)[C];2007年
3 王淼;尚學(xué)群;謝華博;李戰(zhàn)懷;;行常量差異共表達(dá)基因模式挖掘算法研究[A];第29屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(B輯)(NDBC2012)[C];2012年
4 劉玉葆;蔡嘉榮;印鑒;黃志蘭;;基于最大訪問模式挖掘的數(shù)據(jù)庫異常行為檢測[A];第二十三屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報(bào)告篇)[C];2006年
5 陸葉;王麗珍;陳紅梅;趙麗紅;;基于可能世界的不確定空間co-location模式挖掘研究[A];NDBC2010第27屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(B輯)[C];2010年
6 王麗珍;陸葉;陳紅梅;肖清;;基于前綴樹結(jié)構(gòu)的空間co-location模式挖掘算法研究[A];NDBC2010第27屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(B輯)[C];2010年
7 胡偉成;曹三省;李丹;;一種基于QPop增量時(shí)域分割升維的媒體內(nèi)容應(yīng)用模式挖掘改進(jìn)算法[A];第二十二屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報(bào)告篇)[C];2005年
8 薛丹;李德敏;裴仁林;;移動計(jì)算中基于PrefixSpan算法的用戶移動模式挖掘[A];第二十一屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報(bào)告篇)[C];2004年
9 夏慶;馬元元;孫志揮;;路徑遍歷模式挖掘方法的改進(jìn)[A];第十六屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集[C];1999年
相關(guān)博士學(xué)位論文 前7條
1 Shafqat Ali Shad;移動用戶軌跡與行為模式挖掘方法研究[D];中國科學(xué)技術(shù)大學(xué);2013年
2 錢烽;同位模式挖掘研究[D];浙江大學(xué);2012年
3 劉勇;圖模式挖掘技術(shù)的研究[D];哈爾濱工業(yè)大學(xué);2010年
4 覃桂敏;復(fù)雜網(wǎng)絡(luò)模式挖掘算法研究[D];西安電子科技大學(xué);2012年
5 王樂;數(shù)據(jù)流模式挖掘算法及應(yīng)用研究[D];大連理工大學(xué);2013年
6 林耀進(jìn);多源環(huán)境中數(shù)據(jù)預(yù)處理與模式挖掘的研究[D];合肥工業(yè)大學(xué);2014年
7 曾海泉;時(shí)間序列挖掘與相似性查找技術(shù)研究[D];復(fù)旦大學(xué);2003年
相關(guān)碩士學(xué)位論文 前10條
1 楊陽;云計(jì)算環(huán)境下時(shí)空軌跡伴隨模式挖掘研究[D];南京師范大學(xué);2015年
2 李海;基于用戶軌跡數(shù)據(jù)的周期活動模式挖掘[D];江蘇科技大學(xué);2015年
3 周青峰;云計(jì)算環(huán)境下的模式挖掘算法研究[D];浙江工商大學(xué);2015年
4 陳瑞;基于分治子圖和極大有序團(tuán)樹的co-location模式挖掘研究[D];云南大學(xué);2015年
5 張子瀚;面向大數(shù)據(jù)的高效用模式挖掘方法研究[D];北方工業(yè)大學(xué);2016年
6 張剛領(lǐng);一種基于團(tuán)的閉頻繁Co-location模式挖掘方法[D];云南大學(xué);2016年
7 江萬國;基于領(lǐng)域驅(qū)動的空間高效用Co-location模式挖掘[D];云南大學(xué);2016年
8 吳錫宇;基于約束的城市co-location模式挖掘[D];云南大學(xué);2016年
9 馮魯橋;基于C/C++代碼庫的API調(diào)用模式挖掘研究及實(shí)現(xiàn)[D];電子科技大學(xué);2016年
10 王敏;云計(jì)算環(huán)境下時(shí)空軌跡聚集模式挖掘算法研究[D];南京師范大學(xué);2016年
,本文編號:1527312
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1527312.html