動態(tài)數(shù)據(jù)庫中增量Top-k高效用模式挖掘算法
本文關鍵詞: 增量挖掘 效用挖掘 Top-k模式挖掘 動態(tài)數(shù)據(jù)庫 出處:《計算機應用研究》2017年05期 論文類型:期刊論文
【摘要】:高效用模式的挖掘需要設定一個合適的閾值,而閾值設定對用戶來說并非易事,閾值過小導致產(chǎn)生大量低效用模式,閾值過大可能導致無高效用模式生成。因而Top-k高效用模式挖掘方法被提出,k指效用值前k大的模式。并且大量的高效用挖掘研究僅針對靜態(tài)數(shù)據(jù)庫,但在實際應用中常常會遇到新事務的加入的情況。針對以上問題,提出了增量的Top-k高效用挖掘算法TOPK-HUP-INS。算法通過四個有效的策略,在增量數(shù)據(jù)的情況下,有效地挖掘用戶所需數(shù)量的高效用模式。通過在不同數(shù)據(jù)集上的對比實驗表明TOPK-HUP-INS算法在時空性能上表現(xiàn)優(yōu)異。
[Abstract]:High utility pattern mining needs to set a suitable threshold, and threshold setting is not easy for users, too small threshold results in a large number of inefficient patterns. Excessive threshold may lead to no high utility pattern generation. Therefore, Top-k high utility pattern mining method is proposed, and a large number of research on high utility mining is only aimed at static database. But in the practical application will often encounter the situation of new transactions to join. In view of the above problems. An incremental Top-k high utility mining algorithm, TOPK-HUP-INS. is proposed. The algorithm uses four effective strategies in the case of incremental data. The comparison experiments on different data sets show that the TOPK-HUP-INS algorithm performs well in time and space performance.
【作者單位】: 華中師范大學計算機學院;
【基金】:國家自然科學基金資助項目(61370108)
【分類號】:TP311.13
【正文快照】: 0引言關聯(lián)規(guī)則挖掘[1~4]是事務數(shù)據(jù)庫中揭示項與項之間關系的基本方法,其中比較典型的是Apriori[5]和FP-Growth[6]算法。但關聯(lián)規(guī)則挖掘僅僅關注于模式(項集)在事務數(shù)據(jù)庫中的頻繁度問題,而忽略了模式本身所具有的價值,而該價值往往是用戶決策的重要憑據(jù)。例如,在超市購物籃模
【相似文獻】
相關期刊論文 前10條
1 王宇新;田佳;郭禾;吳樹朋;楊元生;;應用模糊方法的設計模式挖掘策略研究[J];計算機工程與應用;2010年02期
2 陸億紅;王子仁;黃燕;;適合稀少空間特征的同位模式挖掘算法[J];浙江工業(yè)大學學報;2007年04期
3 郭燕萍;辛伯宇;;高選票例外模式挖掘研究與實現(xiàn)[J];電腦開發(fā)與應用;2007年08期
4 徐顯九;楊燕;岳愛萍;;高效的用戶移動模式挖掘方法[J];計算機應用研究;2007年09期
5 李帆;夏士雄;張磊;;基于模糊理論的不確定軌跡模式挖掘[J];微電子學與計算機;2011年08期
6 李中元;邊馥苓;;空間同位模式挖掘研究進展[J];地理空間信息;2013年06期
7 邢東山,沈鈞毅,宋擒豹;用戶瀏覽偏愛模式挖掘算法的研究[J];西安交通大學學報;2002年04期
8 劉洪輝;吳岳芬;;用戶行為模式挖掘問題的研究[J];計算機技術與發(fā)展;2006年05期
9 付曉翠;許盈;車路;;游戲訪問模式挖掘的研究與應用[J];鄭州大學學報(理學版);2007年04期
10 顏一鳴;郭鑫;李仁發(fā);;一種非確定樹模式挖掘算法[J];計算機工程與應用;2011年15期
相關會議論文 前9條
1 王肅;杜軍平;高田;;基于本體與知識背景的模式挖掘框架研究[A];2009年中國智能自動化會議論文集(第二分冊)[C];2009年
2 繆裕青;尹東;;分布式存儲結構的頻繁閉合模式挖掘并行算法[A];2007年全國開放式分布與并行計算機學術會議論文集(下冊)[C];2007年
3 王淼;尚學群;謝華博;李戰(zhàn)懷;;行常量差異共表達基因模式挖掘算法研究[A];第29屆中國數(shù)據(jù)庫學術會議論文集(B輯)(NDBC2012)[C];2012年
4 劉玉葆;蔡嘉榮;印鑒;黃志蘭;;基于最大訪問模式挖掘的數(shù)據(jù)庫異常行為檢測[A];第二十三屆中國數(shù)據(jù)庫學術會議論文集(研究報告篇)[C];2006年
5 陸葉;王麗珍;陳紅梅;趙麗紅;;基于可能世界的不確定空間co-location模式挖掘研究[A];NDBC2010第27屆中國數(shù)據(jù)庫學術會議論文集(B輯)[C];2010年
6 王麗珍;陸葉;陳紅梅;肖清;;基于前綴樹結構的空間co-location模式挖掘算法研究[A];NDBC2010第27屆中國數(shù)據(jù)庫學術會議論文集(B輯)[C];2010年
7 胡偉成;曹三省;李丹;;一種基于QPop增量時域分割升維的媒體內(nèi)容應用模式挖掘改進算法[A];第二十二屆中國數(shù)據(jù)庫學術會議論文集(技術報告篇)[C];2005年
8 薛丹;李德敏;裴仁林;;移動計算中基于PrefixSpan算法的用戶移動模式挖掘[A];第二十一屆中國數(shù)據(jù)庫學術會議論文集(技術報告篇)[C];2004年
9 夏慶;馬元元;孫志揮;;路徑遍歷模式挖掘方法的改進[A];第十六屆全國數(shù)據(jù)庫學術會議論文集[C];1999年
相關博士學位論文 前7條
1 Shafqat Ali Shad;移動用戶軌跡與行為模式挖掘方法研究[D];中國科學技術大學;2013年
2 錢烽;同位模式挖掘研究[D];浙江大學;2012年
3 劉勇;圖模式挖掘技術的研究[D];哈爾濱工業(yè)大學;2010年
4 覃桂敏;復雜網(wǎng)絡模式挖掘算法研究[D];西安電子科技大學;2012年
5 王樂;數(shù)據(jù)流模式挖掘算法及應用研究[D];大連理工大學;2013年
6 林耀進;多源環(huán)境中數(shù)據(jù)預處理與模式挖掘的研究[D];合肥工業(yè)大學;2014年
7 曾海泉;時間序列挖掘與相似性查找技術研究[D];復旦大學;2003年
相關碩士學位論文 前10條
1 楊陽;云計算環(huán)境下時空軌跡伴隨模式挖掘研究[D];南京師范大學;2015年
2 李海;基于用戶軌跡數(shù)據(jù)的周期活動模式挖掘[D];江蘇科技大學;2015年
3 周青峰;云計算環(huán)境下的模式挖掘算法研究[D];浙江工商大學;2015年
4 陳瑞;基于分治子圖和極大有序團樹的co-location模式挖掘研究[D];云南大學;2015年
5 張子瀚;面向大數(shù)據(jù)的高效用模式挖掘方法研究[D];北方工業(yè)大學;2016年
6 張剛領;一種基于團的閉頻繁Co-location模式挖掘方法[D];云南大學;2016年
7 江萬國;基于領域驅(qū)動的空間高效用Co-location模式挖掘[D];云南大學;2016年
8 吳錫宇;基于約束的城市co-location模式挖掘[D];云南大學;2016年
9 馮魯橋;基于C/C++代碼庫的API調(diào)用模式挖掘研究及實現(xiàn)[D];電子科技大學;2016年
10 王敏;云計算環(huán)境下時空軌跡聚集模式挖掘算法研究[D];南京師范大學;2016年
,本文編號:1478321
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1478321.html