天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 軟件論文 >

基于PrefixSpan的序列模式挖掘改進算法研究

發(fā)布時間:2018-06-07 10:36

  本文選題:數據挖掘 + 序列模式; 參考:《四川師范大學》2017年碩士論文


【摘要】:序列模式挖掘是數據挖掘中一個重要研究領域,其序列模式挖掘算法研究具有重要研究意義。通過對經典序列模式挖掘算法的研究,本文取得如下研究成果:(1)對經典序列模式挖掘算法AprioriAll、GSP、SPADE和SPAM進行比較與分析。(2)對基于模式增長的序列模式挖掘算法Prefix Span進行研究,給出了該算法在序列模式挖掘過程中存在重復投影數據庫的理論分析、算法在執(zhí)行過程中的投影劃分次數的上確界和下確界、最壞情形下產生重復投影數據庫數的一般式。(3)在基于前綴投影思想并參考SPAM算法的數據結構基礎上,采用二維表來存儲頻繁項在序列數據庫中的位置信息;統(tǒng)計二維表中每列非空位置信息集的個數快速計算序列支持度,并確定其頻繁性;通過對序列前綴位置的進行檢查避免序列模式挖掘過程中對相同投影子表的重復挖掘。
[Abstract]:Sequential pattern mining is an important research field in data mining. Based on the research of classical sequential pattern mining algorithms, this paper has obtained the following research results: 1) compare and analyze the classical sequential pattern mining algorithms Apriori AllGSPSPADE and SPAM. (2) study the sequential pattern mining algorithm (Prefix Span) based on pattern growth. The theoretical analysis of the repeated projection database in the process of sequential pattern mining is given, and the upper and lower bounds of the number of projection partition in the execution of the algorithm are given. In the worst case, the general formula of generating the number of repeated projection databases. Based on the idea of prefix projection and referring to the data structure of SPAM algorithm, the two-dimensional table is used to store the location information of frequent items in the sequence database. The number of non-empty position information sets of each column in the two-dimensional table is calculated quickly and the frequency of the sequence is determined. By checking the position of the sequence prefix, the repeated mining of the same projection sub-table is avoided in the process of mining the sequence pattern.
【學位授予單位】:四川師范大學
【學位級別】:碩士
【學位授予年份】:2017
【分類號】:TP311.13

【參考文獻】

相關期刊論文 前10條

1 楊斐;張萬楨;陸垂偉;;一種無候選項的閉合序列模式挖掘算法[J];計算機應用與軟件;2016年03期

2 姬浩博;王俊紅;;一種改進的PrefixSpan算法及其在Web用戶行為模式挖掘中的應用[J];計算機科學;2016年01期

3 李敬泉;滿秀芳;;零售商B2C模式下雙渠道定價策略選擇研究[J];商業(yè)研究;2015年06期

4 公偉;劉培玉;賈嫻;;基于改進PrefixSpan的序列模式挖掘算法[J];計算機應用;2011年09期

5 王虎;丁世飛;;序列模式挖掘研究與發(fā)展[J];計算機科學;2009年12期

6 汪林林;范軍;;基于PrefixSpan的序列模式挖掘改進算法[J];計算機工程;2009年23期

7 肖仁財;薛安榮;;一種挖掘多維序列模式的有效方法[J];計算機工程與應用;2008年06期

8 夏維力;王鑫;王青松;;數據挖掘技術在企業(yè)客戶關系管理中的應用研究[J];科技管理研究;2007年06期

9 張坤;朱揚勇;;無重復投影數據庫掃描的序列模式挖掘算法[J];計算機研究與發(fā)展;2007年01期

10 劉立軍;崔杰;梅紅巖;;GSP與PrefixSpan算法的比較與分析[J];遼寧工學院學報;2006年05期

相關碩士學位論文 前3條

1 馮佳佳;基于序列模式挖掘的關鍵詞抽取問題研究[D];合肥工業(yè)大學;2012年

2 姜海輝;并行序列模式挖掘關鍵問題研究[D];合肥工業(yè)大學;2009年

3 王震;數據挖掘在企業(yè)營銷中的應用研究[D];重慶大學;2004年

,

本文編號:1990876

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1990876.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶7c6be***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com