天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

基于PrefixSpan的序列模式挖掘改進(jìn)算法研究

發(fā)布時(shí)間:2018-06-07 10:36

  本文選題:數(shù)據(jù)挖掘 + 序列模式; 參考:《四川師范大學(xué)》2017年碩士論文


【摘要】:序列模式挖掘是數(shù)據(jù)挖掘中一個(gè)重要研究領(lǐng)域,其序列模式挖掘算法研究具有重要研究意義。通過對經(jīng)典序列模式挖掘算法的研究,本文取得如下研究成果:(1)對經(jīng)典序列模式挖掘算法AprioriAll、GSP、SPADE和SPAM進(jìn)行比較與分析。(2)對基于模式增長的序列模式挖掘算法Prefix Span進(jìn)行研究,給出了該算法在序列模式挖掘過程中存在重復(fù)投影數(shù)據(jù)庫的理論分析、算法在執(zhí)行過程中的投影劃分次數(shù)的上確界和下確界、最壞情形下產(chǎn)生重復(fù)投影數(shù)據(jù)庫數(shù)的一般式。(3)在基于前綴投影思想并參考SPAM算法的數(shù)據(jù)結(jié)構(gòu)基礎(chǔ)上,采用二維表來存儲頻繁項(xiàng)在序列數(shù)據(jù)庫中的位置信息;統(tǒng)計(jì)二維表中每列非空位置信息集的個(gè)數(shù)快速計(jì)算序列支持度,并確定其頻繁性;通過對序列前綴位置的進(jìn)行檢查避免序列模式挖掘過程中對相同投影子表的重復(fù)挖掘。
[Abstract]:Sequential pattern mining is an important research field in data mining. Based on the research of classical sequential pattern mining algorithms, this paper has obtained the following research results: 1) compare and analyze the classical sequential pattern mining algorithms Apriori AllGSPSPADE and SPAM. (2) study the sequential pattern mining algorithm (Prefix Span) based on pattern growth. The theoretical analysis of the repeated projection database in the process of sequential pattern mining is given, and the upper and lower bounds of the number of projection partition in the execution of the algorithm are given. In the worst case, the general formula of generating the number of repeated projection databases. Based on the idea of prefix projection and referring to the data structure of SPAM algorithm, the two-dimensional table is used to store the location information of frequent items in the sequence database. The number of non-empty position information sets of each column in the two-dimensional table is calculated quickly and the frequency of the sequence is determined. By checking the position of the sequence prefix, the repeated mining of the same projection sub-table is avoided in the process of mining the sequence pattern.
【學(xué)位授予單位】:四川師范大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2017
【分類號】:TP311.13

【參考文獻(xiàn)】

相關(guān)期刊論文 前10條

1 楊斐;張萬楨;陸垂偉;;一種無候選項(xiàng)的閉合序列模式挖掘算法[J];計(jì)算機(jī)應(yīng)用與軟件;2016年03期

2 姬浩博;王俊紅;;一種改進(jìn)的PrefixSpan算法及其在Web用戶行為模式挖掘中的應(yīng)用[J];計(jì)算機(jī)科學(xué);2016年01期

3 李敬泉;滿秀芳;;零售商B2C模式下雙渠道定價(jià)策略選擇研究[J];商業(yè)研究;2015年06期

4 公偉;劉培玉;賈嫻;;基于改進(jìn)PrefixSpan的序列模式挖掘算法[J];計(jì)算機(jī)應(yīng)用;2011年09期

5 王虎;丁世飛;;序列模式挖掘研究與發(fā)展[J];計(jì)算機(jī)科學(xué);2009年12期

6 汪林林;范軍;;基于PrefixSpan的序列模式挖掘改進(jìn)算法[J];計(jì)算機(jī)工程;2009年23期

7 肖仁財(cái);薛安榮;;一種挖掘多維序列模式的有效方法[J];計(jì)算機(jī)工程與應(yīng)用;2008年06期

8 夏維力;王鑫;王青松;;數(shù)據(jù)挖掘技術(shù)在企業(yè)客戶關(guān)系管理中的應(yīng)用研究[J];科技管理研究;2007年06期

9 張坤;朱揚(yáng)勇;;無重復(fù)投影數(shù)據(jù)庫掃描的序列模式挖掘算法[J];計(jì)算機(jī)研究與發(fā)展;2007年01期

10 劉立軍;崔杰;梅紅巖;;GSP與PrefixSpan算法的比較與分析[J];遼寧工學(xué)院學(xué)報(bào);2006年05期

相關(guān)碩士學(xué)位論文 前3條

1 馮佳佳;基于序列模式挖掘的關(guān)鍵詞抽取問題研究[D];合肥工業(yè)大學(xué);2012年

2 姜海輝;并行序列模式挖掘關(guān)鍵問題研究[D];合肥工業(yè)大學(xué);2009年

3 王震;數(shù)據(jù)挖掘在企業(yè)營銷中的應(yīng)用研究[D];重慶大學(xué);2004年

,

本文編號:1990876

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1990876.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶7c6be***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com