基于偏序的序列模式挖掘算法研究
本文選題:數(shù)據(jù)挖掘 + 序列模式; 參考:《四川師范大學(xué)》2017年碩士論文
【摘要】:序列模式挖掘是數(shù)據(jù)挖掘研究的一個重要領(lǐng)域,它在計算機入侵檢測、WEB點擊流分析、DNA序列分析和購物籃分析等領(lǐng)域有廣泛應(yīng)用。本文首先討論了序列模式挖掘的基本理論,分析了基于頻繁序列和頻繁閉序列思想的幾個經(jīng)典序列模式挖掘算法。然后,系統(tǒng)討論了偏序模式挖掘的基本理論,分析和研究了全局偏序和頻繁閉偏序挖掘的典型算法及其優(yōu)缺點;陂]序列模式概念和TS-FCPO算法思想,論文提出了挖掘頻繁等長閉偏序的EL-FCPO算法。它利用等長序列模式之間匹配時只有序列中的對應(yīng)的位置才可能匹配的特點,改進了TS-FCPO算法尋找匹配位置時的枚舉方式,以提高挖掘速度。等長閉偏序繼承了閉偏序的所有優(yōu)點,且可以表示出具有等長特點的閉序列之間的關(guān)系及其確定性趨勢。由于等長偏序充分考慮了序列長度相等的序列之間只有序列上對應(yīng)位置才有可能匹配的特點,使得算法在運用于等長偏序應(yīng)用場景時的實際復(fù)雜度能夠降低,時間效率有明顯提升。論文成果可以應(yīng)用于制定圖書在線組合促銷方案、旅游線路規(guī)劃和攻略等方面。
[Abstract]:Sequential pattern mining is an important research field in data mining. It is widely used in computer intrusion detection Web click-stream analysis DNA sequence analysis and shopping basket analysis.In this paper, the basic theory of sequential pattern mining is discussed, and several classical sequential pattern mining algorithms based on frequent sequence and frequent closed sequence are analyzed.Then, the basic theory of partial order pattern mining is discussed systematically, and the typical algorithms of global partial order mining and frequent closed partial order mining are analyzed and studied as well as their advantages and disadvantages.Based on the concept of closed sequence pattern and the idea of TS-FCPO algorithm, this paper proposes a EL-FCPO algorithm for mining frequent equal-length closed partial order.It makes use of the feature that only the corresponding position in the sequence can be matched when matching the pattern of the equal-length sequence, and improves the enumeration method of the TS-FCPO algorithm to find the matching position in order to improve the speed of mining.The equal-length closed partial order inherits all the advantages of the closed partial order and can express the relation and deterministic trend of the closed sequence with the characteristics of equal length.Due to the fact that the equal-length partial order fully considers that only the corresponding position on the sequence can be matched between the sequences of equal length, the actual complexity of the algorithm can be reduced when it is applied to the application scene of the equal-length partial sequence.Time efficiency has been significantly improved.The results of this paper can be applied to the development of online book combination promotion plan, travel route planning and strategy.
【學(xué)位授予單位】:四川師范大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2017
【分類號】:TP311.13
【參考文獻】
相關(guān)期刊論文 前10條
1 張亮;趙娜;;序列模式挖掘兩種典型算法的研究[J];信息技術(shù);2016年11期
2 李剛;焦譜;文福拴;宋雨;尚金成;何洋;;基于偏序約簡的智能電網(wǎng)大數(shù)據(jù)預(yù)處理方法[J];電力系統(tǒng)自動化;2016年07期
3 王曉雪;;基于Apriori的序列模式挖掘算法的研究[J];軟件;2014年09期
4 俞東進;鄭蘇杭;李萬清;吳為;;基于BIDE的多核并行閉合序列模式挖掘[J];計算機工程;2012年12期
5 逄玉俊;劉英;陳未如;;基于并發(fā)序列模式的偏序模式挖掘[J];沈陽化工大學(xué)學(xué)報;2011年04期
6 王金龍;徐從富;;啟發(fā)式全局偏序挖掘算法[J];模式識別與人工智能;2008年02期
7 程舒通;徐從富;但紅衛(wèi);;基于偏序壓縮技術(shù)的頻繁序列模式數(shù)據(jù)挖掘[J];計算機工程與應(yīng)用;2008年03期
8 曲開社;閻俊霞;翟巖慧;;GM偏序圖的構(gòu)建和基于GM偏序圖的規(guī)則提取[J];計算機工程與應(yīng)用;2007年36期
9 任家東;宗俊省;李志國;;一種實現(xiàn)偏序約束條件下的序列模式挖掘算法[J];計算機工程與科學(xué);2007年05期
10 張長海;胡孔法;陳凌;;序列模式挖掘算法綜述[J];揚州大學(xué)學(xué)報(自然科學(xué)版);2007年01期
相關(guān)博士學(xué)位論文 前2條
1 徐玉生;頻繁模式挖掘算法與剪枝策略研究[D];蘭州大學(xué);2008年
2 王金龍;全局和局部相結(jié)合的數(shù)據(jù)挖掘方法及應(yīng)用研究[D];浙江大學(xué);2007年
相關(guān)碩士學(xué)位論文 前10條
1 張元;一種基于AdaBoost的組合分類算法研究[D];四川師范大學(xué);2015年
2 熊凱;基于最小位置的頻繁序列和閉序列挖掘方法研究[D];東北大學(xué);2012年
3 楊天霞;基于序列模式的序列聚類挖掘算法研究[D];西北師范大學(xué);2010年
4 吳永俊;序列模式挖掘研究[D];安徽大學(xué);2010年
5 張佳;基于閉合序列模式挖掘的數(shù)據(jù)庫入侵檢測方法研究[D];燕山大學(xué);2010年
6 劉磊;基于序列模式挖掘的入侵檢測算法的研究[D];中國科學(xué)技術(shù)大學(xué);2009年
7 俞單慶;序列模式挖掘及其在入侵檢測中的應(yīng)用研究[D];南京師范大學(xué);2008年
8 但紅衛(wèi);基于偏序的頻繁序列模式壓縮算法研究[D];浙江大學(xué);2007年
9 李洋;閉合序列挖掘模型與算法的研究[D];合肥工業(yè)大學(xué);2007年
10 肖軼;從萬維網(wǎng)日志中挖掘訪問序列模式的算法研究[D];華中科技大學(xué);2004年
,本文編號:1767564
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1767564.html