基于命題邏輯的頻繁序列模式挖掘算法的研究
發(fā)布時(shí)間:2021-10-13 17:50
頻繁序列模式挖掘是數(shù)據(jù)挖掘中非常重要的一個(gè)研究領(lǐng)域,序列數(shù)據(jù)在我們?nèi)粘I町?dāng)中是很常見(jiàn)的,并且存在著顯著的商業(yè)價(jià)值。頻繁序列模式的挖掘主要是基于大項(xiàng)集的挖掘,這類算法目前存在兩個(gè)主要問(wèn)題,第一,支持度閾值設(shè)定問(wèn)題。傳統(tǒng)類Apriori算法必須預(yù)先設(shè)定一個(gè)最小支持度閾值作為判斷是否為頻繁模式的標(biāo)準(zhǔn)。然而,一般情況下用戶對(duì)支持度閾值并沒(méi)有準(zhǔn)確的認(rèn)識(shí),主要通過(guò)多次試探或豐富的經(jīng)驗(yàn)來(lái)設(shè)定,缺少統(tǒng)一的評(píng)判標(biāo)準(zhǔn)。第二,挖掘的規(guī)則集數(shù)量龐大,挖掘結(jié)果對(duì)于用戶來(lái)說(shuō)難以理解。具體的講,如果序列模式P是頻繁的,則P的全部子序列模式也都是頻繁的,這導(dǎo)致了序列模式結(jié)果集的規(guī)模呈指數(shù)級(jí)增長(zhǎng)的問(wèn)題,大大增加了用戶理解序列模式結(jié)果集的難度。本文在分析頻繁序列模式挖掘算法的基礎(chǔ)上,針對(duì)該類算法存在的問(wèn)題,將命題邏輯的思想首次引入到這類算法當(dāng)中,主要貢獻(xiàn)如下:1、提出了一種基于命題邏輯的頻繁序列模式挖掘算法,通過(guò)在挖掘過(guò)程中加入邏輯過(guò)濾規(guī)則,去除掉大量不符合邏輯的、無(wú)用的規(guī)則集,使序列的結(jié)果集大大優(yōu)化,從而降低了算法的時(shí)間消耗,而且,提高了結(jié)果的質(zhì)量。同時(shí),有效的解決了支持度閾值設(shè)置問(wèn)題,降低了算法對(duì)它的依賴性。2、在...
【文章來(lái)源】:浙江工業(yè)大學(xué)浙江省
【文章頁(yè)數(shù)】:65 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 研究背景
1.1.1 數(shù)據(jù)挖掘的研究?jī)?nèi)容
1.1.2 數(shù)據(jù)挖掘的功能及意義
1.2 序列模式挖掘研究的現(xiàn)狀
1.2.1 國(guó)內(nèi)研究
1.2.2 國(guó)外研究
1.3 本文主要研究?jī)?nèi)容及組織結(jié)構(gòu)
第二章 序列模式挖掘的相關(guān)理論和技術(shù)
2.1 序列模式的提出
2.2 序列模式相關(guān)概念及定義
2.2.1 序列模式挖掘相關(guān)定義
2.2.2 序列模式與關(guān)聯(lián)規(guī)則的關(guān)系
2.2.3 序列模式挖掘的步驟
2.3 經(jīng)典序列模式挖掘算法
2.3.1 AprioriAll算法
2.3.2 GSP算法
2.3.3 Prefixspan算法
2.3.4 SPADE算法
2.4 模式壓縮及其算法
2.4.1 模式壓縮概述
2.4.2 閉合模式
2.4.3 最大模式
2.5 本章小結(jié)
第三章 基于命題邏輯的頻繁序列挖掘
3.1 頻繁序列模式
3.1.1 頻繁模式
3.1.2 頻繁序列模式挖掘
3.1.3 存在的問(wèn)題
3.2 命題邏輯與頻繁模式的映射
3.2.1 相關(guān)定義
3.2.2 等價(jià)映射
3.2.3 子序列上下界過(guò)濾
3.3 LFSPM算法設(shè)計(jì)
3.3.1 算法描述
3.3.2 一個(gè)例子
3.4 本章小結(jié)
第四章 實(shí)驗(yàn)及結(jié)果分析
4.1 實(shí)驗(yàn)環(huán)境與實(shí)驗(yàn)數(shù)據(jù)
4.2 實(shí)驗(yàn)分析
4.2.1 模擬數(shù)據(jù)實(shí)驗(yàn)結(jié)果分析
4.2.2 真實(shí)數(shù)據(jù)實(shí)驗(yàn)結(jié)果分析
4.3 本章小結(jié)
第五章 總結(jié)與展望
5.1 本文創(chuàng)新點(diǎn)
5.2 今后工作展望
參考文獻(xiàn)
致謝
攻讀學(xué)位期間參加的科研項(xiàng)目和成果
【參考文獻(xiàn)】:
期刊論文
[1]基于改進(jìn)PrefixSpan的序列模式挖掘算法[J]. 公偉,劉培玉,賈嫻. 計(jì)算機(jī)應(yīng)用. 2011(09)
[2]基于聚類分區(qū)的序列模式挖掘算法研究[J]. 吳楠,胡學(xué)鋼. 計(jì)算機(jī)技術(shù)與發(fā)展. 2010(06)
[3]一種新的頻繁項(xiàng)集精簡(jiǎn)表示方法及其挖掘算法的研究[J]. 宋威,李晉宏,徐章艷,楊炳儒. 計(jì)算機(jī)研究與發(fā)展. 2010(02)
[4]一種挖掘壓縮序列模式的有效算法[J]. 童詠昕,張媛媛,袁玫,馬世龍,余丹,趙莉. 計(jì)算機(jī)研究與發(fā)展. 2010(01)
[5]基于偏序壓縮技術(shù)的頻繁序列模式數(shù)據(jù)挖掘[J]. 程舒通,徐從富,但紅衛(wèi). 計(jì)算機(jī)工程與應(yīng)用. 2008(03)
[6]無(wú)重復(fù)投影數(shù)據(jù)庫(kù)掃描的序列模式挖掘算法[J]. 張坤,朱揚(yáng)勇. 計(jì)算機(jī)研究與發(fā)展. 2007(01)
[7]使用序列模式精簡(jiǎn)基挖掘序列模式[J]. 王濤,盧炎生. 小型微型計(jì)算機(jī)系統(tǒng). 2005(10)
[8]挖掘閉合模式的高性能算法[J]. 劉君強(qiáng),孫曉瑩,莊越挺,潘云鶴. 軟件學(xué)報(bào). 2004(01)
[9]序列模式挖掘的一種漸進(jìn)算法[J]. 周斌,吳泉源. 計(jì)算機(jī)學(xué)報(bào). 1999(08)
本文編號(hào):3435130
【文章來(lái)源】:浙江工業(yè)大學(xué)浙江省
【文章頁(yè)數(shù)】:65 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 研究背景
1.1.1 數(shù)據(jù)挖掘的研究?jī)?nèi)容
1.1.2 數(shù)據(jù)挖掘的功能及意義
1.2 序列模式挖掘研究的現(xiàn)狀
1.2.1 國(guó)內(nèi)研究
1.2.2 國(guó)外研究
1.3 本文主要研究?jī)?nèi)容及組織結(jié)構(gòu)
第二章 序列模式挖掘的相關(guān)理論和技術(shù)
2.1 序列模式的提出
2.2 序列模式相關(guān)概念及定義
2.2.1 序列模式挖掘相關(guān)定義
2.2.2 序列模式與關(guān)聯(lián)規(guī)則的關(guān)系
2.2.3 序列模式挖掘的步驟
2.3 經(jīng)典序列模式挖掘算法
2.3.1 AprioriAll算法
2.3.2 GSP算法
2.3.3 Prefixspan算法
2.3.4 SPADE算法
2.4 模式壓縮及其算法
2.4.1 模式壓縮概述
2.4.2 閉合模式
2.4.3 最大模式
2.5 本章小結(jié)
第三章 基于命題邏輯的頻繁序列挖掘
3.1 頻繁序列模式
3.1.1 頻繁模式
3.1.2 頻繁序列模式挖掘
3.1.3 存在的問(wèn)題
3.2 命題邏輯與頻繁模式的映射
3.2.1 相關(guān)定義
3.2.2 等價(jià)映射
3.2.3 子序列上下界過(guò)濾
3.3 LFSPM算法設(shè)計(jì)
3.3.1 算法描述
3.3.2 一個(gè)例子
3.4 本章小結(jié)
第四章 實(shí)驗(yàn)及結(jié)果分析
4.1 實(shí)驗(yàn)環(huán)境與實(shí)驗(yàn)數(shù)據(jù)
4.2 實(shí)驗(yàn)分析
4.2.1 模擬數(shù)據(jù)實(shí)驗(yàn)結(jié)果分析
4.2.2 真實(shí)數(shù)據(jù)實(shí)驗(yàn)結(jié)果分析
4.3 本章小結(jié)
第五章 總結(jié)與展望
5.1 本文創(chuàng)新點(diǎn)
5.2 今后工作展望
參考文獻(xiàn)
致謝
攻讀學(xué)位期間參加的科研項(xiàng)目和成果
【參考文獻(xiàn)】:
期刊論文
[1]基于改進(jìn)PrefixSpan的序列模式挖掘算法[J]. 公偉,劉培玉,賈嫻. 計(jì)算機(jī)應(yīng)用. 2011(09)
[2]基于聚類分區(qū)的序列模式挖掘算法研究[J]. 吳楠,胡學(xué)鋼. 計(jì)算機(jī)技術(shù)與發(fā)展. 2010(06)
[3]一種新的頻繁項(xiàng)集精簡(jiǎn)表示方法及其挖掘算法的研究[J]. 宋威,李晉宏,徐章艷,楊炳儒. 計(jì)算機(jī)研究與發(fā)展. 2010(02)
[4]一種挖掘壓縮序列模式的有效算法[J]. 童詠昕,張媛媛,袁玫,馬世龍,余丹,趙莉. 計(jì)算機(jī)研究與發(fā)展. 2010(01)
[5]基于偏序壓縮技術(shù)的頻繁序列模式數(shù)據(jù)挖掘[J]. 程舒通,徐從富,但紅衛(wèi). 計(jì)算機(jī)工程與應(yīng)用. 2008(03)
[6]無(wú)重復(fù)投影數(shù)據(jù)庫(kù)掃描的序列模式挖掘算法[J]. 張坤,朱揚(yáng)勇. 計(jì)算機(jī)研究與發(fā)展. 2007(01)
[7]使用序列模式精簡(jiǎn)基挖掘序列模式[J]. 王濤,盧炎生. 小型微型計(jì)算機(jī)系統(tǒng). 2005(10)
[8]挖掘閉合模式的高性能算法[J]. 劉君強(qiáng),孫曉瑩,莊越挺,潘云鶴. 軟件學(xué)報(bào). 2004(01)
[9]序列模式挖掘的一種漸進(jìn)算法[J]. 周斌,吳泉源. 計(jì)算機(jī)學(xué)報(bào). 1999(08)
本文編號(hào):3435130
本文鏈接:http://sikaile.net/shekelunwen/ljx/3435130.html
最近更新
教材專著