基于負序列模式的序列規(guī)則挖掘算法研究
發(fā)布時間:2021-06-11 06:46
負序列規(guī)則考慮了未發(fā)生事件對決策的影響,從新的角度分析了數(shù)據(jù)潛在的含義,彌補了正序列規(guī)則可能誤導(dǎo)決策的不足,有重要研究意義。然而,現(xiàn)有的負序列規(guī)則挖掘算法的研究非常匱乏,仍然存在很多問題需要解決,包括:(1)由于負序列模式并不滿足向下封閉性原理,使得頻繁負序列模式的某些子模式有可能不頻繁,從而無法計算相應(yīng)負序列規(guī)則的置信度,同時還會導(dǎo)致一些負序列規(guī)則的置信度可能大于1,給用戶設(shè)置置信度閾值帶來困難;(2)由于首次從負序列模式中挖掘負序列規(guī)則,生成哪種形式的負序列規(guī)則才算合理;(3)從負序列模式中挖掘負序列規(guī)則后會產(chǎn)生相互矛盾的規(guī)則,如何修剪掉這些矛盾規(guī)則以保證得到的規(guī)則能夠真正用于決策?本文對上述問題進行了研究,提出了一個從負序列模式中挖掘負序列規(guī)則的算法nsp Rule和一個基于貢獻度和相關(guān)系數(shù)的規(guī)則修剪算法ASR(Actionable Sequential Rule)。具體如下:針對前兩個問題,本文提出了一個從負序列模式中挖掘負序列規(guī)則的有效算法—nsp Rule。該算法首先判斷規(guī)則的前件或后件是否是頻繁模式,通過刪除掉不頻繁的模式以解決規(guī)則置信度無法計算的問題。而對于部分規(guī)則的置...
【文章來源】:齊魯工業(yè)大學(xué)山東省
【文章頁數(shù)】:79 頁
【學(xué)位級別】:碩士
【部分圖文】:
min_sup在DS1數(shù)據(jù)集上的影響
齊魯工業(yè)大學(xué)碩士學(xué)位論文29圖3.3min_sup在DS2數(shù)據(jù)集上的影響圖3.4min_sup在DS3數(shù)據(jù)集上的影響圖3.5支持度在DS4數(shù)據(jù)集上的影響3.4.2置信度對實驗的影響分析在第二個實驗中,我們使用不同的min_conf值和一個固定的min_sup值在DS1到DS4數(shù)據(jù)集上來評估m(xù)in_conf對產(chǎn)生的正負序列規(guī)則數(shù)量的影響。在DS1上,nspRule算法和SpamNeg算法以固定的min_sup=0.004和不同的min_conf=0.1,0.12,…,0.18下運行。在DS2上,min_sup=0.007,min_conf=0.1,0.12,…,0.18。在DS3上,min_sup為固定值0.06,min_conf分別設(shè)定為0.1,0.2,…,0.5。在DS4上,這兩個算法以固定的min_sup=0.006和不同的min_conf=0.1,0.12,…,0.18運行。我們之所以在DS3數(shù)據(jù)集上設(shè)置不同的min_conf,是因為DS3中的數(shù)據(jù)比較集中,即對min_conf不敏感。如果我們將min_conf還是設(shè)置為0.12-0.18,修剪掉的規(guī)則的數(shù)量變化并不明顯。圖3.6(a)顯示,在min_conf不斷的增加的情況
齊魯工業(yè)大學(xué)碩士學(xué)位論文29圖3.3min_sup在DS2數(shù)據(jù)集上的影響圖3.4min_sup在DS3數(shù)據(jù)集上的影響圖3.5支持度在DS4數(shù)據(jù)集上的影響3.4.2置信度對實驗的影響分析在第二個實驗中,我們使用不同的min_conf值和一個固定的min_sup值在DS1到DS4數(shù)據(jù)集上來評估m(xù)in_conf對產(chǎn)生的正負序列規(guī)則數(shù)量的影響。在DS1上,nspRule算法和SpamNeg算法以固定的min_sup=0.004和不同的min_conf=0.1,0.12,…,0.18下運行。在DS2上,min_sup=0.007,min_conf=0.1,0.12,…,0.18。在DS3上,min_sup為固定值0.06,min_conf分別設(shè)定為0.1,0.2,…,0.5。在DS4上,這兩個算法以固定的min_sup=0.006和不同的min_conf=0.1,0.12,…,0.18運行。我們之所以在DS3數(shù)據(jù)集上設(shè)置不同的min_conf,是因為DS3中的數(shù)據(jù)比較集中,即對min_conf不敏感。如果我們將min_conf還是設(shè)置為0.12-0.18,修剪掉的規(guī)則的數(shù)量變化并不明顯。圖3.6(a)顯示,在min_conf不斷的增加的情況
【參考文獻】:
期刊論文
[1]基于校園一卡通數(shù)據(jù)的大學(xué)生用餐消費相關(guān)性分析[J]. 王金鑫. 科學(xué)技術(shù)創(chuàng)新. 2018(15)
[2]基于校園卡消費數(shù)據(jù)的大學(xué)生消費行為的研究[J]. 湛思思,馮維華,杜宇,曾衛(wèi)林. 電子技術(shù)與軟件工程. 2018(03)
[3]基于決策樹數(shù)據(jù)挖掘算法的大學(xué)生消費數(shù)據(jù)分析[J]. 黃劍. 電腦與信息技術(shù). 2015(05)
[4]基于校園一卡通數(shù)據(jù)的學(xué)生消費及學(xué)習(xí)行為分析[J]. 姜楠,許維勝. 微型電腦應(yīng)用. 2015(02)
本文編號:3224041
【文章來源】:齊魯工業(yè)大學(xué)山東省
【文章頁數(shù)】:79 頁
【學(xué)位級別】:碩士
【部分圖文】:
min_sup在DS1數(shù)據(jù)集上的影響
齊魯工業(yè)大學(xué)碩士學(xué)位論文29圖3.3min_sup在DS2數(shù)據(jù)集上的影響圖3.4min_sup在DS3數(shù)據(jù)集上的影響圖3.5支持度在DS4數(shù)據(jù)集上的影響3.4.2置信度對實驗的影響分析在第二個實驗中,我們使用不同的min_conf值和一個固定的min_sup值在DS1到DS4數(shù)據(jù)集上來評估m(xù)in_conf對產(chǎn)生的正負序列規(guī)則數(shù)量的影響。在DS1上,nspRule算法和SpamNeg算法以固定的min_sup=0.004和不同的min_conf=0.1,0.12,…,0.18下運行。在DS2上,min_sup=0.007,min_conf=0.1,0.12,…,0.18。在DS3上,min_sup為固定值0.06,min_conf分別設(shè)定為0.1,0.2,…,0.5。在DS4上,這兩個算法以固定的min_sup=0.006和不同的min_conf=0.1,0.12,…,0.18運行。我們之所以在DS3數(shù)據(jù)集上設(shè)置不同的min_conf,是因為DS3中的數(shù)據(jù)比較集中,即對min_conf不敏感。如果我們將min_conf還是設(shè)置為0.12-0.18,修剪掉的規(guī)則的數(shù)量變化并不明顯。圖3.6(a)顯示,在min_conf不斷的增加的情況
齊魯工業(yè)大學(xué)碩士學(xué)位論文29圖3.3min_sup在DS2數(shù)據(jù)集上的影響圖3.4min_sup在DS3數(shù)據(jù)集上的影響圖3.5支持度在DS4數(shù)據(jù)集上的影響3.4.2置信度對實驗的影響分析在第二個實驗中,我們使用不同的min_conf值和一個固定的min_sup值在DS1到DS4數(shù)據(jù)集上來評估m(xù)in_conf對產(chǎn)生的正負序列規(guī)則數(shù)量的影響。在DS1上,nspRule算法和SpamNeg算法以固定的min_sup=0.004和不同的min_conf=0.1,0.12,…,0.18下運行。在DS2上,min_sup=0.007,min_conf=0.1,0.12,…,0.18。在DS3上,min_sup為固定值0.06,min_conf分別設(shè)定為0.1,0.2,…,0.5。在DS4上,這兩個算法以固定的min_sup=0.006和不同的min_conf=0.1,0.12,…,0.18運行。我們之所以在DS3數(shù)據(jù)集上設(shè)置不同的min_conf,是因為DS3中的數(shù)據(jù)比較集中,即對min_conf不敏感。如果我們將min_conf還是設(shè)置為0.12-0.18,修剪掉的規(guī)則的數(shù)量變化并不明顯。圖3.6(a)顯示,在min_conf不斷的增加的情況
【參考文獻】:
期刊論文
[1]基于校園一卡通數(shù)據(jù)的大學(xué)生用餐消費相關(guān)性分析[J]. 王金鑫. 科學(xué)技術(shù)創(chuàng)新. 2018(15)
[2]基于校園卡消費數(shù)據(jù)的大學(xué)生消費行為的研究[J]. 湛思思,馮維華,杜宇,曾衛(wèi)林. 電子技術(shù)與軟件工程. 2018(03)
[3]基于決策樹數(shù)據(jù)挖掘算法的大學(xué)生消費數(shù)據(jù)分析[J]. 黃劍. 電腦與信息技術(shù). 2015(05)
[4]基于校園一卡通數(shù)據(jù)的學(xué)生消費及學(xué)習(xí)行為分析[J]. 姜楠,許維勝. 微型電腦應(yīng)用. 2015(02)
本文編號:3224041
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3224041.html
最近更新
教材專著