天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于負(fù)序列模式的序列規(guī)則挖掘算法研究

發(fā)布時(shí)間:2021-06-11 06:46
  負(fù)序列規(guī)則考慮了未發(fā)生事件對(duì)決策的影響,從新的角度分析了數(shù)據(jù)潛在的含義,彌補(bǔ)了正序列規(guī)則可能誤導(dǎo)決策的不足,有重要研究意義。然而,現(xiàn)有的負(fù)序列規(guī)則挖掘算法的研究非常匱乏,仍然存在很多問題需要解決,包括:(1)由于負(fù)序列模式并不滿足向下封閉性原理,使得頻繁負(fù)序列模式的某些子模式有可能不頻繁,從而無法計(jì)算相應(yīng)負(fù)序列規(guī)則的置信度,同時(shí)還會(huì)導(dǎo)致一些負(fù)序列規(guī)則的置信度可能大于1,給用戶設(shè)置置信度閾值帶來困難;(2)由于首次從負(fù)序列模式中挖掘負(fù)序列規(guī)則,生成哪種形式的負(fù)序列規(guī)則才算合理;(3)從負(fù)序列模式中挖掘負(fù)序列規(guī)則后會(huì)產(chǎn)生相互矛盾的規(guī)則,如何修剪掉這些矛盾規(guī)則以保證得到的規(guī)則能夠真正用于決策?本文對(duì)上述問題進(jìn)行了研究,提出了一個(gè)從負(fù)序列模式中挖掘負(fù)序列規(guī)則的算法nsp Rule和一個(gè)基于貢獻(xiàn)度和相關(guān)系數(shù)的規(guī)則修剪算法ASR(Actionable Sequential Rule)。具體如下:針對(duì)前兩個(gè)問題,本文提出了一個(gè)從負(fù)序列模式中挖掘負(fù)序列規(guī)則的有效算法—nsp Rule。該算法首先判斷規(guī)則的前件或后件是否是頻繁模式,通過刪除掉不頻繁的模式以解決規(guī)則置信度無法計(jì)算的問題。而對(duì)于部分規(guī)則的置... 

【文章來源】:齊魯工業(yè)大學(xué)山東省

【文章頁數(shù)】:79 頁

【學(xué)位級(jí)別】:碩士

【部分圖文】:

基于負(fù)序列模式的序列規(guī)則挖掘算法研究


min_sup在DS1數(shù)據(jù)集上的影響

數(shù)據(jù)集,影響圖


齊魯工業(yè)大學(xué)碩士學(xué)位論文29圖3.3min_sup在DS2數(shù)據(jù)集上的影響圖3.4min_sup在DS3數(shù)據(jù)集上的影響圖3.5支持度在DS4數(shù)據(jù)集上的影響3.4.2置信度對(duì)實(shí)驗(yàn)的影響分析在第二個(gè)實(shí)驗(yàn)中,我們使用不同的min_conf值和一個(gè)固定的min_sup值在DS1到DS4數(shù)據(jù)集上來評(píng)估m(xù)in_conf對(duì)產(chǎn)生的正負(fù)序列規(guī)則數(shù)量的影響。在DS1上,nspRule算法和SpamNeg算法以固定的min_sup=0.004和不同的min_conf=0.1,0.12,…,0.18下運(yùn)行。在DS2上,min_sup=0.007,min_conf=0.1,0.12,…,0.18。在DS3上,min_sup為固定值0.06,min_conf分別設(shè)定為0.1,0.2,…,0.5。在DS4上,這兩個(gè)算法以固定的min_sup=0.006和不同的min_conf=0.1,0.12,…,0.18運(yùn)行。我們之所以在DS3數(shù)據(jù)集上設(shè)置不同的min_conf,是因?yàn)镈S3中的數(shù)據(jù)比較集中,即對(duì)min_conf不敏感。如果我們將min_conf還是設(shè)置為0.12-0.18,修剪掉的規(guī)則的數(shù)量變化并不明顯。圖3.6(a)顯示,在min_conf不斷的增加的情況

數(shù)據(jù)集,影響圖


齊魯工業(yè)大學(xué)碩士學(xué)位論文29圖3.3min_sup在DS2數(shù)據(jù)集上的影響圖3.4min_sup在DS3數(shù)據(jù)集上的影響圖3.5支持度在DS4數(shù)據(jù)集上的影響3.4.2置信度對(duì)實(shí)驗(yàn)的影響分析在第二個(gè)實(shí)驗(yàn)中,我們使用不同的min_conf值和一個(gè)固定的min_sup值在DS1到DS4數(shù)據(jù)集上來評(píng)估m(xù)in_conf對(duì)產(chǎn)生的正負(fù)序列規(guī)則數(shù)量的影響。在DS1上,nspRule算法和SpamNeg算法以固定的min_sup=0.004和不同的min_conf=0.1,0.12,…,0.18下運(yùn)行。在DS2上,min_sup=0.007,min_conf=0.1,0.12,…,0.18。在DS3上,min_sup為固定值0.06,min_conf分別設(shè)定為0.1,0.2,…,0.5。在DS4上,這兩個(gè)算法以固定的min_sup=0.006和不同的min_conf=0.1,0.12,…,0.18運(yùn)行。我們之所以在DS3數(shù)據(jù)集上設(shè)置不同的min_conf,是因?yàn)镈S3中的數(shù)據(jù)比較集中,即對(duì)min_conf不敏感。如果我們將min_conf還是設(shè)置為0.12-0.18,修剪掉的規(guī)則的數(shù)量變化并不明顯。圖3.6(a)顯示,在min_conf不斷的增加的情況

【參考文獻(xiàn)】:
期刊論文
[1]基于校園一卡通數(shù)據(jù)的大學(xué)生用餐消費(fèi)相關(guān)性分析[J]. 王金鑫.  科學(xué)技術(shù)創(chuàng)新. 2018(15)
[2]基于校園卡消費(fèi)數(shù)據(jù)的大學(xué)生消費(fèi)行為的研究[J]. 湛思思,馮維華,杜宇,曾衛(wèi)林.  電子技術(shù)與軟件工程. 2018(03)
[3]基于決策樹數(shù)據(jù)挖掘算法的大學(xué)生消費(fèi)數(shù)據(jù)分析[J]. 黃劍.  電腦與信息技術(shù). 2015(05)
[4]基于校園一卡通數(shù)據(jù)的學(xué)生消費(fèi)及學(xué)習(xí)行為分析[J]. 姜楠,許維勝.  微型電腦應(yīng)用. 2015(02)



本文編號(hào):3224041

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3224041.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶7072b***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com