Top-K閉高效用模式挖掘方法研究與應(yīng)用
發(fā)布時(shí)間:2021-08-07 10:58
隨著計(jì)算機(jī)和互聯(lián)網(wǎng)技術(shù)的迅猛發(fā)展,產(chǎn)生了大量的數(shù)據(jù),這些數(shù)據(jù)存在許多有趣的信息,使用數(shù)據(jù)挖掘技術(shù)可以有效的挖掘并分析這些信息,可以完成推薦、預(yù)測(cè)、分類等任務(wù)。在數(shù)據(jù)挖掘領(lǐng)域中,高效用模式挖掘起著重要的作用,高效用模式是指效用值大于用戶指定的最小效用值的所有模式。高效用模式中存儲(chǔ)著大量有效的信息,但是仍存在大量冗余模式。研究學(xué)者提出的閉高效用模式可以有效減少冗余模式,如果一個(gè)模式不存在與自身的支持度相同的超集,且效用值大于最小效用值,那么該模式就是一個(gè)閉高效用模式。在實(shí)際應(yīng)用中,高效用模式的挖掘需要多次進(jìn)行最小效用值嘗試,這會(huì)產(chǎn)生大量的調(diào)試時(shí)間,使用Top-K高效用模式可以有效解決該問(wèn)題,該模式是指用戶指定的k個(gè)效用值最大的模式。閉高效用模式盡管解決了冗余模式問(wèn)題,但仍會(huì)存在最小效用值調(diào)試?yán)щy的問(wèn)題,而Top-K高效用模式中仍存在大量冗余模式,針對(duì)這兩個(gè)問(wèn)題,首先對(duì)緊湊高效用模式進(jìn)行研究與分析;然后提出Top-K閉高效用模式挖掘算法TKCU-Miner,并基于TKCU-Miner算法提出Top-K閉高效用關(guān)聯(lián)規(guī)則挖掘算法;最后設(shè)計(jì)實(shí)并現(xiàn)基于Top-K閉高效用模式挖掘方法的驗(yàn)證平臺(tái)。主要研...
【文章來(lái)源】:北方民族大學(xué)寧夏回族自治區(qū)
【文章頁(yè)數(shù)】:72 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
高效用模式類型的關(guān)系
圖 3-2 Construct ()函數(shù)流程圖模式是否為閉模式。在閉模式判別時(shí),進(jìn)行“驗(yàn)證前綴項(xiàng) - 添加后的判別,如果前序的每個(gè)項(xiàng) ip存在的事務(wù) Tidset(ip)都包含當(dāng)前模idset(i),如果該事務(wù)中存在的項(xiàng),那么由定義 11 可知,Y 被其前集 PrevSet(Y),繼續(xù)進(jìn)行 Y 的下一個(gè)樞紐 I2項(xiàng)的 k+1 項(xiàng)集判斷。反包含 Y 的所存在有事務(wù),說(shuō)明其不被前序項(xiàng)所閉包,可以繼續(xù)進(jìn)(Y)的擴(kuò)展。意后序項(xiàng)集任意項(xiàng) iq所存在的事務(wù)包含 iq.tid,那么項(xiàng) iq是 Y 的閉 Y∪iq,并構(gòu)建其 uList。反之,將其擴(kuò)展到 Y 的后序項(xiàng)集 PostSe使用。新 Top-K 緩存區(qū)。在 Y 擴(kuò)展完畢之后,使用 uList(Y),得到 Y.sumEU
圖 3-3 Top-K save() 函數(shù)流程圖需要判斷是否達(dá)到條件的模式。當(dāng) PrevSet(X)為空的所有 Y后一項(xiàng))后,PrevSet(X) = PrevSet(X)∪ X,X 取其后序模式行以上操作,輸入為 X,PrevSet(X),PostSet(X),new_top_務(wù)數(shù)據(jù)庫(kù)完全遍歷,獲得的 Top-K 緩存區(qū)的所有模式,就。使用 2.1 節(jié)表 2-2 的事務(wù)數(shù)據(jù)庫(kù)舉出以下幾個(gè)例子:首先按排序建立好 d、b、c、e、a 五個(gè)項(xiàng)的 uList,在最初輸序模式 PostSet(X)為 d、b、c、e、a;前序模式 PrevSet(X)為old 為 0。樞紐項(xiàng)為 d,PostSet(X)為 bcea,PrevSet(X)為空,最小。在 uList(d)中,d.sumEU + d.sumRU = 58 + 170 = 228,大于
【參考文獻(xiàn)】:
期刊論文
[1]面向購(gòu)物籃數(shù)據(jù)的稀有序列模式挖掘算法[J]. 周忠玉,皮德常. 小型微型計(jì)算機(jī)系統(tǒng). 2019(03)
[2]面向衛(wèi)星遙測(cè)數(shù)據(jù)流的最小稀有模式挖掘方法[J]. 周忠玉,皮德常. 計(jì)算機(jī)學(xué)報(bào). 2019(06)
[3]數(shù)據(jù)流頻繁模式挖掘綜述[J]. 韓萌,丁劍. 計(jì)算機(jī)應(yīng)用. 2019(03)
[4]基于Top-k的高效用模式挖掘算法[J]. 趙林柳,呂鑫,陶飛飛. 計(jì)算機(jī)工程. 2019(05)
[5]一種頻率約束的高效用模式挖掘算法[J]. 張全貴,曹陽(yáng),李志強(qiáng). 計(jì)算機(jī)應(yīng)用與軟件. 2018(11)
[6]基于特征效用參與率的空間高效用co-location模式挖掘方法[J]. 王曉璇,王麗珍,陳紅梅,方圓,楊培忠. 計(jì)算機(jī)學(xué)報(bào). 2019(08)
[7]近端云計(jì)算:后云計(jì)算時(shí)代的機(jī)遇與挑戰(zhàn)[J]. 周悅芝,張迪. 計(jì)算機(jī)學(xué)報(bào). 2019(04)
[8]一種利用關(guān)聯(lián)規(guī)則挖掘的多標(biāo)記分類算法[J]. 劉軍煜,賈修一. 軟件學(xué)報(bào). 2017(11)
[9]減少候選項(xiàng)集的數(shù)據(jù)流高效用項(xiàng)集挖掘算法[J]. 茹蓓,賀新征. 計(jì)算機(jī)應(yīng)用研究. 2017(11)
[10]一種快速挖掘top-k高效用模式的算法[J]. 吳倩,王林平,羅相洲,崔建群,王海. 計(jì)算機(jī)應(yīng)用研究. 2017(11)
碩士論文
[1]基于高效用模式挖掘的微博文本突發(fā)話題檢測(cè)方法研究[D]. 歐陽(yáng)雙.武漢大學(xué) 2018
[2]基于效用矩陣和索引的top-k高效用項(xiàng)目集挖掘研究[D]. 王蕊.東北大學(xué) 2013
本文編號(hào):3327675
【文章來(lái)源】:北方民族大學(xué)寧夏回族自治區(qū)
【文章頁(yè)數(shù)】:72 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
高效用模式類型的關(guān)系
圖 3-2 Construct ()函數(shù)流程圖模式是否為閉模式。在閉模式判別時(shí),進(jìn)行“驗(yàn)證前綴項(xiàng) - 添加后的判別,如果前序的每個(gè)項(xiàng) ip存在的事務(wù) Tidset(ip)都包含當(dāng)前模idset(i),如果該事務(wù)中存在的項(xiàng),那么由定義 11 可知,Y 被其前集 PrevSet(Y),繼續(xù)進(jìn)行 Y 的下一個(gè)樞紐 I2項(xiàng)的 k+1 項(xiàng)集判斷。反包含 Y 的所存在有事務(wù),說(shuō)明其不被前序項(xiàng)所閉包,可以繼續(xù)進(jìn)(Y)的擴(kuò)展。意后序項(xiàng)集任意項(xiàng) iq所存在的事務(wù)包含 iq.tid,那么項(xiàng) iq是 Y 的閉 Y∪iq,并構(gòu)建其 uList。反之,將其擴(kuò)展到 Y 的后序項(xiàng)集 PostSe使用。新 Top-K 緩存區(qū)。在 Y 擴(kuò)展完畢之后,使用 uList(Y),得到 Y.sumEU
圖 3-3 Top-K save() 函數(shù)流程圖需要判斷是否達(dá)到條件的模式。當(dāng) PrevSet(X)為空的所有 Y后一項(xiàng))后,PrevSet(X) = PrevSet(X)∪ X,X 取其后序模式行以上操作,輸入為 X,PrevSet(X),PostSet(X),new_top_務(wù)數(shù)據(jù)庫(kù)完全遍歷,獲得的 Top-K 緩存區(qū)的所有模式,就。使用 2.1 節(jié)表 2-2 的事務(wù)數(shù)據(jù)庫(kù)舉出以下幾個(gè)例子:首先按排序建立好 d、b、c、e、a 五個(gè)項(xiàng)的 uList,在最初輸序模式 PostSet(X)為 d、b、c、e、a;前序模式 PrevSet(X)為old 為 0。樞紐項(xiàng)為 d,PostSet(X)為 bcea,PrevSet(X)為空,最小。在 uList(d)中,d.sumEU + d.sumRU = 58 + 170 = 228,大于
【參考文獻(xiàn)】:
期刊論文
[1]面向購(gòu)物籃數(shù)據(jù)的稀有序列模式挖掘算法[J]. 周忠玉,皮德常. 小型微型計(jì)算機(jī)系統(tǒng). 2019(03)
[2]面向衛(wèi)星遙測(cè)數(shù)據(jù)流的最小稀有模式挖掘方法[J]. 周忠玉,皮德常. 計(jì)算機(jī)學(xué)報(bào). 2019(06)
[3]數(shù)據(jù)流頻繁模式挖掘綜述[J]. 韓萌,丁劍. 計(jì)算機(jī)應(yīng)用. 2019(03)
[4]基于Top-k的高效用模式挖掘算法[J]. 趙林柳,呂鑫,陶飛飛. 計(jì)算機(jī)工程. 2019(05)
[5]一種頻率約束的高效用模式挖掘算法[J]. 張全貴,曹陽(yáng),李志強(qiáng). 計(jì)算機(jī)應(yīng)用與軟件. 2018(11)
[6]基于特征效用參與率的空間高效用co-location模式挖掘方法[J]. 王曉璇,王麗珍,陳紅梅,方圓,楊培忠. 計(jì)算機(jī)學(xué)報(bào). 2019(08)
[7]近端云計(jì)算:后云計(jì)算時(shí)代的機(jī)遇與挑戰(zhàn)[J]. 周悅芝,張迪. 計(jì)算機(jī)學(xué)報(bào). 2019(04)
[8]一種利用關(guān)聯(lián)規(guī)則挖掘的多標(biāo)記分類算法[J]. 劉軍煜,賈修一. 軟件學(xué)報(bào). 2017(11)
[9]減少候選項(xiàng)集的數(shù)據(jù)流高效用項(xiàng)集挖掘算法[J]. 茹蓓,賀新征. 計(jì)算機(jī)應(yīng)用研究. 2017(11)
[10]一種快速挖掘top-k高效用模式的算法[J]. 吳倩,王林平,羅相洲,崔建群,王海. 計(jì)算機(jī)應(yīng)用研究. 2017(11)
碩士論文
[1]基于高效用模式挖掘的微博文本突發(fā)話題檢測(cè)方法研究[D]. 歐陽(yáng)雙.武漢大學(xué) 2018
[2]基于效用矩陣和索引的top-k高效用項(xiàng)目集挖掘研究[D]. 王蕊.東北大學(xué) 2013
本文編號(hào):3327675
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3327675.html
最近更新
教材專著