基于分布式平臺(tái)的高效用數(shù)據(jù)挖掘算法研究
發(fā)布時(shí)間:2021-07-26 09:46
互聯(lián)網(wǎng)與大數(shù)據(jù)時(shí)代的到來,各行各業(yè)的數(shù)據(jù)都呈現(xiàn)爆炸式的增長,對(duì)現(xiàn)有的存儲(chǔ)方案以及數(shù)據(jù)挖掘帶來重大的挑戰(zhàn)。數(shù)據(jù)挖掘技術(shù)不僅能夠有效地處理已有的數(shù)據(jù),而且能夠從海量的數(shù)據(jù)中挖掘出有價(jià)值的信息,從而為實(shí)際的生產(chǎn)、運(yùn)營和發(fā)展提供正確的導(dǎo)向作用。頻繁項(xiàng)集挖掘(Frequent Itemset Mining,FIM)是數(shù)據(jù)挖掘的一個(gè)基礎(chǔ)方法,常被用來挖掘各個(gè)事物之間的聯(lián)系。FIM僅考慮事物出現(xiàn)的次數(shù),沒有考慮其本身的價(jià)值,因而有學(xué)者提出了高效用項(xiàng)集挖掘(High-Utility Itemset Mining,HUIM)的方法。HUIM綜合考慮事物本身的價(jià)值和頻率兩個(gè)因素,相比FIM擁有更實(shí)際的導(dǎo)向作用。HUIM的目的是在給定的數(shù)據(jù)集中挖掘出所有高于閾值的項(xiàng)集。針對(duì)現(xiàn)有的HUIM算法存在的執(zhí)行時(shí)間長、占用內(nèi)存高等問題,本文提出了基于改進(jìn)數(shù)據(jù)集的高效用數(shù)據(jù)挖掘算法(Efficienthigh-utility itemset mining based on a novel data structure,EIM-DS)。為了進(jìn)一步提升EIM-DS算法的執(zhí)行效率,提出了基于多線程的EIM-DS算法。針對(duì)數(shù)據(jù)...
【文章來源】:江南大學(xué)江蘇省 211工程院校 教育部直屬院校
【文章頁數(shù)】:67 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
數(shù)據(jù)分解過程圖
【參考文獻(xiàn)】:
期刊論文
[1]大數(shù)據(jù)環(huán)境下基于前綴樹的頻繁項(xiàng)集挖掘[J]. 黃彩娟,劉卓華,所輝,楊濱. 控制工程. 2019(11)
[2]基于差集的高效用項(xiàng)集挖掘方法[J]. 黃坤,吳玉佳,李晶. 電子學(xué)報(bào). 2018(08)
[3]一種垂直結(jié)構(gòu)的高效用項(xiàng)集挖掘算法[J]. 黃坤,吳玉佳. 大連理工大學(xué)學(xué)報(bào). 2017(05)
[4]一種基于MapReduce模型的高效頻繁項(xiàng)集挖掘算法[J]. 朱坤,黃瑞章,張娜娜. 計(jì)算機(jī)科學(xué). 2017(07)
[5]減少候選項(xiàng)集的數(shù)據(jù)流高效用項(xiàng)集挖掘算法[J]. 茹蓓,賀新征. 計(jì)算機(jī)應(yīng)用研究. 2017(11)
[6]基于效用表的快速高平均效用挖掘算法[J]. 王敬華,羅相洲,吳倩. 計(jì)算機(jī)應(yīng)用. 2016(11)
[7]基于MapReduce的top-k高效用模式挖掘算法[J]. 吳倩,王林平,羅相洲,崔建群,王海. 計(jì)算機(jī)應(yīng)用研究. 2017(10)
[8]基于聚類劃分的高效用模式并行挖掘算法[J]. 邢淑凝,劉方愛,趙曉暉. 計(jì)算機(jī)應(yīng)用. 2016(08)
[9]基于投影的高效用項(xiàng)集挖掘算法[J]. 王敬華,羅相洲,吳倩. 小型微型計(jì)算機(jī)系統(tǒng). 2016(06)
[10]基于模式增長方式的高效用模式挖掘算法[J]. 王樂,熊松泉,常艷芬,王水. 自動(dòng)化學(xué)報(bào). 2015(09)
本文編號(hào):3303326
【文章來源】:江南大學(xué)江蘇省 211工程院校 教育部直屬院校
【文章頁數(shù)】:67 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
數(shù)據(jù)分解過程圖
【參考文獻(xiàn)】:
期刊論文
[1]大數(shù)據(jù)環(huán)境下基于前綴樹的頻繁項(xiàng)集挖掘[J]. 黃彩娟,劉卓華,所輝,楊濱. 控制工程. 2019(11)
[2]基于差集的高效用項(xiàng)集挖掘方法[J]. 黃坤,吳玉佳,李晶. 電子學(xué)報(bào). 2018(08)
[3]一種垂直結(jié)構(gòu)的高效用項(xiàng)集挖掘算法[J]. 黃坤,吳玉佳. 大連理工大學(xué)學(xué)報(bào). 2017(05)
[4]一種基于MapReduce模型的高效頻繁項(xiàng)集挖掘算法[J]. 朱坤,黃瑞章,張娜娜. 計(jì)算機(jī)科學(xué). 2017(07)
[5]減少候選項(xiàng)集的數(shù)據(jù)流高效用項(xiàng)集挖掘算法[J]. 茹蓓,賀新征. 計(jì)算機(jī)應(yīng)用研究. 2017(11)
[6]基于效用表的快速高平均效用挖掘算法[J]. 王敬華,羅相洲,吳倩. 計(jì)算機(jī)應(yīng)用. 2016(11)
[7]基于MapReduce的top-k高效用模式挖掘算法[J]. 吳倩,王林平,羅相洲,崔建群,王海. 計(jì)算機(jī)應(yīng)用研究. 2017(10)
[8]基于聚類劃分的高效用模式并行挖掘算法[J]. 邢淑凝,劉方愛,趙曉暉. 計(jì)算機(jī)應(yīng)用. 2016(08)
[9]基于投影的高效用項(xiàng)集挖掘算法[J]. 王敬華,羅相洲,吳倩. 小型微型計(jì)算機(jī)系統(tǒng). 2016(06)
[10]基于模式增長方式的高效用模式挖掘算法[J]. 王樂,熊松泉,常艷芬,王水. 自動(dòng)化學(xué)報(bào). 2015(09)
本文編號(hào):3303326
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3303326.html
最近更新
教材專著