大數(shù)據(jù)背景下的關(guān)聯(lián)規(guī)則挖掘算法研究
發(fā)布時間:2021-03-28 23:52
隨著社會進(jìn)入信息時代,大量的信息和數(shù)據(jù)成為了這個時代的特征。挖掘數(shù)據(jù)中隱藏的信息變得尤為重要,其中關(guān)聯(lián)規(guī)則挖掘有助于確定數(shù)據(jù)庫中對象之間的關(guān)系,并在許多決策系統(tǒng)中扮演著重要角色。然而,當(dāng)下人們對于大數(shù)據(jù)的認(rèn)識還是不夠,對關(guān)聯(lián)規(guī)則挖掘更是缺乏了解,不管是國內(nèi)還是國外,對這方面的研究有著廣泛的研究前景。本文主要是研究關(guān)聯(lián)規(guī)則挖掘算法,主要工作如下:第一,對現(xiàn)有的關(guān)聯(lián)規(guī)則挖掘算法以及相關(guān)改進(jìn)研究進(jìn)行了總結(jié)和分類,分析了現(xiàn)有的關(guān)聯(lián)規(guī)則挖掘存在的問題,并對未來的研究工作進(jìn)行了展望。第二,提出了一種基于矩陣壓縮的加權(quán)關(guān)聯(lián)規(guī)則挖掘算法,通過掃描一次數(shù)據(jù)庫,將其轉(zhuǎn)換為0-1矩陣,避免了多次掃描數(shù)據(jù)庫的問題,然后,根據(jù)相關(guān)性質(zhì)對矩陣進(jìn)行壓縮,降低算法執(zhí)行過程中的計算量;同時,考慮到項(xiàng)目具有不同的重要性,采取了加權(quán)的方法;且本算法在挖掘過程中能直接查找高階頻繁項(xiàng)集。實(shí)驗(yàn)結(jié)果表明,本算法能有效提高關(guān)聯(lián)規(guī)則的挖掘效率。第三,提出了一種基于啟發(fā)式搜索的并行化關(guān)聯(lián)規(guī)則挖掘算法,采用位圖排序來提高最大頻繁事務(wù)的搜索效率;引入貪婪機(jī)制,確保算法各個階段的優(yōu)越性;運(yùn)用啟發(fā)式搜索,保證挖掘最大頻繁項(xiàng)集的效率和可靠性;在S...
【文章來源】:長沙理工大學(xué)湖南省
【文章頁數(shù)】:60 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2.1模式分類??
*稀有模式??*高維和巨型模式??圖2.1模式分類??2.?3關(guān)聯(lián)規(guī)則挖掘中的分類??2.3.1關(guān)聯(lián)規(guī)則的分類??我們將數(shù)據(jù)中隱藏的某種規(guī)則或者聯(lián)系統(tǒng)稱為關(guān)聯(lián)規(guī)則,關(guān)聯(lián)規(guī)則的分類方式有很??多[71],不同的分類依據(jù)就有不同的方式:??(1)從處理數(shù)據(jù)的類型上分為布爾型關(guān)聯(lián)規(guī)則和數(shù)值型關(guān)聯(lián)規(guī)則??布爾型關(guān)聯(lián)規(guī)則是用于判斷某數(shù)據(jù)項(xiàng)是否存在,與數(shù)學(xué)中的邏輯運(yùn)算類似。一般用??于處理離散或者種類化的數(shù)據(jù)。例如,布爾型關(guān)聯(lián)規(guī)則:丨學(xué)!獙W(xué)生丨,表明了學(xué)生存??在于學(xué)校中;數(shù)值型關(guān)聯(lián)規(guī)則通常以數(shù)字字段形式出現(xiàn),一般由數(shù)值區(qū)間表示,說明一??種量化關(guān)聯(lián)關(guān)系。例如,{睡眠時間“6-9小吋”、學(xué)習(xí)時間“10-12小時”―學(xué)生丨,這??個規(guī)則是數(shù)值型關(guān)聯(lián)規(guī)則(或量化規(guī)則)。此外
*稀有模式??*高維和巨型模式??圖2.1模式分類??2.?3關(guān)聯(lián)規(guī)則挖掘中的分類??2.3.1關(guān)聯(lián)規(guī)則的分類??我們將數(shù)據(jù)中隱藏的某種規(guī)則或者聯(lián)系統(tǒng)稱為關(guān)聯(lián)規(guī)則,關(guān)聯(lián)規(guī)則的分類方式有很??多[71],不同的分類依據(jù)就有不同的方式:??(1)從處理數(shù)據(jù)的類型上分為布爾型關(guān)聯(lián)規(guī)則和數(shù)值型關(guān)聯(lián)規(guī)則??布爾型關(guān)聯(lián)規(guī)則是用于判斷某數(shù)據(jù)項(xiàng)是否存在,與數(shù)學(xué)中的邏輯運(yùn)算類似。一般用??于處理離散或者種類化的數(shù)據(jù)。例如,布爾型關(guān)聯(lián)規(guī)則:丨學(xué)!獙W(xué)生丨,表明了學(xué)生存??在于學(xué)校中;數(shù)值型關(guān)聯(lián)規(guī)則通常以數(shù)字字段形式出現(xiàn),一般由數(shù)值區(qū)間表示,說明一??種量化關(guān)聯(lián)關(guān)系。例如,{睡眠時間“6-9小吋”、學(xué)習(xí)時間“10-12小時”―學(xué)生丨,這??個規(guī)則是數(shù)值型關(guān)聯(lián)規(guī)則(或量化規(guī)則)。此外
【參考文獻(xiàn)】:
期刊論文
[1]一種基于倒排索引樹的增量更新關(guān)聯(lián)挖掘算法[J]. 徐春,李廣原,王玄,田換. 計算機(jī)工程與科學(xué). 2016(05)
[2]基于預(yù)判篩選的高效關(guān)聯(lián)規(guī)則挖掘算法[J]. 趙學(xué)健,孫知信,袁源. 電子與信息學(xué)報. 2016(07)
[3]一種利用差集的加權(quán)頻繁項(xiàng)集挖掘算法[J]. 翟悅,郭楊,王玉姣. 遼寧工程技術(shù)大學(xué)學(xué)報(自然科學(xué)版). 2016(03)
[4]基于MapReduce的并行關(guān)聯(lián)規(guī)則增量更新算法[J]. 程廣,王曉峰. 計算機(jī)工程. 2016(02)
[5]基于矩陣加權(quán)的VMOApriori算法[J]. 陳波,段成永,高秀娥. 測控技術(shù). 2016(01)
[6]基于項(xiàng)權(quán)值變化和SCCI框架的加權(quán)正負(fù)關(guān)聯(lián)規(guī)則挖掘[J]. 黃名選,黃發(fā)良,嚴(yán)小衛(wèi),蘭慧紅. 控制與決策. 2015(10)
[7]擴(kuò)展WIT-樹融合Diffset策略的頻繁加權(quán)項(xiàng)集快速挖掘算法[J]. 張亞梅,張皓,海本齋,廖曉飛. 計算機(jī)應(yīng)用研究. 2015(12)
[8]基于項(xiàng)權(quán)值變化的矩陣加權(quán)關(guān)聯(lián)規(guī)則挖掘[J]. 周秀梅,黃名選. 計算機(jī)應(yīng)用研究. 2015(10)
[9]一種基于向量的概率加權(quán)關(guān)聯(lián)規(guī)則挖掘算法[J]. 趙志剛,萬軍,王芳. 計算機(jī)工程與科學(xué). 2014(02)
[10]關(guān)聯(lián)規(guī)則挖掘Apriori算法的研究與改進(jìn)[J]. 付沙,周航軍. 微電子學(xué)與計算機(jī). 2013(09)
碩士論文
[1]關(guān)聯(lián)規(guī)則中的Apriori算法的研究與改進(jìn)[D]. 王偉.中國海洋大學(xué) 2012
本文編號:3106481
【文章來源】:長沙理工大學(xué)湖南省
【文章頁數(shù)】:60 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2.1模式分類??
*稀有模式??*高維和巨型模式??圖2.1模式分類??2.?3關(guān)聯(lián)規(guī)則挖掘中的分類??2.3.1關(guān)聯(lián)規(guī)則的分類??我們將數(shù)據(jù)中隱藏的某種規(guī)則或者聯(lián)系統(tǒng)稱為關(guān)聯(lián)規(guī)則,關(guān)聯(lián)規(guī)則的分類方式有很??多[71],不同的分類依據(jù)就有不同的方式:??(1)從處理數(shù)據(jù)的類型上分為布爾型關(guān)聯(lián)規(guī)則和數(shù)值型關(guān)聯(lián)規(guī)則??布爾型關(guān)聯(lián)規(guī)則是用于判斷某數(shù)據(jù)項(xiàng)是否存在,與數(shù)學(xué)中的邏輯運(yùn)算類似。一般用??于處理離散或者種類化的數(shù)據(jù)。例如,布爾型關(guān)聯(lián)規(guī)則:丨學(xué)!獙W(xué)生丨,表明了學(xué)生存??在于學(xué)校中;數(shù)值型關(guān)聯(lián)規(guī)則通常以數(shù)字字段形式出現(xiàn),一般由數(shù)值區(qū)間表示,說明一??種量化關(guān)聯(lián)關(guān)系。例如,{睡眠時間“6-9小吋”、學(xué)習(xí)時間“10-12小時”―學(xué)生丨,這??個規(guī)則是數(shù)值型關(guān)聯(lián)規(guī)則(或量化規(guī)則)。此外
*稀有模式??*高維和巨型模式??圖2.1模式分類??2.?3關(guān)聯(lián)規(guī)則挖掘中的分類??2.3.1關(guān)聯(lián)規(guī)則的分類??我們將數(shù)據(jù)中隱藏的某種規(guī)則或者聯(lián)系統(tǒng)稱為關(guān)聯(lián)規(guī)則,關(guān)聯(lián)規(guī)則的分類方式有很??多[71],不同的分類依據(jù)就有不同的方式:??(1)從處理數(shù)據(jù)的類型上分為布爾型關(guān)聯(lián)規(guī)則和數(shù)值型關(guān)聯(lián)規(guī)則??布爾型關(guān)聯(lián)規(guī)則是用于判斷某數(shù)據(jù)項(xiàng)是否存在,與數(shù)學(xué)中的邏輯運(yùn)算類似。一般用??于處理離散或者種類化的數(shù)據(jù)。例如,布爾型關(guān)聯(lián)規(guī)則:丨學(xué)!獙W(xué)生丨,表明了學(xué)生存??在于學(xué)校中;數(shù)值型關(guān)聯(lián)規(guī)則通常以數(shù)字字段形式出現(xiàn),一般由數(shù)值區(qū)間表示,說明一??種量化關(guān)聯(lián)關(guān)系。例如,{睡眠時間“6-9小吋”、學(xué)習(xí)時間“10-12小時”―學(xué)生丨,這??個規(guī)則是數(shù)值型關(guān)聯(lián)規(guī)則(或量化規(guī)則)。此外
【參考文獻(xiàn)】:
期刊論文
[1]一種基于倒排索引樹的增量更新關(guān)聯(lián)挖掘算法[J]. 徐春,李廣原,王玄,田換. 計算機(jī)工程與科學(xué). 2016(05)
[2]基于預(yù)判篩選的高效關(guān)聯(lián)規(guī)則挖掘算法[J]. 趙學(xué)健,孫知信,袁源. 電子與信息學(xué)報. 2016(07)
[3]一種利用差集的加權(quán)頻繁項(xiàng)集挖掘算法[J]. 翟悅,郭楊,王玉姣. 遼寧工程技術(shù)大學(xué)學(xué)報(自然科學(xué)版). 2016(03)
[4]基于MapReduce的并行關(guān)聯(lián)規(guī)則增量更新算法[J]. 程廣,王曉峰. 計算機(jī)工程. 2016(02)
[5]基于矩陣加權(quán)的VMOApriori算法[J]. 陳波,段成永,高秀娥. 測控技術(shù). 2016(01)
[6]基于項(xiàng)權(quán)值變化和SCCI框架的加權(quán)正負(fù)關(guān)聯(lián)規(guī)則挖掘[J]. 黃名選,黃發(fā)良,嚴(yán)小衛(wèi),蘭慧紅. 控制與決策. 2015(10)
[7]擴(kuò)展WIT-樹融合Diffset策略的頻繁加權(quán)項(xiàng)集快速挖掘算法[J]. 張亞梅,張皓,海本齋,廖曉飛. 計算機(jī)應(yīng)用研究. 2015(12)
[8]基于項(xiàng)權(quán)值變化的矩陣加權(quán)關(guān)聯(lián)規(guī)則挖掘[J]. 周秀梅,黃名選. 計算機(jī)應(yīng)用研究. 2015(10)
[9]一種基于向量的概率加權(quán)關(guān)聯(lián)規(guī)則挖掘算法[J]. 趙志剛,萬軍,王芳. 計算機(jī)工程與科學(xué). 2014(02)
[10]關(guān)聯(lián)規(guī)則挖掘Apriori算法的研究與改進(jìn)[J]. 付沙,周航軍. 微電子學(xué)與計算機(jī). 2013(09)
碩士論文
[1]關(guān)聯(lián)規(guī)則中的Apriori算法的研究與改進(jìn)[D]. 王偉.中國海洋大學(xué) 2012
本文編號:3106481
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3106481.html
最近更新
教材專著