數(shù)據(jù)挖掘中關(guān)聯(lián)規(guī)則算法的研究
發(fā)布時間:2021-12-10 15:06
關(guān)聯(lián)規(guī)則挖掘是數(shù)據(jù)挖掘中熱門的研究方向之一。隨著數(shù)據(jù)規(guī)模的爆炸式增長,傳統(tǒng)的關(guān)聯(lián)規(guī)則挖掘算法時間效率過低,如何提高算法的時間效率是關(guān)聯(lián)規(guī)則挖掘的主要研究內(nèi)容。本文從二元屬性和多值屬性兩個方面展開對關(guān)聯(lián)規(guī)則算法的研究。一方面,本文深入研究了基于二元屬性的布爾關(guān)聯(lián)規(guī)則算法Apriori算法,針對其候選項集規(guī)模龐大、計數(shù)過程較慢的缺點提出了一種基于Hash樹的并行計數(shù)改進算法,算法從三個方面改進,第一,對頻繁項集進行裁剪,降低連接產(chǎn)生的候選項集的規(guī)模;第二,使用Hash樹存儲候選1項集,加快支持度計數(shù)過程,從候選2項集開始,利用事務(wù)和項集已按字典序升序排列的特點,改進Apriori算法的計數(shù)過程;第三,充分利用多核CPU的優(yōu)勢,使用多線程技術(shù)改寫計數(shù)過程實現(xiàn)并行計數(shù)。通過實驗對Apriori算法和改進算法進行性能測試,結(jié)果表明,改進算法的時間性能大大提升。另一方面,本文深入研究Apriori算法處理多值屬性數(shù)據(jù)集的過程,指出其處理過程中產(chǎn)生的無效項目集過多的問題,針對該問題,提出一種減少無效項目集數(shù)目的優(yōu)化算法,該算法剔除了同一屬性不同屬性值連接產(chǎn)生的項集,從而降低了候選項集的規(guī)模。實驗結(jié)果...
【文章來源】:江蘇科技大學(xué)江蘇省
【文章頁數(shù)】:66 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 課題研究背景
1.2 課題研究現(xiàn)狀
1.2.1 數(shù)據(jù)挖掘研究現(xiàn)狀
1.2.2 關(guān)聯(lián)規(guī)則研究現(xiàn)狀
1.2.3 未來發(fā)展趨勢
1.3 本文主要工作
1.4 論文組織結(jié)構(gòu)
第2章 關(guān)聯(lián)規(guī)則相關(guān)理論
2.1 數(shù)據(jù)挖掘簡介
2.1.1 數(shù)據(jù)挖掘基本概念
2.1.2 數(shù)據(jù)挖掘過程
2.1.3 數(shù)據(jù)挖掘常用方法和技術(shù)
2.2 關(guān)聯(lián)規(guī)則理論基礎(chǔ)
2.2.1 關(guān)聯(lián)規(guī)則相關(guān)定義
2.2.2 關(guān)聯(lián)規(guī)則定理及性質(zhì)
2.3 關(guān)聯(lián)規(guī)則挖掘過程
2.4 本章小結(jié)
第3章 基于二元屬性的關(guān)聯(lián)規(guī)則挖掘算法
3.1 經(jīng)典關(guān)聯(lián)規(guī)則算法Apriori
3.1.1 算法描述
3.1.2 算法實例
3.1.3 算法評價
3.1.4 Apriori算法的幾種改進方法
3.2 基于Hash樹的并行計數(shù)改進算法
3.2.1 算法思想
3.2.2 算法描述
3.2.3 實例分析
3.2.4 算法性能評價
3.3 本章小結(jié)
第4章 基于多值屬性的關(guān)聯(lián)規(guī)則挖掘算法
4.1 多值屬性關(guān)聯(lián)規(guī)則概述
4.1.1 多值屬性關(guān)聯(lián)規(guī)則相關(guān)概念
4.1.2 多值屬性關(guān)聯(lián)規(guī)則挖掘步驟
4.2 多值屬性數(shù)據(jù)處理
4.2.1 多值屬性數(shù)據(jù)的特點分析
4.2.2 分類屬性的處理
4.2.3 數(shù)值屬性的處理
4.3 基于多值屬性的Apriori優(yōu)化算法
4.3.1 算法描述
4.3.2 實例分析
4.3.3 性能對比
4.4 本章小結(jié)
第5章 結(jié)論與展望
5.1 論文總結(jié)
5.2 工作展望
參考文獻
攻讀碩士學(xué)位期間發(fā)表的論文及參與的科研項目
致謝
中文詳細摘要
【參考文獻】:
期刊論文
[1]基于關(guān)聯(lián)規(guī)則挖掘Apriori算法的改進算法[J]. 周凱,顧洪博,李愛國. 陜西理工大學(xué)學(xué)報(自然科學(xué)版). 2018(05)
[2]一種基于多值屬性的改進Apriori算法[J]. 趙龍,楊小兵,吳強,高宇. 中國計量大學(xué)學(xué)報. 2017(01)
[3]一種基于矩陣和權(quán)重改進的Apriori算法[J]. 邊根慶,王月. 微電子學(xué)與計算機. 2017(01)
[4]一種基于Apriori算法的優(yōu)化挖掘算法[J]. 陳志飛,馮鈞. 計算機與現(xiàn)代化. 2016(09)
[5]關(guān)聯(lián)規(guī)則挖掘Apriori算法的一種改進[J]. 屈鑫乙,王迪,劉滏. 中國市場. 2016(36)
[6]多值屬性關(guān)聯(lián)規(guī)則挖掘的Q-Apriori算法[J]. 姜麗莉,孟凡榮,周勇. 計算機工程. 2011(09)
[7]蟻群算法在網(wǎng)頁內(nèi)容分類中的應(yīng)用研究[J]. 韓杰,王自強,李春峰,譚明交. 計算機系統(tǒng)應(yīng)用. 2009(04)
[8]一種基于事務(wù)壓縮的關(guān)聯(lián)規(guī)則優(yōu)化算法[J]. 張素蘭. 計算機工程與設(shè)計. 2006(18)
[9]一種基于關(guān)系矩陣的關(guān)聯(lián)規(guī)則快速挖掘算法[J]. 胡慧蓉,王周敬. 計算機應(yīng)用. 2005(07)
[10]基于向量和矩陣的挖掘關(guān)聯(lián)規(guī)則的高效算法[J]. 牛小飛,石冰. 計算機工程與應(yīng)用. 2004(12)
碩士論文
[1]數(shù)據(jù)挖掘關(guān)聯(lián)規(guī)則算法研究與應(yīng)用[D]. 滕子牧.遼寧科技大學(xué) 2015
[2]基于關(guān)聯(lián)規(guī)則的數(shù)據(jù)挖掘算法研究[D]. 孫迪.電子科技大學(xué) 2010
[3]數(shù)據(jù)挖掘技術(shù)中關(guān)聯(lián)規(guī)則算法的研究[D]. 孔芳.江南大學(xué) 2008
[4]基于關(guān)聯(lián)規(guī)則的數(shù)據(jù)挖掘算法研究[D]. 吳海玲.河海大學(xué) 2007
[5]數(shù)據(jù)挖掘中關(guān)聯(lián)規(guī)則算法的研究[D]. 錢冬云.天津大學(xué) 2006
本文編號:3532859
【文章來源】:江蘇科技大學(xué)江蘇省
【文章頁數(shù)】:66 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 課題研究背景
1.2 課題研究現(xiàn)狀
1.2.1 數(shù)據(jù)挖掘研究現(xiàn)狀
1.2.2 關(guān)聯(lián)規(guī)則研究現(xiàn)狀
1.2.3 未來發(fā)展趨勢
1.3 本文主要工作
1.4 論文組織結(jié)構(gòu)
第2章 關(guān)聯(lián)規(guī)則相關(guān)理論
2.1 數(shù)據(jù)挖掘簡介
2.1.1 數(shù)據(jù)挖掘基本概念
2.1.2 數(shù)據(jù)挖掘過程
2.1.3 數(shù)據(jù)挖掘常用方法和技術(shù)
2.2 關(guān)聯(lián)規(guī)則理論基礎(chǔ)
2.2.1 關(guān)聯(lián)規(guī)則相關(guān)定義
2.2.2 關(guān)聯(lián)規(guī)則定理及性質(zhì)
2.3 關(guān)聯(lián)規(guī)則挖掘過程
2.4 本章小結(jié)
第3章 基于二元屬性的關(guān)聯(lián)規(guī)則挖掘算法
3.1 經(jīng)典關(guān)聯(lián)規(guī)則算法Apriori
3.1.1 算法描述
3.1.2 算法實例
3.1.3 算法評價
3.1.4 Apriori算法的幾種改進方法
3.2 基于Hash樹的并行計數(shù)改進算法
3.2.1 算法思想
3.2.2 算法描述
3.2.3 實例分析
3.2.4 算法性能評價
3.3 本章小結(jié)
第4章 基于多值屬性的關(guān)聯(lián)規(guī)則挖掘算法
4.1 多值屬性關(guān)聯(lián)規(guī)則概述
4.1.1 多值屬性關(guān)聯(lián)規(guī)則相關(guān)概念
4.1.2 多值屬性關(guān)聯(lián)規(guī)則挖掘步驟
4.2 多值屬性數(shù)據(jù)處理
4.2.1 多值屬性數(shù)據(jù)的特點分析
4.2.2 分類屬性的處理
4.2.3 數(shù)值屬性的處理
4.3 基于多值屬性的Apriori優(yōu)化算法
4.3.1 算法描述
4.3.2 實例分析
4.3.3 性能對比
4.4 本章小結(jié)
第5章 結(jié)論與展望
5.1 論文總結(jié)
5.2 工作展望
參考文獻
攻讀碩士學(xué)位期間發(fā)表的論文及參與的科研項目
致謝
中文詳細摘要
【參考文獻】:
期刊論文
[1]基于關(guān)聯(lián)規(guī)則挖掘Apriori算法的改進算法[J]. 周凱,顧洪博,李愛國. 陜西理工大學(xué)學(xué)報(自然科學(xué)版). 2018(05)
[2]一種基于多值屬性的改進Apriori算法[J]. 趙龍,楊小兵,吳強,高宇. 中國計量大學(xué)學(xué)報. 2017(01)
[3]一種基于矩陣和權(quán)重改進的Apriori算法[J]. 邊根慶,王月. 微電子學(xué)與計算機. 2017(01)
[4]一種基于Apriori算法的優(yōu)化挖掘算法[J]. 陳志飛,馮鈞. 計算機與現(xiàn)代化. 2016(09)
[5]關(guān)聯(lián)規(guī)則挖掘Apriori算法的一種改進[J]. 屈鑫乙,王迪,劉滏. 中國市場. 2016(36)
[6]多值屬性關(guān)聯(lián)規(guī)則挖掘的Q-Apriori算法[J]. 姜麗莉,孟凡榮,周勇. 計算機工程. 2011(09)
[7]蟻群算法在網(wǎng)頁內(nèi)容分類中的應(yīng)用研究[J]. 韓杰,王自強,李春峰,譚明交. 計算機系統(tǒng)應(yīng)用. 2009(04)
[8]一種基于事務(wù)壓縮的關(guān)聯(lián)規(guī)則優(yōu)化算法[J]. 張素蘭. 計算機工程與設(shè)計. 2006(18)
[9]一種基于關(guān)系矩陣的關(guān)聯(lián)規(guī)則快速挖掘算法[J]. 胡慧蓉,王周敬. 計算機應(yīng)用. 2005(07)
[10]基于向量和矩陣的挖掘關(guān)聯(lián)規(guī)則的高效算法[J]. 牛小飛,石冰. 計算機工程與應(yīng)用. 2004(12)
碩士論文
[1]數(shù)據(jù)挖掘關(guān)聯(lián)規(guī)則算法研究與應(yīng)用[D]. 滕子牧.遼寧科技大學(xué) 2015
[2]基于關(guān)聯(lián)規(guī)則的數(shù)據(jù)挖掘算法研究[D]. 孫迪.電子科技大學(xué) 2010
[3]數(shù)據(jù)挖掘技術(shù)中關(guān)聯(lián)規(guī)則算法的研究[D]. 孔芳.江南大學(xué) 2008
[4]基于關(guān)聯(lián)規(guī)則的數(shù)據(jù)挖掘算法研究[D]. 吳海玲.河海大學(xué) 2007
[5]數(shù)據(jù)挖掘中關(guān)聯(lián)規(guī)則算法的研究[D]. 錢冬云.天津大學(xué) 2006
本文編號:3532859
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3532859.html
最近更新
教材專著