含正負(fù)項(xiàng)目的FP-Growth算法及其在日志分析中的應(yīng)用研究
發(fā)布時(shí)間:2021-05-10 15:38
關(guān)聯(lián)規(guī)則挖掘是數(shù)據(jù)挖掘中重要研究的方法之一,其目的是從大型數(shù)據(jù)庫(kù)中發(fā)現(xiàn)有用的信息。人們利用數(shù)據(jù)挖掘技術(shù)從數(shù)據(jù)中獲得了很多有用的信息,這些信息推動(dòng)著人類科技的發(fā)展。但是,海量的數(shù)據(jù)是人們進(jìn)行數(shù)據(jù)挖掘所面臨的一大難題,如果沒有高效率的挖掘算法,人們?cè)谶M(jìn)行數(shù)據(jù)挖掘時(shí)所耗費(fèi)的時(shí)間將是巨大的。而且目前所研究的大多數(shù)數(shù)據(jù)挖掘都只是挖掘事務(wù)之間的正向關(guān)系,而往往忽略了事務(wù)間負(fù)關(guān)聯(lián)關(guān)系的存在。但是在現(xiàn)實(shí)生活中的很多領(lǐng)域,單單對(duì)正關(guān)聯(lián)規(guī)則進(jìn)行挖掘是遠(yuǎn)遠(yuǎn)不夠的,還需要考慮到所挖掘數(shù)據(jù)之間的負(fù)關(guān)聯(lián)關(guān)系,從而提高關(guān)聯(lián)規(guī)則的描述力。本文針對(duì)以上問(wèn)題,對(duì)以下三點(diǎn)展開了研究:(1)研究了包含事務(wù)數(shù)據(jù)庫(kù)中正項(xiàng)目和負(fù)項(xiàng)目的FP-Growth算法考慮到在引入負(fù)項(xiàng)目之后,就會(huì)使原有的數(shù)據(jù)量倍增,從而導(dǎo)致項(xiàng)集的數(shù)目過(guò)大,所構(gòu)造的FP-tree的分支的長(zhǎng)度也就會(huì)過(guò)長(zhǎng),FP-tree的空間占有率也會(huì)過(guò)大,挖掘效率也會(huì)隨之降低。為解決這一問(wèn)題,本文對(duì)FP-tree的構(gòu)造方法進(jìn)行了改進(jìn),即利用動(dòng)態(tài)插入節(jié)點(diǎn)的方法構(gòu)造FP-tree,而且將所有的指針倒轉(zhuǎn),從而生成一個(gè)新型的FP-tree,從而減低FP-tree的生成成本。本文還提出了一...
【文章來(lái)源】:山東師范大學(xué)山東省
【文章頁(yè)數(shù)】:42 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景及意義
1.2 國(guó)內(nèi)外的研究現(xiàn)狀
1.2.1 FP-Growth算法的相關(guān)研究
1.2.2 關(guān)聯(lián)規(guī)則挖掘方法的相關(guān)研究
1.3 本文的主要研究工作
1.4 本文的組織結(jié)構(gòu)
1.5 本章小結(jié)
第二章 關(guān)聯(lián)規(guī)則的相關(guān)理論
2.1 關(guān)聯(lián)規(guī)則的概述
2.1.1 關(guān)聯(lián)規(guī)則基本概念
2.1.2 關(guān)聯(lián)規(guī)則度量
2.1.3 關(guān)聯(lián)規(guī)則的挖掘步驟
2.1.4 關(guān)聯(lián)規(guī)則挖掘的研究方向
2.2 關(guān)聯(lián)規(guī)則的挖掘算法
2.3 本章小結(jié)
第三章 包含正負(fù)項(xiàng)目的FP-Growth算法
3.1 FP-Growth算法
3.1.1 FP-Growth算法的基本概念
3.1.2 FP-Growth算法的算法描述
3.2 含正負(fù)項(xiàng)目關(guān)聯(lián)規(guī)則的描述
3.3 改進(jìn)的FP-Growth算法
3.3.1 問(wèn)題的提出
3.3.2 算法的改進(jìn)思路
3.3.3 算法的描述
3.3.4 舉例說(shuō)明
3.4 實(shí)驗(yàn)及結(jié)果分析
3.5 本章小結(jié)
第四章 基于多重最小支持度的FP-Growth算法改進(jìn)
4.1 問(wèn)題的提出
4.2 多重最小支持度的引入
4.3 基于多重最小支持度的挖掘算法
4.4 算法實(shí)驗(yàn)與比較
4.5 本章小結(jié)
第五章 改進(jìn)的FP-Growth算法在日志分析中的應(yīng)用
5.1 系統(tǒng)設(shè)計(jì)
5.2 系統(tǒng)實(shí)現(xiàn)
5.2.1 客戶端
5.2.2 服務(wù)器端
5.3 本章小結(jié)
第六章 總結(jié)與展望
6.1 工作總結(jié)
6.2 工作展望
參考文獻(xiàn)
攻讀碩士學(xué)位期間的主要成果
致謝
【參考文獻(xiàn)】:
期刊論文
[1]第41次《中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》發(fā)布[J]. 中國(guó)廣播. 2018(03)
[2]基于改進(jìn)的FP-tree最大頻繁模式挖掘算法[J]. 寧慧,王素紅,崔立剛,郭笑語(yǔ),徐麗. 應(yīng)用科技. 2016(02)
[3]改進(jìn)的基于頻繁模式樹的最大頻繁項(xiàng)集挖掘算法——FP-MFIA[J]. 楊鵬坤,彭慧,周曉鋒,孫玉慶. 計(jì)算機(jī)應(yīng)用. 2015(03)
[4]基于改進(jìn)FP-Tree的最大頻繁項(xiàng)集高效挖掘算法[J]. 紀(jì)懷猛. 計(jì)算機(jī)與數(shù)字工程. 2014(06)
[5]基于FPMAX的最大頻繁項(xiàng)目集挖掘改進(jìn)算法[J]. 牛新征,佘堃. 計(jì)算機(jī)科學(xué). 2013(12)
[6]一種挖掘負(fù)關(guān)聯(lián)規(guī)則的有效方法[J]. 張雅芬,王新. 云南民族大學(xué)學(xué)報(bào)(自然科學(xué)版). 2011(04)
[7]一種基于用戶行為的興趣度模型[J]. 王微微,夏秀峰,李曉明. 計(jì)算機(jī)工程與應(yīng)用. 2012(08)
[8]基于改進(jìn)的FP-tree的頻繁模式挖掘算法[J]. 李也白,唐輝,張淳,賀玉明. 計(jì)算機(jī)應(yīng)用. 2011(01)
[9]關(guān)聯(lián)規(guī)則中改進(jìn)FP-tree的最大頻繁模式挖掘算法[J]. 錢雪忠,惠亮. 計(jì)算機(jī)工程與設(shè)計(jì). 2010(21)
[10]多最小支持度關(guān)聯(lián)規(guī)則挖掘研究[J]. 常浩,陳莉. 微計(jì)算機(jī)信息. 2010(24)
博士論文
[1]關(guān)聯(lián)規(guī)則優(yōu)化方法的研究[D]. 賀志.北京交通大學(xué) 2007
碩士論文
[1]基于AFOPT-tree的最大頻繁項(xiàng)集挖掘[D]. 王浩.安徽大學(xué) 2014
[2]基于正負(fù)項(xiàng)目及多支持度的關(guān)聯(lián)規(guī)則挖掘算法研究[D]. 李彥釗.西南交通大學(xué) 2010
[3]關(guān)聯(lián)規(guī)則算法及度量方法研究[D]. 周秀芬.南京理工大學(xué) 2008
[4]多最小支持度下的關(guān)聯(lián)規(guī)則研究[D]. 王瑄.長(zhǎng)春理工大學(xué) 2008
[5]關(guān)聯(lián)規(guī)則挖掘算法的分析、優(yōu)化及應(yīng)用[D]. 劉芝怡.蘇州大學(xué) 2007
[6]數(shù)據(jù)挖掘中關(guān)聯(lián)規(guī)則算法的研究[D]. 錢冬云.天津大學(xué) 2006
[7]基于FP-樹的關(guān)聯(lián)規(guī)則挖掘算法的設(shè)計(jì)與實(shí)現(xiàn)[D]. 劉乃麗.山東大學(xué) 2005
[8]基于FP-樹的最大頻繁模式挖掘算法研究[D]. 馮志新.廣西大學(xué) 2003
本文編號(hào):3179617
【文章來(lái)源】:山東師范大學(xué)山東省
【文章頁(yè)數(shù)】:42 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景及意義
1.2 國(guó)內(nèi)外的研究現(xiàn)狀
1.2.1 FP-Growth算法的相關(guān)研究
1.2.2 關(guān)聯(lián)規(guī)則挖掘方法的相關(guān)研究
1.3 本文的主要研究工作
1.4 本文的組織結(jié)構(gòu)
1.5 本章小結(jié)
第二章 關(guān)聯(lián)規(guī)則的相關(guān)理論
2.1 關(guān)聯(lián)規(guī)則的概述
2.1.1 關(guān)聯(lián)規(guī)則基本概念
2.1.2 關(guān)聯(lián)規(guī)則度量
2.1.3 關(guān)聯(lián)規(guī)則的挖掘步驟
2.1.4 關(guān)聯(lián)規(guī)則挖掘的研究方向
2.2 關(guān)聯(lián)規(guī)則的挖掘算法
2.3 本章小結(jié)
第三章 包含正負(fù)項(xiàng)目的FP-Growth算法
3.1 FP-Growth算法
3.1.1 FP-Growth算法的基本概念
3.1.2 FP-Growth算法的算法描述
3.2 含正負(fù)項(xiàng)目關(guān)聯(lián)規(guī)則的描述
3.3 改進(jìn)的FP-Growth算法
3.3.1 問(wèn)題的提出
3.3.2 算法的改進(jìn)思路
3.3.3 算法的描述
3.3.4 舉例說(shuō)明
3.4 實(shí)驗(yàn)及結(jié)果分析
3.5 本章小結(jié)
第四章 基于多重最小支持度的FP-Growth算法改進(jìn)
4.1 問(wèn)題的提出
4.2 多重最小支持度的引入
4.3 基于多重最小支持度的挖掘算法
4.4 算法實(shí)驗(yàn)與比較
4.5 本章小結(jié)
第五章 改進(jìn)的FP-Growth算法在日志分析中的應(yīng)用
5.1 系統(tǒng)設(shè)計(jì)
5.2 系統(tǒng)實(shí)現(xiàn)
5.2.1 客戶端
5.2.2 服務(wù)器端
5.3 本章小結(jié)
第六章 總結(jié)與展望
6.1 工作總結(jié)
6.2 工作展望
參考文獻(xiàn)
攻讀碩士學(xué)位期間的主要成果
致謝
【參考文獻(xiàn)】:
期刊論文
[1]第41次《中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》發(fā)布[J]. 中國(guó)廣播. 2018(03)
[2]基于改進(jìn)的FP-tree最大頻繁模式挖掘算法[J]. 寧慧,王素紅,崔立剛,郭笑語(yǔ),徐麗. 應(yīng)用科技. 2016(02)
[3]改進(jìn)的基于頻繁模式樹的最大頻繁項(xiàng)集挖掘算法——FP-MFIA[J]. 楊鵬坤,彭慧,周曉鋒,孫玉慶. 計(jì)算機(jī)應(yīng)用. 2015(03)
[4]基于改進(jìn)FP-Tree的最大頻繁項(xiàng)集高效挖掘算法[J]. 紀(jì)懷猛. 計(jì)算機(jī)與數(shù)字工程. 2014(06)
[5]基于FPMAX的最大頻繁項(xiàng)目集挖掘改進(jìn)算法[J]. 牛新征,佘堃. 計(jì)算機(jī)科學(xué). 2013(12)
[6]一種挖掘負(fù)關(guān)聯(lián)規(guī)則的有效方法[J]. 張雅芬,王新. 云南民族大學(xué)學(xué)報(bào)(自然科學(xué)版). 2011(04)
[7]一種基于用戶行為的興趣度模型[J]. 王微微,夏秀峰,李曉明. 計(jì)算機(jī)工程與應(yīng)用. 2012(08)
[8]基于改進(jìn)的FP-tree的頻繁模式挖掘算法[J]. 李也白,唐輝,張淳,賀玉明. 計(jì)算機(jī)應(yīng)用. 2011(01)
[9]關(guān)聯(lián)規(guī)則中改進(jìn)FP-tree的最大頻繁模式挖掘算法[J]. 錢雪忠,惠亮. 計(jì)算機(jī)工程與設(shè)計(jì). 2010(21)
[10]多最小支持度關(guān)聯(lián)規(guī)則挖掘研究[J]. 常浩,陳莉. 微計(jì)算機(jī)信息. 2010(24)
博士論文
[1]關(guān)聯(lián)規(guī)則優(yōu)化方法的研究[D]. 賀志.北京交通大學(xué) 2007
碩士論文
[1]基于AFOPT-tree的最大頻繁項(xiàng)集挖掘[D]. 王浩.安徽大學(xué) 2014
[2]基于正負(fù)項(xiàng)目及多支持度的關(guān)聯(lián)規(guī)則挖掘算法研究[D]. 李彥釗.西南交通大學(xué) 2010
[3]關(guān)聯(lián)規(guī)則算法及度量方法研究[D]. 周秀芬.南京理工大學(xué) 2008
[4]多最小支持度下的關(guān)聯(lián)規(guī)則研究[D]. 王瑄.長(zhǎng)春理工大學(xué) 2008
[5]關(guān)聯(lián)規(guī)則挖掘算法的分析、優(yōu)化及應(yīng)用[D]. 劉芝怡.蘇州大學(xué) 2007
[6]數(shù)據(jù)挖掘中關(guān)聯(lián)規(guī)則算法的研究[D]. 錢冬云.天津大學(xué) 2006
[7]基于FP-樹的關(guān)聯(lián)規(guī)則挖掘算法的設(shè)計(jì)與實(shí)現(xiàn)[D]. 劉乃麗.山東大學(xué) 2005
[8]基于FP-樹的最大頻繁模式挖掘算法研究[D]. 馮志新.廣西大學(xué) 2003
本文編號(hào):3179617
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3179617.html
最近更新
教材專著