基于遺傳算法和改進興趣度的關(guān)聯(lián)規(guī)則挖掘算法
本文關(guān)鍵詞:基于遺傳算法和改進興趣度的關(guān)聯(lián)規(guī)則挖掘算法
更多相關(guān)文章: 數(shù)據(jù)挖掘 關(guān)聯(lián)規(guī)則 遺傳算法 興趣度
【摘要】:互聯(lián)網(wǎng)社會改變了人們的行為方式和思考方式,在這個信息社會里人類積累海量的數(shù)據(jù),如何從這些海量數(shù)據(jù)中挖掘出“黃金”知識變得越來越重要。因此,數(shù)據(jù)挖掘這門學(xué)科越來越成為社會關(guān)注的焦點。關(guān)聯(lián)規(guī)則是數(shù)據(jù)挖掘的重要研究內(nèi)容,研究關(guān)聯(lián)規(guī)則挖掘是為了從大量的數(shù)據(jù)中找出項與項之間的相關(guān)關(guān)系。本文首先介紹了關(guān)聯(lián)規(guī)則的基本概念和有關(guān)性質(zhì),然后對關(guān)聯(lián)規(guī)則的經(jīng)典算法—apriori算法進行了詳細的介紹,接著對數(shù)據(jù)挖掘的重要方法之一的遺傳算法進行簡要的介紹,包括遺傳算法的基本術(shù)語和運行過程。在傳統(tǒng)支持度—置信度框架下挖掘關(guān)聯(lián)規(guī)則可能會挖掘出一些無用的甚至有誤導(dǎo)性的規(guī)則,而一些有用的關(guān)聯(lián)規(guī)則卻不一定能被挖掘出來,于是引入了興趣度來改進傳統(tǒng)框架。興趣度表征一個規(guī)則的有趣程度,通過它可將一些無用的有誤導(dǎo)性的規(guī)則給淘汰掉。本文首先提出了一種改進的興趣度模型,然后從理論上和實驗兩個方面證明該興趣度模型要好于常見的興趣度模型。本文分析了遺傳算法在關(guān)聯(lián)規(guī)則挖掘中的天然優(yōu)勢,對遺傳算法挖掘關(guān)聯(lián)規(guī)則研究現(xiàn)狀和不足進行了總結(jié),并且闡述了將遺傳算法和興趣度結(jié)合挖掘關(guān)聯(lián)規(guī)則的思想。最后將遺傳算法和本文提出的改進興趣度模型進行結(jié)合,得到了一種新的關(guān)聯(lián)規(guī)則挖掘算法,即基于遺傳算法和改進興趣度的關(guān)聯(lián)規(guī)則挖掘算法。通過和已經(jīng)存在的兩個關(guān)聯(lián)規(guī)則挖掘算法進行實驗對比表明了本文提出的算法能更多地淘汰無趣規(guī)則,因而本文提出的算法是高效的,具有一定的應(yīng)用價值,可將其應(yīng)用到科研和實踐中。
【關(guān)鍵詞】:數(shù)據(jù)挖掘 關(guān)聯(lián)規(guī)則 遺傳算法 興趣度
【學(xué)位授予單位】:廣西師范學(xué)院
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP311.13;TP18
【目錄】:
- 摘要4-5
- Abstract5-8
- 第一章 概述8-14
- 1.1 數(shù)據(jù)挖掘8-11
- 1.1.1 數(shù)據(jù)挖掘概念8
- 1.1.2 數(shù)據(jù)挖掘的過程8-10
- 1.1.3 數(shù)據(jù)挖掘的應(yīng)用10-11
- 1.2 數(shù)據(jù)挖掘與關(guān)聯(lián)規(guī)則11-12
- 1.3 數(shù)據(jù)挖掘與遺傳算法12-13
- 1.4 本文研究目標及內(nèi)容13
- 1.5 論文結(jié)構(gòu)13-14
- 第二章 關(guān)聯(lián)規(guī)則和遺傳算法相關(guān)介紹14-29
- 2.1 關(guān)聯(lián)規(guī)則的基本概念14
- 2.2 關(guān)聯(lián)規(guī)則的挖掘定理和性質(zhì)14-16
- 2.3 apriori算法16-22
- 2.4 遺傳算法引言22
- 2.5 遺傳算法的基本術(shù)語22-23
- 2.6 遺傳算法的運行過程及相應(yīng)說明23-29
- 2.6.1 編碼24-25
- 2.6.2 適應(yīng)度評價25
- 2.6.3 選擇操作[19]25-27
- 2.6.4 交叉操作27-29
- 2.6.5 變異操作29
- 2.7 本章總結(jié)29
- 第三章 一種改進的興趣度模型29-45
- 3.1 提升度的引入29-32
- 3.2 興趣度引言32
- 3.3 現(xiàn)有的興趣度模型32-34
- 3.3.1 概率興趣度模型33
- 3.3.2 差值的興趣度模型33-34
- 3.3.3 信息量興趣度34
- 3.4 新的興趣度模型34-36
- 3.5 本興趣度模型和其他其他興趣度模型的比較分析36-39
- 3.6 本章實驗算法描述39-41
- 3.7 實驗結(jié)果分析與比較41-45
- 3.8 本章小結(jié)45
- 第四章 一種基于遺傳算法和改進興趣度的關(guān)聯(lián)規(guī)則挖掘算法45-67
- 4.1 遺傳算法應(yīng)用于關(guān)聯(lián)規(guī)則挖掘的現(xiàn)狀和不足46
- 4.2 遺傳算法和興趣度結(jié)合挖掘關(guān)聯(lián)規(guī)則的思想46-47
- 4.3 本文算法的實現(xiàn)過程47-50
- 4.3.1 編碼47-48
- 4.3.2 適應(yīng)度函數(shù)48
- 4.3.3 遺傳算法操作過程48-49
- 4.3.4 本文算法設(shè)計49-50
- 4.4 兩個比較算法的簡單描述50-53
- 4.4.1 基于遺傳算法和提升度的關(guān)聯(lián)規(guī)則挖掘算法50-52
- 4.4.2 基于遺傳算法和差異興趣度的關(guān)聯(lián)規(guī)則挖掘算法52-53
- 4.5 實驗設(shè)計與分析53-57
- 4.5.1 遺傳算法的編碼53-56
- 4.5.2 參數(shù)設(shè)置56-57
- 4.6 實驗結(jié)果分析57-64
- 4.6.1 基于遺傳算法和提升度的關(guān)聯(lián)規(guī)則挖掘算法的實驗結(jié)果57-60
- 4.6.2 基于遺傳算法和差值興趣度的關(guān)聯(lián)規(guī)則挖掘算法的實驗結(jié)果60-62
- 4.6.3 基于遺傳算法和改進興趣度的關(guān)聯(lián)規(guī)則挖掘算法的實驗結(jié)果62-64
- 4.7 實驗結(jié)果分析和比較64-66
- 4.8 本章總結(jié)66-67
- 第五章 總結(jié)與展望67-69
- 參考文獻69-71
- 附錄A 本文作者在攻讀碩士學(xué)位期間所發(fā)表的論文71-72
- 致謝72-73
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 楊炳儒;綦艷霞;;感興趣度的研究綜述[J];計算機科學(xué);2001年10期
2 曹文平;;基于用戶知識的主觀興趣度度量方法研究[J];華南金融電腦;2007年07期
3 蘇云輝;張瑩;白清源;謝麗聰;謝伙生;;基于訪問興趣度的用戶事務(wù)聚類方法[J];廣西師范大學(xué)學(xué)報(自然科學(xué)版);2007年04期
4 斯康;;關(guān)聯(lián)規(guī)則興趣度研究[J];電腦知識與技術(shù);2008年24期
5 董輝;;基于興趣度的高職課程關(guān)聯(lián)規(guī)則挖掘[J];吉首大學(xué)學(xué)報(自然科學(xué)版);2012年03期
6 李佐軍;;關(guān)聯(lián)規(guī)則挖掘興趣度模型研究[J];電腦知識與技術(shù);2014年06期
7 馬建慶;鐘亦平;張世永;;基于興趣度的關(guān)聯(lián)規(guī)則挖掘算法[J];計算機工程;2006年17期
8 汪慎文;劉坤起;石艷麗;;基于興趣度的多值關(guān)聯(lián)規(guī)則挖掘[J];微計算機信息;2008年24期
9 鄧春林;鄒凱;;基于關(guān)聯(lián)規(guī)則的圖書館讀者興趣度實證分析[J];情報理論與實踐;2009年04期
10 陸楠;梁正平;杜文峰;;一種面向商業(yè)智能興趣度的顧客目錄分割算法[J];信息與電腦(理論版);2011年03期
中國重要會議論文全文數(shù)據(jù)庫 前3條
1 周皓峰;高攀;施伯樂;;一個基于興趣度包含負屬性項的關(guān)聯(lián)規(guī)則采掘算法[A];第十七屆全國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2000年
2 曲爽;谷文祥;;基于興趣度和負項集的關(guān)聯(lián)規(guī)則挖掘算法的研究[A];2005年全國理論計算機科學(xué)學(xué)術(shù)年會論文集[C];2005年
3 方煒煒;楊炳儒;唐志剛;楊君;;基于客觀興趣度的關(guān)聯(lián)規(guī)則優(yōu)化算法研究[A];2008'中國信息技術(shù)與應(yīng)用學(xué)術(shù)論壇論文集(一)[C];2008年
中國重要報紙全文數(shù)據(jù)庫 前6條
1 ;音樂,我不能沒有你[N];中國消費者報;2000年
2 李寶春;長虹開創(chuàng)Portable視聽新時代[N];中華工商時報;2003年
3 李寶春;長虹移動DVD完美上市[N];經(jīng)濟參考報;2003年
4 周童;Vista賺盡眼球[N];計算機世界;2007年
5 孫海東;國際科教大片為何無人喝彩[N];市場報;2000年
6 本報記者 蘭海燕;誰該先補“這一課”?[N];工人日報;2001年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 李媛;基于位置的社交網(wǎng)絡(luò)推薦算法的研究與應(yīng)用[D];中國科學(xué)院研究生院(沈陽計算技術(shù)研究所);2015年
2 楊強;基于Web-log頻繁瀏覽路徑挖掘技術(shù)分析與實現(xiàn)[D];電子科技大學(xué);2014年
3 姜盛彬;數(shù)據(jù)挖掘中基于興趣度的關(guān)聯(lián)規(guī)則研究[D];湖南師范大學(xué);2015年
4 姚貝;基于Hadoop的用戶瀏覽路徑挖掘技術(shù)研究[D];湖南工業(yè)大學(xué);2015年
5 高秋云;基于用戶興趣度和地理位置的活動推薦[D];南京郵電大學(xué);2016年
6 包勇;基于遺傳算法和改進興趣度的關(guān)聯(lián)規(guī)則挖掘算法[D];廣西師范學(xué)院;2016年
7 沈建華;基于用戶興趣度的社區(qū)內(nèi)容推薦方法研究[D];東北大學(xué);2013年
8 吳杰;基于興趣度的關(guān)聯(lián)規(guī)則挖掘[D];哈爾濱理工大學(xué);2009年
9 劉正紅;基于興趣度的關(guān)聯(lián)規(guī)則挖掘算法研究[D];東北師范大學(xué);2009年
10 靳峰;基于興趣度的推薦系統(tǒng)研究[D];西安建筑科技大學(xué);2005年
,本文編號:1050036
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/1050036.html