基于GA的CART決策樹改進(jìn)算法與應(yīng)用
發(fā)布時(shí)間:2021-04-28 15:57
自20世紀(jì)中期互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,信息技術(shù)跟隨著迅猛發(fā)展,用戶隨時(shí)隨地都產(chǎn)生了大量的圖像、文本、音頻、視頻等信息。如何從這些不斷增長的數(shù)據(jù)中得出對人們有利用價(jià)值的信息?于是,誕生了數(shù)據(jù)挖掘技術(shù)。數(shù)據(jù)挖掘就是不斷的在數(shù)據(jù)中尋找有用信息,通過各種不同的分析方式和分析工具建立起各種數(shù)學(xué)模型與數(shù)據(jù)之間的聯(lián)系,然后通過對這些構(gòu)建好的模型與數(shù)據(jù)進(jìn)行分析以及預(yù)測。分類預(yù)測是數(shù)據(jù)挖掘中的一項(xiàng)重要領(lǐng)域,在數(shù)據(jù)挖掘中,分類預(yù)測占有重要地位。決策樹算法就是分類中一種易于理解并且使用范圍較廣的算法,決策樹相較于其他方法有預(yù)測速率快、高精度且生成的分類規(guī)則易于解釋等好處,因此是分類預(yù)測中比較常用的方法。常用的決策樹算法有ID3算法、C4.5算法和CART算法,ID3算法適用于處理小規(guī)模數(shù)據(jù)集且無法處理離散屬性。C4.5算法改善了ID3算法的缺點(diǎn),能同時(shí)處理連續(xù)屬性,且在剪枝的時(shí)候加入了初步正則化思想,防止過擬合,但C4.5算法只能處理分類問題,無法處理回歸問題。CART算法在此問題上進(jìn)行了改進(jìn),既能處理分類問題也能處理回歸問題,且用Gini系數(shù)代替信息增益率進(jìn)行分裂,降低了數(shù)據(jù)的計(jì)算量。但CART算法同樣有著...
【文章來源】:廣州大學(xué)廣東省
【文章頁數(shù)】:66 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 課題研究的背景和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 本論文主要研究內(nèi)容
1.4 本章總結(jié)
第二章 數(shù)據(jù)挖掘概述
2.1 數(shù)據(jù)挖掘的相關(guān)理論
2.2 數(shù)據(jù)挖掘常見的分類算法
2.2.1 神經(jīng)網(wǎng)絡(luò)方法
2.2.2 粗糙集理論方法
2.2.3 聚類
2.2.4 關(guān)聯(lián)規(guī)則
2.2.5 統(tǒng)計(jì)分析方法
2.2.6 回歸分析
2.2.7 決策樹方法
2.3 本章總結(jié)
第三章 決策樹分類技術(shù)
3.1 決策樹的定義和結(jié)構(gòu)
3.2 決策樹的構(gòu)造過程
3.3 常用的決策樹算法簡介
3.3.1 ID3算法簡介
3.3.2 C4.5算法
3.3.3 CART算法
3.3.4 決策樹的應(yīng)用
3.4 本章總結(jié)
第四章 基于遺傳算法的CART優(yōu)化的研究
4.1 引言
4.2 遺傳算法介紹
4.3 基于遺傳算法的CART算法的研究分析
4.3.1 基于遺傳算法的CART算法的基本原理
4.3.2 基于遺傳算法的CART算法的基本步驟
4.3.3 基于遺傳算法的CART算法的實(shí)現(xiàn)
4.4 算法驗(yàn)證
4.4.1 數(shù)據(jù)說明
4.4.2 基于CART算法的決策樹分類
4.4.3 基于上層遺傳算法優(yōu)化分類規(guī)則的CART分類
4.4.4 基于雙層遺傳算法優(yōu)化CART算法的過程
4.5 實(shí)驗(yàn)結(jié)果
第五章 總結(jié)和展望
參考文獻(xiàn)
附錄:算法用到的相關(guān)函數(shù)介紹
致謝
【參考文獻(xiàn)】:
期刊論文
[1]數(shù)據(jù)挖掘經(jīng)典分類聚類算法的研究綜述[J]. 姚奇峰,楊連賀. 現(xiàn)代信息科技. 2019(24)
[2]一種改進(jìn)的ID3決策算法及其應(yīng)用[J]. 圣文順,孫艷文. 計(jì)算機(jī)與數(shù)字工程. 2019(12)
[3]基于C4.5決策樹分類算法的改進(jìn)與應(yīng)用[J]. 李春生,焦海濤,劉澎,劉小剛. 計(jì)算機(jī)技術(shù)與發(fā)展. 2020(05)
[4]神經(jīng)網(wǎng)絡(luò)規(guī)則優(yōu)化建模與應(yīng)用[J]. 陳麗芳,馮力靜,劉保相. 計(jì)算機(jī)工程與科學(xué). 2019(12)
[5]基于關(guān)聯(lián)規(guī)則的Apriori改進(jìn)算法的研究綜述[J]. 彭新宇,李叢煊,郭金盈,赫彥文. 電腦知識(shí)與技術(shù). 2019(34)
[6]融合GINI指數(shù)的ID3改進(jìn)算法[J]. 羅計(jì)根,杜建強(qiáng),聶斌,李歡,賀佳. 南昌大學(xué)學(xué)報(bào)(工科版). 2019(01)
[7]決策樹ID3新屬性選擇方法[J]. 王子京,劉毓. 現(xiàn)代電子技術(shù). 2018(23)
[8]梯度優(yōu)化決策樹的集成學(xué)習(xí)及其應(yīng)用[J]. 王延斌,武優(yōu)西,劉洪普. 計(jì)算機(jī)科學(xué). 2018(S2)
[9]決策樹C4.5算法改進(jìn)與應(yīng)用[J]. 陳杰,鄔春學(xué). 軟件導(dǎo)刊. 2018(10)
[10]基于粗糙集理論與CAIM準(zhǔn)則的C4.5改進(jìn)算法[J]. 于宏濤,賈宇波. 計(jì)算機(jī)系統(tǒng)應(yīng)用. 2018(07)
碩士論文
[1]數(shù)據(jù)挖掘算法的改進(jìn)研究[D]. 胡昕韻.安徽大學(xué) 2019
[2]基于BP神經(jīng)網(wǎng)絡(luò)的分類器改進(jìn)算法研究與應(yīng)用[D]. 李圓滿.中國地質(zhì)大學(xué)(北京) 2019
[3]并行頻繁項(xiàng)集挖掘算法研究[D]. 何鎮(zhèn)宏.四川師范大學(xué) 2018
本文編號:3165760
【文章來源】:廣州大學(xué)廣東省
【文章頁數(shù)】:66 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 課題研究的背景和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 本論文主要研究內(nèi)容
1.4 本章總結(jié)
第二章 數(shù)據(jù)挖掘概述
2.1 數(shù)據(jù)挖掘的相關(guān)理論
2.2 數(shù)據(jù)挖掘常見的分類算法
2.2.1 神經(jīng)網(wǎng)絡(luò)方法
2.2.2 粗糙集理論方法
2.2.3 聚類
2.2.4 關(guān)聯(lián)規(guī)則
2.2.5 統(tǒng)計(jì)分析方法
2.2.6 回歸分析
2.2.7 決策樹方法
2.3 本章總結(jié)
第三章 決策樹分類技術(shù)
3.1 決策樹的定義和結(jié)構(gòu)
3.2 決策樹的構(gòu)造過程
3.3 常用的決策樹算法簡介
3.3.1 ID3算法簡介
3.3.2 C4.5算法
3.3.3 CART算法
3.3.4 決策樹的應(yīng)用
3.4 本章總結(jié)
第四章 基于遺傳算法的CART優(yōu)化的研究
4.1 引言
4.2 遺傳算法介紹
4.3 基于遺傳算法的CART算法的研究分析
4.3.1 基于遺傳算法的CART算法的基本原理
4.3.2 基于遺傳算法的CART算法的基本步驟
4.3.3 基于遺傳算法的CART算法的實(shí)現(xiàn)
4.4 算法驗(yàn)證
4.4.1 數(shù)據(jù)說明
4.4.2 基于CART算法的決策樹分類
4.4.3 基于上層遺傳算法優(yōu)化分類規(guī)則的CART分類
4.4.4 基于雙層遺傳算法優(yōu)化CART算法的過程
4.5 實(shí)驗(yàn)結(jié)果
第五章 總結(jié)和展望
參考文獻(xiàn)
附錄:算法用到的相關(guān)函數(shù)介紹
致謝
【參考文獻(xiàn)】:
期刊論文
[1]數(shù)據(jù)挖掘經(jīng)典分類聚類算法的研究綜述[J]. 姚奇峰,楊連賀. 現(xiàn)代信息科技. 2019(24)
[2]一種改進(jìn)的ID3決策算法及其應(yīng)用[J]. 圣文順,孫艷文. 計(jì)算機(jī)與數(shù)字工程. 2019(12)
[3]基于C4.5決策樹分類算法的改進(jìn)與應(yīng)用[J]. 李春生,焦海濤,劉澎,劉小剛. 計(jì)算機(jī)技術(shù)與發(fā)展. 2020(05)
[4]神經(jīng)網(wǎng)絡(luò)規(guī)則優(yōu)化建模與應(yīng)用[J]. 陳麗芳,馮力靜,劉保相. 計(jì)算機(jī)工程與科學(xué). 2019(12)
[5]基于關(guān)聯(lián)規(guī)則的Apriori改進(jìn)算法的研究綜述[J]. 彭新宇,李叢煊,郭金盈,赫彥文. 電腦知識(shí)與技術(shù). 2019(34)
[6]融合GINI指數(shù)的ID3改進(jìn)算法[J]. 羅計(jì)根,杜建強(qiáng),聶斌,李歡,賀佳. 南昌大學(xué)學(xué)報(bào)(工科版). 2019(01)
[7]決策樹ID3新屬性選擇方法[J]. 王子京,劉毓. 現(xiàn)代電子技術(shù). 2018(23)
[8]梯度優(yōu)化決策樹的集成學(xué)習(xí)及其應(yīng)用[J]. 王延斌,武優(yōu)西,劉洪普. 計(jì)算機(jī)科學(xué). 2018(S2)
[9]決策樹C4.5算法改進(jìn)與應(yīng)用[J]. 陳杰,鄔春學(xué). 軟件導(dǎo)刊. 2018(10)
[10]基于粗糙集理論與CAIM準(zhǔn)則的C4.5改進(jìn)算法[J]. 于宏濤,賈宇波. 計(jì)算機(jī)系統(tǒng)應(yīng)用. 2018(07)
碩士論文
[1]數(shù)據(jù)挖掘算法的改進(jìn)研究[D]. 胡昕韻.安徽大學(xué) 2019
[2]基于BP神經(jīng)網(wǎng)絡(luò)的分類器改進(jìn)算法研究與應(yīng)用[D]. 李圓滿.中國地質(zhì)大學(xué)(北京) 2019
[3]并行頻繁項(xiàng)集挖掘算法研究[D]. 何鎮(zhèn)宏.四川師范大學(xué) 2018
本文編號:3165760
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3165760.html
最近更新
教材專著