ID3算法的優(yōu)化
本文關(guān)鍵詞:ID3算法的優(yōu)化
更多相關(guān)文章: 決策樹 ID算法 屬性重要性 信息增益 凸函數(shù)
【摘要】:針對ID3算法傾向于選擇取值較多的屬性的缺點,首先引入屬性重要性進(jìn)行改進(jìn),然后根據(jù)ID3算法中信息增益的計算特點,利用凸函數(shù)的性質(zhì)進(jìn)行簡化,減少了信息增益的計算量,提高ID3算法中信息增益的計算效率.實驗證明,優(yōu)化ID3算法與傳統(tǒng)ID3算法相比,在構(gòu)造決策樹時具有較高的準(zhǔn)確率和更快的計算速度,并且構(gòu)造的決策樹還具有較少的平均葉子數(shù).
【作者單位】: 鄭州輕工業(yè)學(xué)院計算機(jī)與通信工程學(xué)院;中國科學(xué)院成都計算機(jī)應(yīng)用研究所;中國科學(xué)院研究生院;
【基金】:四川省科技計劃項目(2008GZ0003) 四川省科技攻關(guān)項目(07GG006-019)
【分類號】:TP301.6
【正文快照】: 隨著信息技術(shù)的飛速發(fā)展,數(shù)據(jù)量以驚人的速度增長,豐富的數(shù)據(jù)與貧乏的知識之間的矛盾日見突出,各個領(lǐng)域迫切需要有一種能夠從這些超大數(shù)據(jù)中尋求有用信息的工具,數(shù)據(jù)挖掘就是在這種需要下出現(xiàn)的.目前,決策樹已成為一種重要的數(shù)據(jù)挖掘方法,ID3算法[1]是最具有影響的一種決策樹
【共引文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 王永梅;胡學(xué)鋼;;決策樹中ID3算法的研究[J];安徽大學(xué)學(xué)報(自然科學(xué)版);2011年03期
2 葉明全;;數(shù)據(jù)挖掘在醫(yī)療數(shù)據(jù)中的應(yīng)用[J];安徽工程科技學(xué)院學(xué)報(自然科學(xué)版);2007年03期
3 賈澤露;;基于GIS與SDM集成的農(nóng)用地定級專家系統(tǒng)[J];安徽農(nóng)業(yè)科學(xué);2008年14期
4 蔡麗艷;馮憲彬;丁蕊;;基于決策樹的農(nóng)戶小額貸款信用評估模型研究[J];安徽農(nóng)業(yè)科學(xué);2011年02期
5 趙靜嫻;;基于決策樹的食品安全評估研究[J];安徽農(nóng)業(yè)科學(xué);2011年32期
6 王斌;;基于聚類的決策樹在玉米種質(zhì)篩選中的應(yīng)用[J];安徽農(nóng)業(yè)科學(xué);2011年33期
7 陳文;基于決策樹的入侵檢測的實現(xiàn)[J];安徽技術(shù)師范學(xué)院學(xué)報;2005年05期
8 覃愛明,胡昌振,譚惠民;網(wǎng)絡(luò)攻擊檢測中的機(jī)器學(xué)習(xí)方法綜述[J];安全與環(huán)境學(xué)報;2001年01期
9 彭莉芬;陳俊生;胡學(xué)鋼;;基于粗糙集決策樹算法的研究[J];安慶師范學(xué)院學(xué)報(自然科學(xué)版);2012年01期
10 左吉峰;喬均儉;;ID3算法的合理性證明及實驗分析[J];保定學(xué)院學(xué)報;2008年04期
中國博士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 張明;電能質(zhì)量擾動相關(guān)問題研究[D];華中科技大學(xué);2010年
2 渠瑜;基于SVM的高不平衡分類技術(shù)研究及其在電信業(yè)的應(yīng)用[D];浙江大學(xué);2010年
3 徐河杭;面向PLM的數(shù)據(jù)挖掘技術(shù)和應(yīng)用研究[D];浙江大學(xué);2010年
4 朱佳俊;不確定可拓群決策優(yōu)化方法及應(yīng)用[D];東華大學(xué);2010年
5 陳進(jìn);高光譜圖像分類方法研究[D];國防科學(xué)技術(shù)大學(xué);2010年
6 管紅波;食品連鎖經(jīng)營中的有效客戶反應(yīng)研究[D];東華大學(xué);2010年
7 李軍;不平衡數(shù)據(jù)學(xué)習(xí)的研究[D];吉林大學(xué);2011年
8 魏小濤;在線自適應(yīng)網(wǎng)絡(luò)異常檢測系統(tǒng)模型與相關(guān)算法研究[D];北京交通大學(xué);2009年
9 王中鋒;樹型貝葉斯網(wǎng)絡(luò)分類器鑒別式訓(xùn)練研究[D];北京交通大學(xué);2011年
10 楊明;分布式環(huán)境下的安全策略關(guān)鍵技術(shù)研究[D];吉林大學(xué);2011年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條
1 岳海亮;信息論在粗糙集連續(xù)屬性離散化中的應(yīng)用[D];遼寧師范大學(xué);2010年
2 劉春燕;教學(xué)網(wǎng)絡(luò)DIDS數(shù)據(jù)分析方法的研究與改進(jìn)[D];鄭州大學(xué);2010年
3 徐洪偉;數(shù)據(jù)挖掘中決策樹分類算法的研究與改進(jìn)[D];哈爾濱工程大學(xué);2010年
4 曹振興;適應(yīng)概念漂移的數(shù)據(jù)流分類算法研究[D];哈爾濱工程大學(xué);2010年
5 李曉光;數(shù)據(jù)挖掘技術(shù)在高校招生和教務(wù)管理中的應(yīng)用[D];哈爾濱工程大學(xué);2010年
6 秦園;基于SPOT5的土地信息提取技術(shù)研究[D];大連理工大學(xué);2010年
7 李仁良;決策樹算法在臨床診斷中的應(yīng)用研究[D];遼寧工程技術(shù)大學(xué);2009年
8 鄭陶;基于平面向量的決策樹算法在高考志愿選擇系統(tǒng)中的應(yīng)用[D];遼寧工程技術(shù)大學(xué);2010年
9 孫怡哲;一種改進(jìn)的決策樹算法研究與應(yīng)用[D];遼寧工程技術(shù)大學(xué);2010年
10 黃輝;基于LSI和SVC的網(wǎng)頁文本分類算法研究[D];長沙理工大學(xué);2010年
【二級參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前4條
1 姚曄,李翔;決策樹算法的教育應(yīng)用探討[J];江西師范大學(xué)學(xué)報(自然科學(xué)版);2004年04期
2 王靜紅,李筆;基于決策樹的一種改進(jìn)算法[J];電訊技術(shù);2004年05期
3 王大玲,于戈,鮑玉斌,王國仁;一種基于關(guān)聯(lián)性度量的決策樹分類方法[J];東北大學(xué)學(xué)報;2001年05期
4 王熙照,謝競博;基于屬性間交互信息的模糊ID3算法的擴(kuò)展(英文)[J];復(fù)旦學(xué)報(自然科學(xué)版);2004年05期
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 朱顥東;;ID3算法的改進(jìn)和簡化[J];上海交通大學(xué)學(xué)報;2010年07期
2 陳偉;;改進(jìn)的ID3算法構(gòu)造決策樹[J];淮南師范學(xué)院學(xué)報;2010年03期
3 段玉春;朱曉艷;孫玉強(qiáng);;一種改進(jìn)的ID3算法[J];南陽師范學(xué)院學(xué)報;2006年09期
4 李冬萍;楊迎春;;改進(jìn)的分類算法在高職學(xué)生就業(yè)分析中的應(yīng)用[J];黑龍江科技信息;2008年32期
5 陳偉;;改進(jìn)的ID3算法構(gòu)造專升本考試成績決策樹[J];合肥學(xué)院學(xué)報(自然科學(xué)版);2010年02期
6 陳偉;程黃金;;ID3算法構(gòu)造學(xué)生專升本考試成績分析決策樹[J];電腦知識與技術(shù);2009年03期
7 姚爭兒;;探索數(shù)據(jù)挖掘分類技術(shù)在高校教學(xué)中的應(yīng)用[J];現(xiàn)代計算機(jī)(專業(yè)版);2010年11期
8 錢江波,陳s,
本文編號:1205308
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1205308.html