決策樹(shù)ID3算法的分析與改進(jìn)
[Abstract]:In order to remedy the shortcomings of ID3 algorithm [1-3], an improved algorithm based on ID3 algorithm is designed. It uses modified parameters to modify the information gain, overcomes the disadvantage of ID3 algorithm, which tends to select attributes with more values, and discretizes the attributes of continuous values and solves the problem of processing continuous attributes. By using the idea that samples with unknown values are randomly distributed according to the relative frequency of known values, samples lacking attribute values can be processed. This paper describes the concrete steps of generating decision tree [4] by improved ID3 algorithm, and applies the improved algorithm to customer churn analysis in customer relationship management system. Through the analysis and comparison of the experimental results, the improved algorithm has higher prediction accuracy than the original ID3 algorithm, which shows the effectiveness of the algorithm.
【作者單位】: 四川大學(xué)計(jì)算機(jī)學(xué)院;
【分類號(hào)】:TP181
【參考文獻(xiàn)】
相關(guān)期刊論文 前8條
1 曲開(kāi)社,成文麗,王俊紅;ID3算法的一種改進(jìn)算法[J];計(jì)算機(jī)工程與應(yīng)用;2003年25期
2 葉明全;胡學(xué)鋼;;一種基于灰色關(guān)聯(lián)度的決策樹(shù)改進(jìn)算法[J];計(jì)算機(jī)工程與應(yīng)用;2007年32期
3 韓松來(lái),張輝,周華平;基于關(guān)聯(lián)度函數(shù)的決策樹(shù)分類算法[J];計(jì)算機(jī)應(yīng)用;2005年11期
4 段玉春;朱曉艷;孫玉強(qiáng);;一種改進(jìn)的ID3算法[J];南陽(yáng)師范學(xué)院學(xué)報(bào)(社會(huì)科學(xué)版);2006年09期
5 王艷兵;趙銳;姚青;;基于可變精度的ID3改進(jìn)算法[J];計(jì)算機(jī)工程與設(shè)計(jì);2006年14期
6 狄文輝;李卿;樓新遠(yuǎn);;基于修正系數(shù)的決策樹(shù)分類算法[J];計(jì)算機(jī)工程與設(shè)計(jì);2008年24期
7 魏紅寧;決策樹(shù)剪枝方法的比較[J];西南交通大學(xué)學(xué)報(bào);2005年01期
8 馮少榮;肖文俊;;基于樣本選取的決策樹(shù)改進(jìn)算法[J];西南交通大學(xué)學(xué)報(bào);2009年05期
相關(guān)碩士學(xué)位論文 前2條
1 王峰;基于決策樹(shù)分類算法的企業(yè)CRM研究[D];長(zhǎng)春理工大學(xué);2008年
2 劉浩熙;數(shù)據(jù)挖掘在客戶關(guān)系管理綜合決策中的應(yīng)用[D];北京郵電大學(xué);2008年
【共引文獻(xiàn)】
相關(guān)期刊論文 前10條
1 王永梅;胡學(xué)鋼;;決策樹(shù)中ID3算法的研究[J];安徽大學(xué)學(xué)報(bào)(自然科學(xué)版);2011年03期
2 廖燕玲;;模糊聚類技術(shù)在甘蔗種植戶信息分析中的應(yīng)用[J];安徽農(nóng)業(yè)科學(xué);2007年28期
3 陳志民;李亭;楊敬鋒;彭曉琴;;融入監(jiān)督信息的k-mean聚類瓜薊馬預(yù)警模型[J];安徽農(nóng)業(yè)科學(xué);2009年30期
4 萬(wàn)雅奇;侯亞榮;王勇;張書(shū)杰;;教育考試數(shù)據(jù)挖掘系統(tǒng)研究與實(shí)現(xiàn)[J];北京工業(yè)大學(xué)學(xué)報(bào);2009年05期
5 安穎;;基于Apriori算法的興趣集加權(quán)關(guān)聯(lián)規(guī)則挖掘[J];北京聯(lián)合大學(xué)學(xué)報(bào)(自然科學(xué)版);2008年04期
6 朱學(xué)冬;胡平;;基于最優(yōu)二叉樹(shù)的多故障分類器的設(shè)計(jì)[J];北京聯(lián)合大學(xué)學(xué)報(bào)(自然科學(xué)版);2009年02期
7 楊曉;張迎新;;Apriori算法在消費(fèi)市場(chǎng)價(jià)格分析中的研究與應(yīng)用[J];北京工商大學(xué)學(xué)報(bào)(自然科學(xué)版);2009年03期
8 柏彬;牛紅利;;基于二叉樹(shù)模型的HTML轉(zhuǎn)換為XML的方法[J];才智;2010年03期
9 馬英芝;程鳳林;;基于數(shù)據(jù)挖掘技術(shù)的高校圖書(shū)館讀者分析[J];科技創(chuàng)新與應(yīng)用;2012年01期
10 曹萍;;商務(wù)智能在電子商務(wù)中的應(yīng)用研究[J];科技和產(chǎn)業(yè);2009年05期
相關(guān)會(huì)議論文 前10條
1 肖健;沈彩霞;;淺談數(shù)據(jù)挖掘技術(shù)現(xiàn)狀[A];廣西計(jì)算機(jī)學(xué)會(huì)2008年年會(huì)論文集[C];2008年
2 張宇;;基于XML的Web數(shù)據(jù)自動(dòng)挖掘[A];科技創(chuàng)新與節(jié)能減排——吉林省第五屆科學(xué)技術(shù)學(xué)術(shù)年會(huì)論文集(上冊(cè))[C];2008年
3 劉東升;;基于Mobile Agent的分布式ID3挖掘模型[A];2005年全國(guó)開(kāi)放式分布與并行計(jì)算學(xué)術(shù)會(huì)議論文集[C];2005年
4 錢(qián)學(xué)君;胡小建;;決策樹(shù)算法在焊接工藝設(shè)計(jì)中的應(yīng)用[A];2008年安徽省科協(xié)年會(huì)機(jī)械工程分年會(huì)論文集[C];2008年
5 卜亞杰;胡朝舉;;一種改進(jìn)的ID3算法[A];第一屆中國(guó)高校通信類院系學(xué)術(shù)研討會(huì)論文集[C];2007年
6 劉杰;周志杰;;分布式關(guān)聯(lián)規(guī)則挖掘在分級(jí)網(wǎng)絡(luò)管理中的研究[A];2008通信理論與技術(shù)新發(fā)展——第十三屆全國(guó)青年通信學(xué)術(shù)會(huì)議論文集(下)[C];2008年
7 陳媛媛;李曉;田二明;;基于粗糙集和BP網(wǎng)絡(luò)的車牌字符識(shí)別[A];2008中國(guó)儀器儀表與測(cè)控技術(shù)進(jìn)展大會(huì)論文集(Ⅰ)[C];2008年
8 李錦澤;葉曉俊;;關(guān)聯(lián)規(guī)則挖掘算法研究現(xiàn)狀[A];計(jì)算機(jī)技術(shù)與應(yīng)用進(jìn)展·2007——全國(guó)第18屆計(jì)算機(jī)技術(shù)與應(yīng)用(CACIS)學(xué)術(shù)會(huì)議論文集[C];2007年
9 張弦;;數(shù)據(jù)挖掘在農(nóng)業(yè)中的應(yīng)用[A];紀(jì)念中國(guó)農(nóng)業(yè)工程學(xué)會(huì)成立30周年暨中國(guó)農(nóng)業(yè)工程學(xué)會(huì)2009年學(xué)術(shù)年會(huì)(CSAE 2009)論文集[C];2009年
10 田琨;郭鳳霞;楊寧;;基于k-近鄰法的雷暴預(yù)報(bào)[A];第28屆中國(guó)氣象學(xué)會(huì)年會(huì)——S13雷電物理、監(jiān)測(cè)預(yù)警和防護(hù)[C];2011年
相關(guān)博士學(xué)位論文 前10條
1 沈懿珍;基于協(xié)同智能的蛋白質(zhì)相互作用及其網(wǎng)絡(luò)研究[D];東華大學(xué);2011年
2 葉紅云;面向金融營(yíng)銷問(wèn)題的個(gè)性化推薦方法研究[D];合肥工業(yè)大學(xué);2011年
3 王煉紅;人工免疫優(yōu)化與分類算法及其應(yīng)用研究[D];湖南大學(xué);2009年
4 彭光金;小樣本工程造價(jià)數(shù)據(jù)的智能學(xué)習(xí)方法及其在輸變電工程中的應(yīng)用研究[D];重慶大學(xué);2010年
5 孔令東;基于模糊Petri網(wǎng)的瓦斯突出空間預(yù)測(cè)模型研究[D];中國(guó)礦業(yè)大學(xué);2011年
6 何月順;關(guān)聯(lián)規(guī)則挖掘技術(shù)的研究及應(yīng)用[D];南京航空航天大學(xué);2010年
7 梁艷紅;基于專利挖掘的創(chuàng)新設(shè)計(jì)關(guān)鍵技術(shù)研究[D];河北工業(yè)大學(xué);2011年
8 劉智;關(guān)聯(lián)規(guī)則挖掘方法及其在冠心病中醫(yī)診療中的應(yīng)用研究[D];大連海事大學(xué);2012年
9 章政;基于遺傳編程的電力變壓器絕緣故障診斷模型研究[D];上海交通大學(xué);2007年
10 周鶯;古代情志病證醫(yī)案信息數(shù)理分析[D];廣州中醫(yī)藥大學(xué);2007年
相關(guān)碩士學(xué)位論文 前10條
1 郭慧;數(shù)據(jù)挖掘技術(shù)對(duì)放射工作人員知覺(jué)壓力因素分析[D];鄭州大學(xué);2010年
2 李媛;電子商務(wù)個(gè)性化推薦關(guān)鍵技術(shù)研究[D];哈爾濱工程大學(xué);2010年
3 叢強(qiáng);基于模糊關(guān)聯(lián)規(guī)則Web挖掘算法的研究[D];哈爾濱工程大學(xué);2010年
4 王宏云;基于數(shù)據(jù)挖掘的煤礦安全監(jiān)測(cè)系統(tǒng)研究[D];遼寧工程技術(shù)大學(xué);2009年
5 聶小芳;模糊粗糙集與支持向量機(jī)在煤與瓦斯突出預(yù)測(cè)中的應(yīng)用研究[D];遼寧工程技術(shù)大學(xué);2009年
6 周翔;決策支持技術(shù)在企業(yè)銷售系統(tǒng)中的應(yīng)用研究[D];中國(guó)海洋大學(xué);2010年
7 劉曉霞;數(shù)據(jù)挖掘技術(shù)在高校教學(xué)管理系統(tǒng)中的應(yīng)用研究[D];中國(guó)海洋大學(xué);2010年
8 韓成勇;高校學(xué)評(píng)教決策支持系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];蘇州大學(xué);2010年
9 張睿;ID3決策樹(shù)算法分析與改進(jìn)[D];蘭州大學(xué);2010年
10 葛苗苗;基于校園網(wǎng)的網(wǎng)絡(luò)用戶行為分析研究[D];南京財(cái)經(jīng)大學(xué);2010年
【二級(jí)參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 吉慶華;加強(qiáng)客戶關(guān)系管理,提高顧客忠誠(chéng)度[J];北京大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版);2004年S1期
2 張祥建,徐晉,郭嵐;企業(yè)營(yíng)銷中的客戶價(jià)值、驅(qū)動(dòng)因素及策略[J];商業(yè)研究;2004年21期
3 劉文君;鄒樹(shù)梁;王鐵驪;;對(duì)我國(guó)會(huì)展企業(yè)實(shí)施CRM的戰(zhàn)略性思考[J];商業(yè)研究;2005年21期
4 王扶東,朱云龍,薛勁松,李兵;基于數(shù)據(jù)挖掘的客戶關(guān)系分析評(píng)價(jià)系統(tǒng)[J];東南大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版);2002年S2期
5 周明;李相平;易怡;;基于生命周期的客戶知識(shí)管理策略[J];重慶大學(xué)學(xué)報(bào)(自然科學(xué)版);2006年07期
6 潘薇,葉曉俊;提高客戶滿意度的決策支持模型[J];哈爾濱工業(yè)大學(xué)學(xué)報(bào);2005年04期
7 喬琳,許暉,于玉,周水庚;復(fù)雜企業(yè)決策支持環(huán)境下的數(shù)據(jù)倉(cāng)庫(kù)體系結(jié)構(gòu)的演化[J];計(jì)算機(jī)工程與應(yīng)用;2000年07期
8 李智,王正肖,方水良;基于決策支持的客戶關(guān)系管理研究[J];計(jì)算機(jī)工程與應(yīng)用;2003年08期
9 曲開(kāi)社,成文麗,王俊紅;ID3算法的一種改進(jìn)算法[J];計(jì)算機(jī)工程與應(yīng)用;2003年25期
10 劉鵬;一種健壯有效的決策樹(shù)改進(jìn)模型[J];計(jì)算機(jī)工程與應(yīng)用;2005年33期
相關(guān)碩士學(xué)位論文 前2條
1 文專;基于神經(jīng)網(wǎng)絡(luò)的分類數(shù)據(jù)挖掘?qū)傩赃x擇和規(guī)則抽取研究[D];天津大學(xué);2004年
2 孫_";數(shù)據(jù)挖掘中的決策樹(shù)方法及其在客戶分類中的應(yīng)用[D];大連理工大學(xué);2004年
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 孫友友;郭曉燕;;決策樹(shù)與聚類算法在數(shù)據(jù)挖掘中的研究及應(yīng)用[J];科技創(chuàng)新導(dǎo)報(bào);2007年34期
2 王善俠;王振華;王吉永;;基于決策樹(shù)和聚類理論的XML文檔數(shù)據(jù)挖掘的研究[J];科技信息(科學(xué)教研);2007年34期
3 彭玉樓,劉亞輝;利用決策樹(shù)和聚類理論對(duì)XML文檔數(shù)據(jù)挖掘的研究[J];株洲工學(xué)院學(xué)報(bào);2005年04期
4 李會(huì);胡笑梅;;決策樹(shù)中ID3算法與C4.5算法分析與比較[J];水電能源科學(xué);2008年02期
5 于承敏;鄭麗萍;劉永濤;;數(shù)據(jù)挖掘在高校學(xué)生綜合測(cè)評(píng)成績(jī)分析中的應(yīng)用[J];電腦與電信;2009年10期
6 鄭麗萍;;Id3算法的研究及應(yīng)用[J];硅谷;2008年24期
7 陶靈姣;孫繼銀;李智;郭文普;;遠(yuǎn)程教育考試成績(jī)分析決策樹(shù)的構(gòu)造方法[J];計(jì)算機(jī)工程與設(shè)計(jì);2006年06期
8 王永梅;;ID3算法在計(jì)算機(jī)成績(jī)分析中的應(yīng)用[J];合肥學(xué)院學(xué)報(bào)(自然科學(xué)版);2010年01期
9 郭娜;田亞菲;郝潔;賈存麗;;一種基于改進(jìn)DRNN網(wǎng)絡(luò)的決策樹(shù)構(gòu)建方法[J];軟件;2010年11期
10 黃維維;葉建偉;張宏莉;;基于ID3決策樹(shù)的木馬動(dòng)態(tài)檢測(cè)技術(shù)研究[J];智能計(jì)算機(jī)與應(yīng)用;2011年03期
相關(guān)會(huì)議論文 前10條
1 武森;金海燕;高學(xué)東;;數(shù)據(jù)挖掘中CABOSFV聚類算法的實(shí)現(xiàn)與應(yīng)用[A];全國(guó)第八屆工業(yè)工程與企業(yè)信息化學(xué)術(shù)會(huì)議論文集[C];2004年
2 段巍巍;;電信客戶流失預(yù)測(cè)主題建模[A];第十屆中國(guó)科協(xié)年會(huì)信息化與社會(huì)發(fā)展學(xué)術(shù)討論會(huì)分會(huì)場(chǎng)論文集[C];2008年
3 陳平;喬秀全;劉臻;田小萍;;數(shù)據(jù)挖掘網(wǎng)格中決策樹(shù)并行算法設(shè)計(jì)及性能分析[A];中國(guó)通信學(xué)會(huì)通信軟件技術(shù)委員會(huì)2009年學(xué)術(shù)會(huì)議論文集[C];2009年
4 朱強(qiáng)生;田英;周延泉;何華燦;;銀行業(yè)中的客戶數(shù)據(jù)挖掘[A];2006通信理論與技術(shù)新進(jìn)展——第十一屆全國(guó)青年通信學(xué)術(shù)會(huì)議論文集[C];2006年
5 黃章樹(shù);黃麗欽;;數(shù)據(jù)挖掘技術(shù)在電信增值服務(wù)行業(yè)中的應(yīng)用[A];2004年中國(guó)管理科學(xué)學(xué)術(shù)會(huì)議論文集[C];2004年
6 周紅梅;薛青;;數(shù)據(jù)挖掘技術(shù)及其在裝備作戰(zhàn)仿真系統(tǒng)中的應(yīng)用[A];第五屆全國(guó)仿真器學(xué)術(shù)會(huì)論文集[C];2004年
7 姜慧;張冬艷;;決策樹(shù)在建設(shè)工程款拖欠問(wèn)題中的應(yīng)用研究[A];全國(guó)第19屆計(jì)算機(jī)技術(shù)與應(yīng)用(CACIS)學(xué)術(shù)會(huì)議論文集(下冊(cè))[C];2008年
8 劉建華;;一個(gè)智能搜索引擎的用戶行為聚類分析[A];第一屆全國(guó)Web信息系統(tǒng)及其應(yīng)用會(huì)議(WISA2004)論文集[C];2004年
9 李小明;孫金城;;數(shù)據(jù)挖掘在漢語(yǔ)語(yǔ)音合成中的應(yīng)用[A];圖像 仿真 信息技術(shù)——第二屆聯(lián)合學(xué)術(shù)會(huì)議論文集[C];2002年
10 孫迎;;醫(yī)院信息的數(shù)據(jù)挖掘與方法研究[A];中華醫(yī)學(xué)會(huì)第十次全國(guó)醫(yī)學(xué)信息學(xué)術(shù)會(huì)議論文匯編[C];2004年
相關(guān)重要報(bào)紙文章 前10條
1 記者 晏燕;數(shù)據(jù)挖掘讓決策者告別“拍腦袋”[N];科技日?qǐng)?bào);2006年
2 創(chuàng)智集團(tuán)副總裁 胡樂(lè)群博士;數(shù)據(jù)挖掘在CRM中的應(yīng)用[N];中國(guó)計(jì)算機(jī)報(bào);2002年
3 李開(kāi)宇 黃建軍 田長(zhǎng)春;把“數(shù)據(jù)挖掘”作用發(fā)揮出來(lái)[N];中國(guó)國(guó)防報(bào);2009年
4 華萊士;“數(shù)據(jù)挖掘”讓銀行贏利更多[N];國(guó)際金融報(bào);2003年
5 □中國(guó)電信股份有限公司北京研究院 張舒博 □北京郵電大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院 牛琨;走出數(shù)據(jù)挖掘的誤區(qū)[N];人民郵電;2006年
6 張立明;數(shù)據(jù)挖掘之道[N];網(wǎng)絡(luò)世界;2003年
7 中圣信息技術(shù)有限公司 李輝;數(shù)據(jù)挖掘在CRM中的作用[N];中國(guó)計(jì)算機(jī)報(bào);2001年
8 田紅生;數(shù)據(jù)挖掘在CRM中的應(yīng)用[N];中國(guó)經(jīng)濟(jì)時(shí)報(bào);2002年
9 王廣宇;數(shù)據(jù)挖掘 加速銀行CRM一體化[N];中國(guó)計(jì)算機(jī)報(bào);2004年
10 周蓉蓉;數(shù)據(jù)挖掘需要點(diǎn)想像力[N];計(jì)算機(jī)世界;2004年
相關(guān)博士學(xué)位論文 前10條
1 黃定軒;企業(yè)核心能力智能挖掘應(yīng)用基礎(chǔ)研究[D];西南交通大學(xué);2005年
2 王曙燕;醫(yī)學(xué)圖像智能分類算法研究[D];西北大學(xué);2006年
3 王明春;基于粗糙集的數(shù)據(jù)及文本挖掘方法研究[D];天津大學(xué);2005年
4 趙基;基于數(shù)據(jù)挖掘的銀行客戶分析管理關(guān)鍵技術(shù)研究[D];浙江大學(xué);2005年
5 李興森;智能知識(shí)及其管理模式研究[D];中國(guó)科學(xué)院研究生院;2008年
6 孫麗;工藝知識(shí)管理及其若干關(guān)鍵技術(shù)研究[D];大連交通大學(xué);2005年
7 胡志坤;復(fù)雜有色金屬熔煉過(guò)程操作模式智能優(yōu)化方法研究[D];中南大學(xué);2005年
8 賀琳;基于數(shù)據(jù)挖掘的道路運(yùn)行安全風(fēng)險(xiǎn)分析[D];大連海事大學(xué);2012年
9 劉革平;基于數(shù)據(jù)挖掘的遠(yuǎn)程學(xué)習(xí)評(píng)價(jià)研究[D];西南師范大學(xué);2005年
10 劉寨華;基于臨床數(shù)據(jù)分析的病毒性心肌炎證候演變規(guī)律研究[D];黑龍江中醫(yī)藥大學(xué);2006年
相關(guān)碩士學(xué)位論文 前10條
1 易s,
本文編號(hào):2331099
本文鏈接:http://sikaile.net/guanlilunwen/kehuguanxiguanli/2331099.html