貝葉斯決策樹(shù)方法在招生數(shù)據(jù)挖掘中的應(yīng)用
本文選題:數(shù)據(jù)挖掘 + 貝葉斯決策樹(shù) ; 參考:《計(jì)算機(jī)技術(shù)與發(fā)展》2016年04期
【摘要】:文中首先簡(jiǎn)單介紹了貝葉斯決策樹(shù)方法的基本思想,該方法結(jié)合了貝葉斯分類(lèi)的先驗(yàn)信息方法和決策樹(shù)分類(lèi)的信息增益方法的優(yōu)點(diǎn),加入貝葉斯節(jié)點(diǎn)彌補(bǔ)了決策樹(shù)不能處理具有二義性或存在缺失值數(shù)據(jù)的缺點(diǎn)。在此基礎(chǔ)上,文中設(shè)計(jì)了一種基于樸素貝葉斯方法和ID3算法的貝葉斯決策樹(shù)算法——NBDT-ID3算法,并給出了該算法的設(shè)計(jì)及分析過(guò)程。然后將該算法應(yīng)用到高職招生數(shù)據(jù)挖掘中,對(duì)新生報(bào)到情況進(jìn)行分析與預(yù)測(cè),并在Matlab環(huán)境下進(jìn)行了實(shí)驗(yàn)驗(yàn)證。實(shí)驗(yàn)結(jié)果表明,NBDT-ID3算法在付出一定時(shí)間代價(jià)的情況下,不僅可以獲得更高的分類(lèi)精度,而且在處理二義性、不完整或不一致數(shù)據(jù)方面具有更好的效果。
[Abstract]:In this paper, the basic idea of Bayesian decision tree method is introduced briefly, which combines the advantages of the prior information method of Bayesian classification and the information gain method of decision tree classification.Adding Bayesian nodes makes up for the fact that the decision tree can not deal with ambiguous or missing value data.On this basis, a Bayesian decision tree algorithm based on naive Bayesian method and ID3 algorithm, NBDT-ID3 algorithm, is designed, and the design and analysis process of the algorithm is given.Then, the algorithm is applied to the data mining of higher vocational enrollment, and the new students' registration situation is analyzed and forecasted, and the experimental results are verified under the environment of Matlab.The experimental results show that the NBDT-ID3 algorithm can not only obtain higher classification accuracy but also deal with ambiguous incomplete or inconsistent data at a certain time cost.
【作者單位】: 武漢大學(xué)計(jì)算機(jī)學(xué)院;廣西英華國(guó)際職業(yè)學(xué)院工信學(xué)院;
【基金】:中央高;究蒲袠I(yè)務(wù)費(fèi)專(zhuān)項(xiàng)基金項(xiàng)目(2042014f0057) 湖北省自然科學(xué)基金項(xiàng)目(2014CFB289)
【分類(lèi)號(hào)】:TP311.13
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 李業(yè)麗,常桂然,徐茜;神經(jīng)網(wǎng)絡(luò)在數(shù)據(jù)挖掘中的應(yīng)用研究[J];計(jì)算機(jī)工程與應(yīng)用;2000年08期
2 陳國(guó)萍,李巍,劉仲英;數(shù)據(jù)挖掘中概念樹(shù)的標(biāo)準(zhǔn)、生成和實(shí)現(xiàn)[J];計(jì)算機(jī)工程;2000年12期
3 朱天翔,李力;相關(guān)案件的數(shù)據(jù)挖掘[J];計(jì)算機(jī)應(yīng)用研究;2000年03期
4 趙丹群;數(shù)據(jù)挖掘:原理、方法及其應(yīng)用[J];現(xiàn)代圖書(shū)情報(bào)技術(shù);2000年06期
5 余英澤,廖里,吳渝;一種新型數(shù)據(jù)分析技術(shù)——數(shù)據(jù)挖掘[J];計(jì)算機(jī)與現(xiàn)代化;2000年01期
6 邵華 ,萬(wàn)家華 ,金翔義;數(shù)據(jù)挖掘在證券行業(yè)中的應(yīng)用[J];軟件工程師;2000年11期
7 王宏;數(shù)據(jù)挖掘在網(wǎng)絡(luò)營(yíng)銷(xiāo)中的應(yīng)用[J];計(jì)算機(jī)應(yīng)用與軟件;2000年06期
8 何東峰;數(shù)據(jù)挖掘要適當(dāng)[J];互聯(lián)網(wǎng)周刊;2000年Z1期
9 康松林,費(fèi)洪曉;數(shù)據(jù)挖掘的軟分類(lèi)方法[J];長(zhǎng)沙鐵道學(xué)院學(xué)報(bào);2001年03期
10 邢平平,施鵬飛,趙奕;基于本體論的數(shù)據(jù)挖掘方法[J];計(jì)算機(jī)工程;2001年05期
相關(guān)會(huì)議論文 前10條
1 謝中;邱玉輝;;面向商務(wù)網(wǎng)站有效性的數(shù)據(jù)挖掘方法[A];第十八屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2001年
2 李久丹;陳劍;覃濤;;數(shù)據(jù)挖掘技術(shù)理論研究[A];廣西計(jì)算機(jī)學(xué)會(huì)2010年學(xué)術(shù)年會(huì)論文集[C];2010年
3 張秋彤;;數(shù)據(jù)挖掘與高校圖書(shū)館個(gè)性化信息服務(wù)[A];第九屆中國(guó)不確定系統(tǒng)年會(huì)、第五屆中國(guó)智能計(jì)算大會(huì)、第十三屆中國(guó)青年信息與管理學(xué)者大會(huì)論文集[C];2011年
4 薛魯華;張楠;;聚類(lèi)分析在Web數(shù)據(jù)挖掘中的應(yīng)用[A];北京市第十三次統(tǒng)計(jì)科學(xué)討論會(huì)論文選編[C];2006年
5 段培俊;周東岱;;數(shù)據(jù)挖掘研究綜述[A];2003年中國(guó)智能自動(dòng)化會(huì)議論文集(下冊(cè))[C];2003年
6 雷宇;;論行業(yè)信息資源的數(shù)據(jù)挖掘[A];中國(guó)煙草行業(yè)信息化研討會(huì)論文集[C];2004年
7 吳以凡;吳鐵軍;歐陽(yáng)樹(shù)生;;面向生產(chǎn)過(guò)程質(zhì)量控制的動(dòng)態(tài)數(shù)據(jù)挖掘方法[A];05'中國(guó)自動(dòng)化產(chǎn)業(yè)高峰會(huì)議暨中國(guó)企業(yè)自動(dòng)化和信息化建設(shè)論壇論文集[C];2005年
8 孫明;康紅梅;莫一;;數(shù)據(jù)挖掘在科技獎(jiǎng)勵(lì)管理系統(tǒng)專(zhuān)家?guī)熘械膽?yīng)用[A];2005年十二省區(qū)市機(jī)械工程學(xué)會(huì)學(xué)術(shù)年會(huì)論文集(湖北專(zhuān)集)[C];2005年
9 邵紅全;楊菊梅;潘建雄;;數(shù)據(jù)挖掘的策略與實(shí)現(xiàn)技術(shù)[A];中國(guó)系統(tǒng)工程學(xué)會(huì)決策科學(xué)專(zhuān)業(yè)委員會(huì)第六屆學(xué)術(shù)年會(huì)論文集[C];2005年
10 葉偉芳;徐迪;;數(shù)據(jù)挖掘及其在金融領(lǐng)域的應(yīng)用[A];中國(guó)企業(yè)運(yùn)籌學(xué)學(xué)術(shù)交流大會(huì)論文集[C];2005年
相關(guān)重要報(bào)紙文章 前10條
1 □中國(guó)電信股份有限公司北京研究院 張舒博 □北京郵電大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院 牛琨;走出數(shù)據(jù)挖掘的誤區(qū)[N];人民郵電;2006年
2 《網(wǎng)絡(luò)世界》記者 王瑩;數(shù)據(jù)挖掘保險(xiǎn)業(yè)的新藍(lán)海[N];網(wǎng)絡(luò)世界;2012年
3 劉俊麗;基于地理化的網(wǎng)絡(luò)數(shù)據(jù)挖掘與分析提升投資有效性[N];人民郵電;2014年
4 ;數(shù)據(jù)挖掘:如何挖出效益?[N];中國(guó)計(jì)算機(jī)報(bào);2004年
5 任中華;財(cái)務(wù)數(shù)據(jù)挖掘六步走[N];中國(guó)計(jì)算機(jī)報(bào);2007年
6 電腦商報(bào)記者 謝濤;數(shù)據(jù)挖掘:未來(lái)政府信息化的重要環(huán)節(jié)[N];電腦商報(bào);2007年
7 吳勇毅;軟件選型:數(shù)據(jù)挖掘是重點(diǎn)[N];中國(guó)冶金報(bào);2009年
8 本報(bào)特約撰稿 許麗萍;數(shù)據(jù)挖掘:軟件應(yīng)用的新境界[N];計(jì)算機(jī)世界;2009年
9 謝立宏博士;企業(yè)的“黃金眼”數(shù)據(jù)挖掘決策支持[N];中國(guó)計(jì)算機(jī)報(bào);2002年
10 吳勇毅;危機(jī)下,,數(shù)據(jù)挖掘與提供信息決策是關(guān)健[N];中國(guó)冶金報(bào);2009年
相關(guān)碩士學(xué)位論文 前10條
1 楊毅超;基于Web數(shù)據(jù)挖掘的作物商務(wù)平臺(tái)分析與研究[D];湖南農(nóng)業(yè)大學(xué);2008年
2 徐進(jìn)華;基于灰色系統(tǒng)理論的數(shù)據(jù)挖掘及其模型研究[D];北京交通大學(xué);2009年
3 俞馳;基于網(wǎng)絡(luò)數(shù)據(jù)挖掘的客戶(hù)獲取系統(tǒng)研究[D];西安電子科技大學(xué);2009年
4 馮軍;數(shù)據(jù)挖掘在自動(dòng)外呼系統(tǒng)中的應(yīng)用[D];北京郵電大學(xué);2009年
5 于寶華;基于數(shù)據(jù)挖掘的高考數(shù)據(jù)分析[D];天津大學(xué);2009年
6 王仁彥;數(shù)據(jù)挖掘與網(wǎng)站運(yùn)營(yíng)管理[D];華東師范大學(xué);2010年
7 彭智軍;數(shù)據(jù)挖掘的若干新方法及其在我國(guó)證券市場(chǎng)中應(yīng)用[D];重慶大學(xué);2005年
8 涂繼亮;基于數(shù)據(jù)挖掘的智能客戶(hù)關(guān)系管理系統(tǒng)研究[D];哈爾濱理工大學(xué);2005年
9 賈治國(guó);數(shù)據(jù)挖掘在高考填報(bào)志愿上的應(yīng)用[D];內(nèi)蒙古大學(xué);2005年
10 馬飛;基于數(shù)據(jù)挖掘的航運(yùn)市場(chǎng)預(yù)測(cè)系統(tǒng)設(shè)計(jì)及研究[D];大連海事大學(xué);2006年
本文編號(hào):1771341
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1771341.html