天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 軟件論文 >

基于決策樹的教學(xué)信息挖掘系統(tǒng)的研究與實(shí)現(xiàn)

發(fā)布時(shí)間:2017-09-22 15:02

  本文關(guān)鍵詞:基于決策樹的教學(xué)信息挖掘系統(tǒng)的研究與實(shí)現(xiàn)


  更多相關(guān)文章: 數(shù)據(jù)挖掘 ID3 決策樹


【摘要】:在社會(huì)進(jìn)入信息時(shí)代的今天,信息技術(shù)已經(jīng)成為生活中不可缺少的一部分。而隨著信息技術(shù)運(yùn)用的深入和廣泛普及,產(chǎn)生了大量需要存儲(chǔ)和再利用的數(shù)據(jù),這就引出了一個(gè)嶄新的“大數(shù)據(jù)時(shí)代”。面對(duì)如此巨大的數(shù)據(jù),就出現(xiàn)了數(shù)據(jù)挖掘技術(shù),該技術(shù)就是為了找到數(shù)據(jù)與數(shù)據(jù)之間的聯(lián)系和數(shù)據(jù)內(nèi)部隱藏的秘密。在我國(guó)數(shù)據(jù)挖掘起步較晚但進(jìn)步較快,一些大企業(yè)、高科技企業(yè)已經(jīng)做了比較深入的研究和初步的商業(yè)運(yùn)用,取得了許多成績(jī)。在大數(shù)據(jù)和數(shù)據(jù)挖掘背景下,義務(wù)教育階段的中小學(xué)等初級(jí)教育單位應(yīng)對(duì)卻有些滯后,每年的大量投入還是花在硬件裝備的更新上,很少會(huì)去分析數(shù)據(jù)更不要說數(shù)據(jù)挖掘。而現(xiàn)代學(xué)校要想發(fā)展,就必須要有新技術(shù)的變革,靠傳統(tǒng)的教育模式已經(jīng)落后,而數(shù)據(jù)挖掘技術(shù)的出現(xiàn)正可以為現(xiàn)代教育變革的強(qiáng)大引擎。首先,本文從大數(shù)據(jù)的產(chǎn)生背景和數(shù)據(jù)挖掘技術(shù)發(fā)展歷程入手,通過對(duì)數(shù)據(jù)挖掘技術(shù)的ID3、C4.5、CART三種常用算法的工作原理的研究及其優(yōu)缺點(diǎn)的比較分析,論證了該技術(shù)在教學(xué)信息系統(tǒng)中應(yīng)用的可行性。根據(jù)所在學(xué)校的現(xiàn)狀,完全可以運(yùn)用數(shù)據(jù)挖掘技術(shù)來推進(jìn)學(xué)校的辦學(xué)質(zhì)量。其次,分析了學(xué)校的數(shù)據(jù)特點(diǎn),一般數(shù)據(jù)量不會(huì)太大,特征值也不會(huì)太多的情況,結(jié)合數(shù)據(jù)挖掘技術(shù),抽取少量樣本數(shù)據(jù)對(duì)ID3、C4.5進(jìn)行比較,在生成效果差不多的情況下,決定采用相對(duì)復(fù)雜度不高的ID3算法來構(gòu)建學(xué)校的決策樹模型。但是ID3算法本身也存在缺點(diǎn):它通過信息增益選擇特征時(shí),一般選出的都是屬性值多的特征作為分割特征,但這些特征不一定就是最好的選擇;另外信息增益的計(jì)算太過于復(fù)雜,當(dāng)樣本量比較大時(shí)給計(jì)算帶來不小的負(fù)擔(dān)。針對(duì)這此問題本文對(duì)ID3算法進(jìn)行了小的改進(jìn),設(shè)計(jì)了采用等價(jià)無窮小和用戶興趣度概念來簡(jiǎn)化計(jì)算公式和特征取值的偏向問題。通過實(shí)際樣本測(cè)試改進(jìn)后的新算法對(duì)比ID3算法實(shí)現(xiàn)了在選報(bào)特征值一樣的情況下,信息增益的快速計(jì)算并且特征值選取也符合預(yù)期。再次,針對(duì)學(xué)校特點(diǎn)采用B/s結(jié)構(gòu)對(duì)系統(tǒng)進(jìn)行設(shè)計(jì),數(shù)據(jù)庫(kù)mysql,編程語(yǔ)言python。系統(tǒng)分為登陸、數(shù)據(jù)輸入、學(xué)生管理、班級(jí)管理、數(shù)據(jù)預(yù)處理、決策樹生產(chǎn)模塊。對(duì)各模塊的功能和結(jié)構(gòu)進(jìn)行了詳細(xì)的分析。最后,本文選擇了2012年入學(xué)的兩個(gè)班學(xué)生三年的樣本數(shù)據(jù),抽取了學(xué)生入學(xué)情況、初一期末成績(jī)、初二期末成績(jī)、初三中考成績(jī)、班級(jí)學(xué)生管理、教師配備初三中考、提優(yōu)補(bǔ)差等特征進(jìn)行數(shù)據(jù)的泛化處理,然后通過改進(jìn)后的ID3算法得到?jīng)Q策樹,通過計(jì)算過程的演示,可以看出這種改進(jìn)算法提高了決策樹的生成速度,避免了特征選擇時(shí)選報(bào)偏向的問題。
【關(guān)鍵詞】:數(shù)據(jù)挖掘 ID3 決策樹
【學(xué)位授予單位】:吉林大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP311.13
【目錄】:
  • 摘要4-6
  • Abstract6-11
  • 第1章 緒論11-18
  • 1.1 研究背景11-12
  • 1.2 選題意義12-13
  • 1.3 國(guó)內(nèi)外發(fā)展歷史和現(xiàn)狀13-15
  • 1.3.1 國(guó)外發(fā)展歷史和現(xiàn)狀13-15
  • 1.3.2 國(guó)內(nèi)發(fā)展歷史和現(xiàn)狀15
  • 1.4 本文工作15-16
  • 1.5 論文內(nèi)容和結(jié)構(gòu)16-18
  • 第2章 基礎(chǔ)概念和相關(guān)原理18-30
  • 2.1 知識(shí)發(fā)現(xiàn)的概念18
  • 2.2 數(shù)據(jù)挖掘的概念18-19
  • 2.3 KDD數(shù)據(jù)挖掘過程19-20
  • 2.4 數(shù)據(jù)挖掘所要解決的問題20-21
  • 2.5 數(shù)據(jù)挖掘決策樹技術(shù)21-23
  • 2.5.1 決策樹的定義和結(jié)構(gòu)21-22
  • 2.5.2 決策樹的工作原理22
  • 2.5.3 決策樹生成過程22-23
  • 2.6 決策樹的特征選擇23-27
  • 2.6.1 去掉取值變化小的特征23-24
  • 2.6.2 信息增益24-26
  • 2.6.3 信息增益比26-27
  • 2.7 決策樹的算法27-29
  • 2.7.1 ID3算法27-29
  • 2.7.2 C4.5 算法29
  • 2.8 小結(jié)29-30
  • 第3章 面向教學(xué)信息挖掘的ID3算法的改進(jìn)與應(yīng)用30-38
  • 3.1 ID3和c4.5 比較30-33
  • 3.2 ID3算法改進(jìn)一33-34
  • 3.3 改進(jìn)算法驗(yàn)證34-35
  • 3.4 ID3算法改進(jìn)二35-37
  • 3.5 小結(jié)37-38
  • 第4章 教學(xué)管理系統(tǒng)的需求分析38-45
  • 4.1 學(xué)校面臨的問題38-39
  • 4.2 教學(xué)信息挖掘系統(tǒng)需求問題說明39-44
  • 4.3 小結(jié)44-45
  • 第5章 教學(xué)信息管理系統(tǒng)框架及結(jié)構(gòu)設(shè)計(jì)45-51
  • 5.1 總體框架設(shè)計(jì)45-46
  • 5.2 登陸模塊46-47
  • 5.3 數(shù)據(jù)輸入模塊47-48
  • 5.4 班級(jí)管理模塊48
  • 5.5 學(xué)生管理模塊48-49
  • 5.6 數(shù)據(jù)預(yù)處理模塊49-50
  • 5.7 決策樹生成模塊50
  • 5.9 小結(jié)50-51
  • 第6章 教學(xué)管理系統(tǒng)的詳細(xì)設(shè)計(jì)與決策樹分析51-70
  • 6.1 運(yùn)行環(huán)境51-52
  • 6.2 數(shù)據(jù)庫(kù)設(shè)計(jì)52-57
  • 6.3 登陸界面57-59
  • 6.4 程序框架結(jié)構(gòu)59-60
  • 6.5 數(shù)據(jù)導(dǎo)入60-61
  • 6.6 數(shù)據(jù)的泛化處理61-62
  • 6.7 決策樹計(jì)算62-69
  • 6.8 本章小結(jié)69-70
  • 第7章 總結(jié)和展望70-72
  • 7.1 總結(jié)70-71
  • 7.2 展望71-72
  • 參照文獻(xiàn)72-74
  • 作者簡(jiǎn)介及在學(xué)習(xí)期間取得的科研成果74-75
  • 致謝75

【相似文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條

1 香麗蕓;淺談數(shù)據(jù)挖掘及其應(yīng)用[J];昌吉師專學(xué)報(bào);2001年02期

2 鄭雪燕,張杰明,岳洋;數(shù)據(jù)挖掘語(yǔ)言[J];計(jì)算機(jī)時(shí)代;2001年11期

3 劉明晶;數(shù)據(jù)挖掘[J];華南金融電腦;2001年04期

4 張偉;劉勇國(guó);彭軍;廖曉峰;吳中福;;數(shù)據(jù)挖掘發(fā)展研究[J];計(jì)算機(jī)科學(xué);2001年07期

5 鐘曉;馬少平;張鈸;俞瑞釗;;數(shù)據(jù)挖掘綜述[J];模式識(shí)別與人工智能;2001年01期

6 朱建平,張潤(rùn)楚;數(shù)據(jù)挖掘的發(fā)展及其特點(diǎn)[J];統(tǒng)計(jì)與決策;2002年07期

7 傅嵐;在數(shù)據(jù)海洋中打撈信息數(shù)據(jù)挖掘[J];科技廣場(chǎng);2002年11期

8 李峻;數(shù)據(jù)挖掘,企業(yè)洞察先機(jī)的“慧眼”[J];中國(guó)計(jì)算機(jī)用戶;2002年48期

9 羅可,蔡碧野,卜勝賢,謝中科;數(shù)據(jù)挖掘及其發(fā)展研究[J];計(jì)算機(jī)工程與應(yīng)用;2002年14期

10 ;2002數(shù)據(jù)挖掘研討班[J];計(jì)算機(jī)工程;2002年06期

中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條

1 史東輝;蔡慶生;張春陽(yáng);;一種新的數(shù)據(jù)挖掘多策略方法研究[A];第十七屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2000年

2 張弦;;數(shù)據(jù)挖掘在農(nóng)業(yè)中的應(yīng)用[A];紀(jì)念中國(guó)農(nóng)業(yè)工程學(xué)會(huì)成立30周年暨中國(guó)農(nóng)業(yè)工程學(xué)會(huì)2009年學(xué)術(shù)年會(huì)(CSAE 2009)論文集[C];2009年

3 魏順平;;教育數(shù)據(jù)挖掘:現(xiàn)狀與趨勢(shì)[A];信息化、工業(yè)化融合與服務(wù)創(chuàng)新——第十三屆計(jì)算機(jī)模擬與信息技術(shù)學(xué)術(shù)會(huì)議論文集[C];2011年

4 關(guān)清平;沉培輝;;概率網(wǎng)絡(luò)在數(shù)據(jù)挖掘上的應(yīng)用[A];科技、工程與經(jīng)濟(jì)社會(huì)協(xié)調(diào)發(fā)展——中國(guó)科協(xié)第五屆青年學(xué)術(shù)年會(huì)論文集[C];2004年

5 丁瑾;;基于Web數(shù)據(jù)挖掘的綜述[A];山西省科學(xué)技術(shù)情報(bào)學(xué)會(huì)學(xué)術(shù)年會(huì)論文集[C];2004年

6 聶茹;田森平;;Web數(shù)據(jù)挖掘及其在電子商務(wù)中的應(yīng)用[A];中南六。▍^(qū))自動(dòng)化學(xué)會(huì)第24屆學(xué)術(shù)年會(huì)會(huì)議論文集[C];2006年

7 李菊;王軍;;數(shù)據(jù)挖掘在客戶關(guān)系管理的應(yīng)用[A];計(jì)算機(jī)技術(shù)與應(yīng)用進(jìn)展·2007——全國(guó)第18屆計(jì)算機(jī)技術(shù)與應(yīng)用(CACIS)學(xué)術(shù)會(huì)議論文集[C];2007年

8 肖陽(yáng);李啟賢;;數(shù)據(jù)挖掘在中國(guó)鋼鐵行業(yè)中的應(yīng)用[A];中國(guó)計(jì)量協(xié)會(huì)冶金分會(huì)2012年會(huì)暨能源計(jì)量與節(jié)能降耗經(jīng)驗(yàn)交流會(huì)論文集[C];2012年

9 楊磊;王貴成;汪勇;張占勝;;SQL Server 2005在數(shù)據(jù)挖掘中的應(yīng)用[A];2009年中國(guó)智能自動(dòng)化會(huì)議論文集(第二分冊(cè))[C];2009年

10 謝中;邱玉輝;;面向商務(wù)網(wǎng)站有效性的數(shù)據(jù)挖掘方法[A];第十八屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2001年

中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前10條

1 本報(bào)記者褚寧;數(shù)據(jù)挖掘如“挖金”[N];解放日?qǐng)?bào);2002年

2 周蓉蓉;數(shù)據(jù)挖掘需要點(diǎn)想像力[N];計(jì)算機(jī)世界;2004年

3 □中國(guó)電信股份有限公司北京研究院 張舒博 □北京郵電大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院 牛琨;走出數(shù)據(jù)挖掘的誤區(qū)[N];人民郵電;2006年

4 《網(wǎng)絡(luò)世界》記者 王瑩;數(shù)據(jù)挖掘保險(xiǎn)業(yè)的新藍(lán)海[N];網(wǎng)絡(luò)世界;2012年

5 劉俊麗;基于地理化的網(wǎng)絡(luò)數(shù)據(jù)挖掘與分析提升投資有效性[N];人民郵電;2014年

6 本報(bào)記者 連曉東;數(shù)據(jù)挖掘:金融信息化新熱點(diǎn)[N];中國(guó)電子報(bào);2002年

7 本報(bào)記者 鳳小華 朱仁康;“數(shù)字挖掘軟件”引領(lǐng)中國(guó)信息化新浪潮[N];中國(guó)電子報(bào);2003年

8 本報(bào)記者 史延廷;“成功企業(yè)數(shù)據(jù)挖掘暨數(shù)量化管理論壇”在京舉辦[N];中國(guó)旅游報(bào);2002年

9 朱小寧;數(shù)據(jù)挖掘:信息化戰(zhàn)爭(zhēng)的基礎(chǔ)工程[N];解放軍報(bào);2005年

10 本報(bào)記者 王小平;從“大集中”走向數(shù)據(jù)挖掘[N];金融時(shí)報(bào);2002年

中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條

1 于自強(qiáng);海量流數(shù)據(jù)挖掘相關(guān)問題研究[D];山東大學(xué);2015年

2 張馨;全基因組SNP芯片應(yīng)用于CNV和L0H分析的軟件比對(duì)與數(shù)據(jù)挖掘[D];復(fù)旦大學(xué);2011年

3 彭計(jì)紅;基于數(shù)據(jù)挖掘的癡呆中醫(yī)證的研究[D];南京中醫(yī)藥大學(xué);2015年

4 李秋虹;基于MapReduce的大規(guī)模數(shù)據(jù)挖掘技術(shù)研究[D];復(fù)旦大學(xué);2013年

5 鄔文帥;基于多目標(biāo)決策的數(shù)據(jù)挖掘方法評(píng)估與應(yīng)用[D];電子科技大學(xué);2015年

6 謝邦彥;整合數(shù)據(jù)挖掘與TRIZ理論的質(zhì)量管理方法研究[D];首都經(jīng)濟(jì)貿(mào)易大學(xué);2010年

7 李榮;生物信息數(shù)據(jù)挖掘若干關(guān)鍵問題研究與應(yīng)用[D];復(fù)旦大學(xué);2004年

8 李玉華;面向服務(wù)的數(shù)據(jù)挖掘關(guān)鍵技術(shù)研究[D];華中科技大學(xué);2006年

9 吳少智;時(shí)間序列數(shù)據(jù)挖掘在生物醫(yī)學(xué)中的應(yīng)用研究[D];電子科技大學(xué);2010年

10 王珊珊;知識(shí)指導(dǎo)下的數(shù)據(jù)挖掘在新聞和金融工具之間因果關(guān)系上的應(yīng)用[D];中國(guó)科學(xué)技術(shù)大學(xué);2009年

中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條

1 林仁紅;基于數(shù)據(jù)挖掘的機(jī)遇識(shí)別與評(píng)價(jià)研究[D];首都經(jīng)濟(jì)貿(mào)易大學(xué);2007年

2 張彥俊;游戲運(yùn)營(yíng)中的數(shù)據(jù)挖掘[D];復(fù)旦大學(xué);2011年

3 焦亞召;基于多核函數(shù)FCM算法在數(shù)據(jù)挖掘聚類中的應(yīng)用研究[D];昆明理工大學(xué);2015年

4 王杰鋒;物聯(lián)網(wǎng)能耗數(shù)據(jù)智能分析及其應(yīng)用平臺(tái)設(shè)計(jì)[D];江南大學(xué);2015年

5 劉學(xué)建;數(shù)據(jù)挖掘在電子商務(wù)推薦系統(tǒng)中的應(yīng)用研究[D];昆明理工大學(xué);2015年

6 戴陽(yáng)陽(yáng);基于數(shù)據(jù)挖掘的金融時(shí)間序列預(yù)測(cè)研究與應(yīng)用[D];江南大學(xué);2015年

7 石思優(yōu);基于主題模型的醫(yī)療數(shù)據(jù)挖掘研究[D];廣東技術(shù)師范學(xué)院;2015年

8 陳丹;移動(dòng)互聯(lián)網(wǎng)信令挖掘?qū)崿F(xiàn)智慧營(yíng)銷的設(shè)計(jì)與實(shí)現(xiàn)應(yīng)用研究[D];華南理工大學(xué);2015年

9 陳思;基于數(shù)據(jù)挖掘的大學(xué)生客戶識(shí)別模型的研究[D];昆明理工大學(xué);2015年

10 位長(zhǎng)帥;基于客戶數(shù)據(jù)挖掘的電信客戶關(guān)系管理研究[D];西南交通大學(xué);2015年

,

本文編號(hào):901477

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/901477.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶4fa25***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
国产精品欧美激情在线| 亚洲熟女诱惑一区二区| 国产性情片一区二区三区| 国产麻豆精品福利在线| 午夜成年人黄片免费观看| 日韩精品毛片视频免费看| 国产精品伦一区二区三区在线| 又黄又硬又爽又色的视频 | 伊人国产精选免费观看在线视频| 日韩色婷婷综合在线观看| 国产精品午夜一区二区三区| 自拍偷女厕所拍偷区亚洲综合| 国产三级视频不卡在线观看| 日韩精品第一区二区三区 | 不卡中文字幕在线视频| 色婷婷日本视频在线观看| 欧美不雅视频午夜福利| 国产免费一区二区不卡| 香港国产三级久久精品三级| 欧美六区视频在线观看| 国产精品刮毛视频不卡| 亚洲中文字幕免费人妻| 欧美一区日韩一区日韩一区| 91偷拍视频久久精品| 大香蕉大香蕉手机在线视频| 国产福利一区二区三区四区| 欧美精品亚洲精品日韩专区| 国产精品一区二区视频| 综合久综合久综合久久| 黑丝国产精品一区二区| 欧美野外在线刺激在线观看| 国产不卡在线免费观看视频| 日本最新不卡免费一区二区| 亚洲最新中文字幕一区| 色无极东京热男人的天堂| 福利专区 久久精品午夜| 91精品视频全国免费| 东京热男人的天堂社区| 欧美成人久久久免费播放| 成人免费在线视频大香蕉| 国产欧美另类激情久久久|