基于決策樹技術的教育數據挖掘研究與應用
發(fā)布時間:2021-02-20 17:00
伴隨著九年義務教育制度的實施,一些發(fā)達地區(qū)進一步將高中教育也納入到義務教育范圍之內,從而推行了十二年義務教育。高校擴招,使得有更多的學生有機會進入大學學習,因此高中教育已成為絕大部分學生的必經階段,從而導致在教務管理系統(tǒng)中積累了大量的學生數據,占用了很大的存儲空間。如果能充分利用教務管理系統(tǒng)中的數據,那么我們不僅可以更好地了解現狀,而且還可以對未來做出部分預測和輔助決策。如教師除了能根據學生數據了解學生現狀,同時還能根據分析結果進行因材施教,改善教學效果。作為數據挖掘的一個重要分支,教育數據挖掘(EducationData Mining,簡稱EDM)是關于怎樣從大量的學生數據中挖掘出潛在的、有價值的信息,已經引起了相關學者的興趣和關注。教育數據挖掘就是利用數學方法和計算機技術從浩繁的教育數據中挖掘出具有利用價值的信息,提高教學質量和教育管理水平。本學位論文的主要工作是利用決策樹技術分析多值決策表,并對所生成的決策樹進行優(yōu)化存儲。根據教務管理系統(tǒng)中常見的多值決策表分析影響學生考試成績的因素,以及通過生成的決策樹對即將參加高考的學生進行成績預測,有針對性地采取措施,提高學生的學習效率、教師...
【文章來源】:浙江師范大學浙江省
【文章頁數】:56 頁
【學位級別】:碩士
【部分圖文】:
-}ID3算法處理流程
分割離散化。以信息增益率(Information?Gain?Ratio)作為選擇測試屬性的參考依據,這??和ID3算法存在明顯差異,信息増益率是信息增益與分裂信息度量的比值。C4.5算??法的處理流程見圖2-3。??創(chuàng)建一個節(jié)點N?? ̄^返回節(jié)點iT]——??In????有記錄都屬于同^>?^?_??丨力?點、??Y?J標記N為數據??3集的多數類??N??^?將?性—??在侯選屬性集中找出信??—息增益率最大的屬性標??記節(jié)點N??用后剪枝方法進行剪枝??圖2-3?C4.5算法處理流程??雖然C4.5算法很大程度上彌補了?ID3算法的缺陷,且建模速度比較快、分類準??確率比較高。但是它仍然具有一些難以忽視的不足,如在通常情況下,選擇屬性往往??12??
其代表了一個決策,每個非葉子節(jié)每個非葉子節(jié)點出發(fā)的輸出邊用不同的非兩條邊。??造的決策樹,v是r的節(jié)點。節(jié)點v和r唯一的r的子表與之對應。我們定義表r節(jié)點,那么r(v)=r,即子表r(v)與r是一,S?〇,屬性九...,爲和屬性值Su?...,點和邊。如果對于r的任何節(jié)點V滿足以化表,那么v被標記為r(v)的常用決策;??退化的,那么v用,e五(r(v))表示,假.大條輸出邊為ai,,似。??
【參考文獻】:
期刊論文
[1]教育數據挖掘工具綜述[J]. 斯特凡·斯萊特,斯萬克·約克西莫維奇,維特梅·科萬諾維奇,萊恩·貝克,德拉甘·加斯維奇,崔鑫,王靖. 開放學習研究. 2018(01)
[2]基于多值決策圖的多狀態(tài)線性consecutive-k-out-of-n系統(tǒng)的性能分析[J]. 喬瑩,許美玲,鐘發(fā)榮,莫毓昌. 南通大學學報(自然科學版). 2016(04)
[3]C4.5算法在高校計算機等級考試成績分析中的研究[J]. 程代娣. 淮北師范大學學報(自然科學版). 2016(01)
[4]決策樹技術在高職院校學生成績分析中的應用研究[J]. 王平霞,郝志廷. 電腦知識與技術. 2013(13)
[5]改進的ID3算法在高校就業(yè)系統(tǒng)中的應用分析[J]. 唐一,馬征. 科技情報開發(fā)與經濟. 2011(04)
[6]國內外教育數據挖掘研究現狀及趨勢分析[J]. 李婷,傅鋼善. 現代教育技術. 2010(10)
[7]數據挖掘在中國教育領域的應用研究綜述[J]. 李汪麗,蔣玲. 湖北第二師范學院學報. 2010(02)
博士論文
[1]大數據的教育領域應用之研究[D]. 張燕南.華東師范大學 2016
碩士論文
[1]學生評教數據知識挖掘方法應用研究[D]. 李麗芳.華南理工大學 2015
[2]決策樹與關聯分析在高職院校教學管理中的應用研究[D]. 張波.安徽大學 2013
[3]基于決策樹算法的學生成績挖掘與分析[D]. 王迎云.安徽大學 2012
[4]改進的C4.5決策樹算法研究及在高考成績預測分析中的應用[D]. 周琦.廣西大學 2012
[5]改進的ID3決策樹分類算法在成績分析中的應用研究[D]. 牛文穎.大連交通大學 2008
[6]決策樹優(yōu)化算法研究[D]. 何箭.合肥工業(yè)大學 2004
本文編號:3043066
【文章來源】:浙江師范大學浙江省
【文章頁數】:56 頁
【學位級別】:碩士
【部分圖文】:
-}ID3算法處理流程
分割離散化。以信息增益率(Information?Gain?Ratio)作為選擇測試屬性的參考依據,這??和ID3算法存在明顯差異,信息増益率是信息增益與分裂信息度量的比值。C4.5算??法的處理流程見圖2-3。??創(chuàng)建一個節(jié)點N?? ̄^返回節(jié)點iT]——??In????有記錄都屬于同^>?^?_??丨力?點、??Y?J標記N為數據??3集的多數類??N??^?將?性—??在侯選屬性集中找出信??—息增益率最大的屬性標??記節(jié)點N??用后剪枝方法進行剪枝??圖2-3?C4.5算法處理流程??雖然C4.5算法很大程度上彌補了?ID3算法的缺陷,且建模速度比較快、分類準??確率比較高。但是它仍然具有一些難以忽視的不足,如在通常情況下,選擇屬性往往??12??
其代表了一個決策,每個非葉子節(jié)每個非葉子節(jié)點出發(fā)的輸出邊用不同的非兩條邊。??造的決策樹,v是r的節(jié)點。節(jié)點v和r唯一的r的子表與之對應。我們定義表r節(jié)點,那么r(v)=r,即子表r(v)與r是一,S?〇,屬性九...,爲和屬性值Su?...,點和邊。如果對于r的任何節(jié)點V滿足以化表,那么v被標記為r(v)的常用決策;??退化的,那么v用,e五(r(v))表示,假.大條輸出邊為ai,,似。??
【參考文獻】:
期刊論文
[1]教育數據挖掘工具綜述[J]. 斯特凡·斯萊特,斯萬克·約克西莫維奇,維特梅·科萬諾維奇,萊恩·貝克,德拉甘·加斯維奇,崔鑫,王靖. 開放學習研究. 2018(01)
[2]基于多值決策圖的多狀態(tài)線性consecutive-k-out-of-n系統(tǒng)的性能分析[J]. 喬瑩,許美玲,鐘發(fā)榮,莫毓昌. 南通大學學報(自然科學版). 2016(04)
[3]C4.5算法在高校計算機等級考試成績分析中的研究[J]. 程代娣. 淮北師范大學學報(自然科學版). 2016(01)
[4]決策樹技術在高職院校學生成績分析中的應用研究[J]. 王平霞,郝志廷. 電腦知識與技術. 2013(13)
[5]改進的ID3算法在高校就業(yè)系統(tǒng)中的應用分析[J]. 唐一,馬征. 科技情報開發(fā)與經濟. 2011(04)
[6]國內外教育數據挖掘研究現狀及趨勢分析[J]. 李婷,傅鋼善. 現代教育技術. 2010(10)
[7]數據挖掘在中國教育領域的應用研究綜述[J]. 李汪麗,蔣玲. 湖北第二師范學院學報. 2010(02)
博士論文
[1]大數據的教育領域應用之研究[D]. 張燕南.華東師范大學 2016
碩士論文
[1]學生評教數據知識挖掘方法應用研究[D]. 李麗芳.華南理工大學 2015
[2]決策樹與關聯分析在高職院校教學管理中的應用研究[D]. 張波.安徽大學 2013
[3]基于決策樹算法的學生成績挖掘與分析[D]. 王迎云.安徽大學 2012
[4]改進的C4.5決策樹算法研究及在高考成績預測分析中的應用[D]. 周琦.廣西大學 2012
[5]改進的ID3決策樹分類算法在成績分析中的應用研究[D]. 牛文穎.大連交通大學 2008
[6]決策樹優(yōu)化算法研究[D]. 何箭.合肥工業(yè)大學 2004
本文編號:3043066
本文鏈接:http://sikaile.net/jiaoyulunwen/xueshengguanli/3043066.html