基于改進隨機森林算法的研究與應用
發(fā)布時間:2023-03-19 15:02
在高校教學管理工作中,學校教學質量優(yōu)劣重要評估指標之一是學生課程成績,存在多種因素影響學生課程成績。利用數(shù)據(jù)挖掘工具對學生的學習課程成績進行預測分析,進而利用預測分析結果及時指正學生出現(xiàn)的不良學習行為,同時檢查老師的教學效果,這具有非常重要的研究意義。為了完成學生課程成績預測工作,本文首先對于傳統(tǒng)隨機森林算法的研究現(xiàn)狀進行分析,并結合模擬退火算法提出在特征選擇、參數(shù)優(yōu)化以及權重設定方向進行優(yōu)化的改進隨機森林算法IRFC(Improved Random Forest Classifier)。改進的隨機森林算法對于相關參數(shù)(特征個數(shù)、樹規(guī)模、樹決策權重)進行二進制編碼作為算法優(yōu)化的目標變量,并以袋外誤差(Out of Bag,OOB)作為優(yōu)化目標函數(shù),全面優(yōu)化算法分類性能。在進行改進隨機森林算法的驗證過程中,作者采集多年歷史學生行為記錄以及學科成績(三年數(shù)據(jù))構造學生成績數(shù)據(jù)集,從而根據(jù)學生行為信息進行學生成績(兩類:合格與不合格)預測的工作。目前已經(jīng)完成改進隨機森林算法在此數(shù)據(jù)集以及心臟病數(shù)據(jù)集兩個數(shù)據(jù)集上的仿真驗證工作,實驗結果證明本文提出改進隨機森林算法具有更高的泛化能力、較小的OO...
【文章頁數(shù)】:62 頁
【學位級別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 研究背景
1.2 研究現(xiàn)狀
1.2.1 教育數(shù)據(jù)挖掘
1.2.2 數(shù)據(jù)挖掘算法
1.3 研究目標與方向
1.3.1 關鍵技術路線
1.3.2 本文主要工作
1.4 論文結構安排
第2章 相關背景及技術
2.1 理論介紹
2.1.1 分類算法
2.1.2 決策樹算法
2.1.3 隨機森林算法
2.1.4 模擬退火算法
2.2 分類算法評價指標
2.3 數(shù)據(jù)平臺技術
2.3.1 R語言
2.3.2 PostgreSQL數(shù)據(jù)庫
2.4 本章小結
第3章 改進算法介紹
3.1 傳統(tǒng)隨機森林算法
3.1.1 Bagging方法
3.1.2 CART算法
3.1.3 隨機森林算法流程
3.2 改進算法
3.2.1 改進思路
3.2.2 改進算法流程
3.3 本章小結
第4章 UCI數(shù)據(jù)集上的算法評估
4.1 UCI數(shù)據(jù)集
4.2 算法基礎評估
4.3 本章小結
第5章 算法在學生課程成績預測上的應用
5.1 學生成績數(shù)據(jù)集說明
5.1.1 特征規(guī)范化
5.1.2 傳統(tǒng)算法結果對比
5.2 平臺環(huán)境
5.3 算法評估
5.3.1 算法基礎評估
5.3.2 最優(yōu)參數(shù)決策時長分析
5.3.3 特征選擇結果分析
5.3.4 OOB誤差分析
5.3.5 算法并行化對比
5.4 本章小結
第6章 總結與展望
6.1 總結
6.2 展望
參考文獻
致謝
個人簡歷及在學期間發(fā)表的學術論文與研究成果
本文編號:3765459
【文章頁數(shù)】:62 頁
【學位級別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 研究背景
1.2 研究現(xiàn)狀
1.2.1 教育數(shù)據(jù)挖掘
1.2.2 數(shù)據(jù)挖掘算法
1.3 研究目標與方向
1.3.1 關鍵技術路線
1.3.2 本文主要工作
1.4 論文結構安排
第2章 相關背景及技術
2.1 理論介紹
2.1.1 分類算法
2.1.2 決策樹算法
2.1.3 隨機森林算法
2.1.4 模擬退火算法
2.2 分類算法評價指標
2.3 數(shù)據(jù)平臺技術
2.3.1 R語言
2.3.2 PostgreSQL數(shù)據(jù)庫
2.4 本章小結
第3章 改進算法介紹
3.1 傳統(tǒng)隨機森林算法
3.1.1 Bagging方法
3.1.2 CART算法
3.1.3 隨機森林算法流程
3.2 改進算法
3.2.1 改進思路
3.2.2 改進算法流程
3.3 本章小結
第4章 UCI數(shù)據(jù)集上的算法評估
4.1 UCI數(shù)據(jù)集
4.2 算法基礎評估
4.3 本章小結
第5章 算法在學生課程成績預測上的應用
5.1 學生成績數(shù)據(jù)集說明
5.1.1 特征規(guī)范化
5.1.2 傳統(tǒng)算法結果對比
5.2 平臺環(huán)境
5.3 算法評估
5.3.1 算法基礎評估
5.3.2 最優(yōu)參數(shù)決策時長分析
5.3.3 特征選擇結果分析
5.3.4 OOB誤差分析
5.3.5 算法并行化對比
5.4 本章小結
第6章 總結與展望
6.1 總結
6.2 展望
參考文獻
致謝
個人簡歷及在學期間發(fā)表的學術論文與研究成果
本文編號:3765459
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3765459.html
最近更新
教材專著