基于多策略的高校助學金精準預測的研究與應用
發(fā)布時間:2024-05-13 04:35
近年來隨著高等教育的普及,高校人數(shù)也隨之激增。同時對于高校中經濟有一定困難的學生,黨和政府也下發(fā)了一系列文件來幫助困難學生,使他們順利完成學業(yè)。當前高校決定是否資助貧困生以及確定資助學生的助學金發(fā)放等級是按照“學生申請—老師簽字—學校審批”的程序來進行的,這樣的程序不可避免的會受到一些人為因素的影響。與此同時,隨著大數(shù)據(jù)和互聯(lián)網時代的到來為高校處理精準資助問題提供了新的思路和技術支持。本論文采用四川某高校2013—2015兩年的學生在校行作為數(shù)據(jù)挖掘對象,使用數(shù)據(jù)挖掘技術和機器學習算法建立高校助學金精準預測模型并以F1值作為該模型的評估指標。本文首先進行數(shù)據(jù)預處理,接著進行探索性數(shù)據(jù)分析和特征工程以期獲得優(yōu)秀的特征數(shù)據(jù)。隨后通過交叉驗證法校驗模型精度,并在模型構建過程中對比了隨機森林算法、AdaBoost算法、支持向量機以及GBDT算法在助學金精準預測模型上的效果,初步發(fā)現(xiàn)GBDT算法效果相對最優(yōu)。為了進一步提高助學金預測模型的性能,本文利用集成學習中的Stacking方法進行多模型融合,最后結合GBDT算法,AdaBoost算法和隨機森林算法通過一定比例融合由此進一步提升了模型的性能...
【文章頁數(shù)】:61 頁
【學位級別】:碩士
【部分圖文】:
本文編號:3972386
【文章頁數(shù)】:61 頁
【學位級別】:碩士
【部分圖文】:
圖2.1二分類間隔最大分離平面圖
圖2.1二分類間隔最大分離平面圖撐向量對于確立分離超平面很關鍵,因此將這種分類模支撐向量一般情況下并不會太多,所以SVM是由較少基本模型推導類數(shù)據(jù)為例,已知訓練樣本集(x,y),i1,2,,l,xR,niix)b0,為使分界面具備分類間隔且對所有樣....
圖2.2支持向量機體系結構
ljijjjibyyaxx1()上述公式中下標{0}jjja。因此最優(yōu)分類超平面為()wx類函數(shù)則為:nljjjjifxwxbayxxbxR()sgn{()}sgn{(())},*1*線性不可分的情況下,支持向量機主要思路是將輸....
圖2.3有放回抽樣
第2章基礎算法綜述獎,也因為其state-of-art的特性成為了分類算法的首選領域得到了大規(guī)模應用,也是目前比較熱門的科研算法之domForest基本模型推導林的構建主要為以下三點:顆決策樹均通過抽樣產生對應的訓練集練集均對應一棵決策樹,若需要構建n棵決策樹,則....
圖2.4隨機森林算法示意圖
第2章基礎算法綜述用公式計算每個變量的基尼指數(shù),接著按基尼指數(shù)最小的原則,選取一個變量進行切分,最后通過遞歸的形式,構建決策樹,從而產生分類規(guī)則。在CART算法中,產生葉子節(jié)點的規(guī)則主要有:1)決策樹的深度大于用戶設定的值;2)當前數(shù)據(jù)集的屬性變量為0;3)當前數(shù)....
本文編號:3972386
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3972386.html