基于機器學習的高校學生成績預測方法研究
發(fā)布時間:2022-01-06 09:42
教育數(shù)據(jù)挖掘是一個綜合了教育心理學、計算機科學和統(tǒng)計學等多學科的新興交叉研究領域。它旨在基于教育領域內不斷累積的海量數(shù)據(jù)資源,運用機器學習、數(shù)據(jù)挖掘、統(tǒng)計與可視化等相關技術和方法來分析和挖掘其中的內在規(guī)律,以期解決教育教學過程中的各種潛在問題,進而提升教育質量。學生成績預測是教育數(shù)據(jù)挖掘領域的熱點研究問題之一,其目的是基于學生的相關信息預測其未來的學習表現(xiàn),例如:分數(shù)、排名、考核等級等。近年來,隨著高校的持續(xù)擴招,在校生人數(shù)逐年增多,因而課堂教學的規(guī)模也越來越大,以致于教師很難跟蹤了解每一位學生的學習情況,從而在一定程度上影響了教學質量。與此同時,各高校每年都有一定數(shù)量的學生出現(xiàn)考試不及格、留級、甚至退學現(xiàn)象,這嚴重影響了學生的未來發(fā)展。在這種背景下,研究構建高效的學生成績預測方法具有重要的應用價值和實踐意義。此前,許多學者已對學生成績預測開展了部分卓有成效的工作。但是,現(xiàn)有的工作仍存在一些不足和尚待解決的挑戰(zhàn)性問題,主要體現(xiàn)在以下三個方面:1)現(xiàn)有研究在進行課程成績預測時大多依賴學生在課程進行中的表現(xiàn)信息,例如:出勤情況、作業(yè)完成情況和課程階段性考核成績等,導致需要在課程開始一段時間...
【文章來源】:山東大學山東省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:106 頁
【學位級別】:博士
【部分圖文】:
圖1-1本文研宄技術路線圖??如圖1-1所示,本文主要開展了以下三個方面的研宄:??1.提出了一種基于課程關聯(lián)性的學生成績預測方法
學生樣本被表示為包含多個課程示例并同時擁有多個標記的數(shù)據(jù)形式,即:??&?=?{足,扮。??多示例的表示形式?多標記同時預測??廣?、?f?、??完成課程1學時夢分::課程性質[*:*?J成新學期待預測課程|??!,?—?j?傳?t ̄J??完成課程2學時學分課程樣質l?成?多?々?|〔新翔龍H賴2〕|??|??!??!學生樣杉?!?!??(完成課程《,?學時 ̄孥分課程性質|:?-成績)?|?f新學期待預測課程j??V?,?丨、?>??圖3-1多示例多標記的學生樣本表示??3.2.2?問題的形式化表示??在本章中,用大寫字母(如:X)表示集合,黑體小寫字母(如:x)表示??向量,非黑體小寫字母(如:x)表示標量;用符號;f和J;分別表示樣本輸入??空間和輸出空間。斜體大寫字母T表示矩陣的轉置操作,除非特別指定,向量??默認為列向量。表3-1中給出了本章所定義的變量及其含義。??因為本文基于學生以往課程學習表現(xiàn)來預測下一學期各科課程的學習情??況。如表3-1所示,令符號(表示學期數(shù)量。高等教育培養(yǎng)計劃中,?茖W制??一般為3年,本科學制4年,對應的i值分別為6和8。令符號p表7F目標學??期,即在此學期開設的課程為預測對象。因為第一學期之前沒有開設任何課程,??所以本文把第二學期作為最初的目標學期,故有2?St。需要注意的是,由??于高等教育中不同專業(yè)的課程設置不相同,因此,本文把不同專業(yè)學生的課程??成績預測工作視為不同的任務。對于某個專業(yè)的建模任務,給定目標學期p,??25??
多示例的表示形式和多門課??程同時建模均給模型性能帶來一定程度的提升。??3.3.5課程信息量對模型性能的影響??如前所述,本文利用學生課程歷史信息來預測其在新學期課程上是否有不??及格風險。由于第一學期之前不存在己完成課程信息,本研宄從第二學期開??始建立課程成績預測模型,此時只有第1個學期的課程信息可用,課程數(shù)量??往往只是個位數(shù)。隨著學生學習過程的推進,課程信息量逐漸增多,為了解課??程信息量對方法性能的影響,本小節(jié)中,以學期為單位展示并分析各方法在??每個數(shù)據(jù)集上的性能。圖3-2、圖3-3和圖3-4分別給出了各個方法在數(shù)據(jù)集??BCS08—11、BET08—11?和?GIM08」0?上的綜合指標?macro-i^.s?的值。??il^MANN??I?EiiBLR??0.8?-?I?-?FFi週?SVM??、?〇?Ir!????:?n?Jljp?1?lL??D?r>,?:?[t]?llj]?II?fl?I?m?Citation-KNN??C?|?JI?1?:?[?l?1?ML-kNN??A?In!?I?I?|?:?|?Our?method??r?|?y?il?I?r?fl??Term2?Term3?Term4?Term5?Term6?Temi7?Term8??圖3-2不同學期各方法在數(shù)據(jù)集BCS08_11上的性能比較??從圖3-2、圖3-3和圖3-4可以看出,在macro-巧.5指標上,本文方法在??多數(shù)情況下取得了最優(yōu)的性能。尤其在預測第2學期的課程時,由于可用課??程的信息量較少,大多數(shù)傳統(tǒng)單示例單標記方法的性能較差,即:在三組數(shù)??據(jù)上的macroi^值均低于0.6。然而
【參考文獻】:
期刊論文
[1]當代大學生學習動機的特征及其對學業(yè)成績的影響[J]. 高秀梅. 高教探索. 2020(01)
[2]基于模糊聚類和支持向量回歸的成績預測[J]. 申航杰,琚生根,孫界平. 華東師范大學學報(自然科學版). 2019(05)
[3]學生成績關鍵因素挖掘與成績預測[J]. 謝娟英,張宜,陳恩紅. 南京信息工程大學學報(自然科學版). 2019(03)
[4]ARPDF:基于對話流的學習者成績等級預測算法[J]. 羅達雄,葉俊民,郭霄宇,王志鋒,陳曙. 小型微型計算機系統(tǒng). 2019(02)
[5]大學生大五人格特征與英語學習之間的關系研究[J]. 楊蘊楨,黃芳,趙雯. 臺州學院學報. 2018(06)
[6]基于改進的聚類和關聯(lián)規(guī)則挖掘的學生成績分析[J]. 張?zhí)?尹長川,潘林,安杰. 北京郵電大學學報(社會科學版). 2018(02)
[7]專業(yè)興趣吻合度 大五人格對大學生學習成績的影響[J]. 李艷. 校園心理. 2018(02)
[8]利用電子簽到數(shù)據(jù)預測課程成績[J]. 劉俊嶺,李婷,孫煥良,于戈. 計算機科學與探索. 2018(06)
[9]面向在線智慧學習的教育數(shù)據(jù)挖掘技術研究[J]. 劉淇,陳恩紅,朱天宇,黃振亞,吳潤澤,蘇喻,胡國平. 模式識別與人工智能. 2018(01)
[10]基于校園卡消費預測學生掛科情況[J]. 周慶,尹春梅,全文君,張代英. 中國教育技術裝備. 2017(24)
博士論文
[1]大數(shù)據(jù)的教育領域應用之研究[D]. 張燕南.華東師范大學 2016
本文編號:3572218
【文章來源】:山東大學山東省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:106 頁
【學位級別】:博士
【部分圖文】:
圖1-1本文研宄技術路線圖??如圖1-1所示,本文主要開展了以下三個方面的研宄:??1.提出了一種基于課程關聯(lián)性的學生成績預測方法
學生樣本被表示為包含多個課程示例并同時擁有多個標記的數(shù)據(jù)形式,即:??&?=?{足,扮。??多示例的表示形式?多標記同時預測??廣?、?f?、??完成課程1學時夢分::課程性質[*:*?J成新學期待預測課程|??!,?—?j?傳?t ̄J??完成課程2學時學分課程樣質l?成?多?々?|〔新翔龍H賴2〕|??|??!??!學生樣杉?!?!??(完成課程《,?學時 ̄孥分課程性質|:?-成績)?|?f新學期待預測課程j??V?,?丨、?>??圖3-1多示例多標記的學生樣本表示??3.2.2?問題的形式化表示??在本章中,用大寫字母(如:X)表示集合,黑體小寫字母(如:x)表示??向量,非黑體小寫字母(如:x)表示標量;用符號;f和J;分別表示樣本輸入??空間和輸出空間。斜體大寫字母T表示矩陣的轉置操作,除非特別指定,向量??默認為列向量。表3-1中給出了本章所定義的變量及其含義。??因為本文基于學生以往課程學習表現(xiàn)來預測下一學期各科課程的學習情??況。如表3-1所示,令符號(表示學期數(shù)量。高等教育培養(yǎng)計劃中,?茖W制??一般為3年,本科學制4年,對應的i值分別為6和8。令符號p表7F目標學??期,即在此學期開設的課程為預測對象。因為第一學期之前沒有開設任何課程,??所以本文把第二學期作為最初的目標學期,故有2?St。需要注意的是,由??于高等教育中不同專業(yè)的課程設置不相同,因此,本文把不同專業(yè)學生的課程??成績預測工作視為不同的任務。對于某個專業(yè)的建模任務,給定目標學期p,??25??
多示例的表示形式和多門課??程同時建模均給模型性能帶來一定程度的提升。??3.3.5課程信息量對模型性能的影響??如前所述,本文利用學生課程歷史信息來預測其在新學期課程上是否有不??及格風險。由于第一學期之前不存在己完成課程信息,本研宄從第二學期開??始建立課程成績預測模型,此時只有第1個學期的課程信息可用,課程數(shù)量??往往只是個位數(shù)。隨著學生學習過程的推進,課程信息量逐漸增多,為了解課??程信息量對方法性能的影響,本小節(jié)中,以學期為單位展示并分析各方法在??每個數(shù)據(jù)集上的性能。圖3-2、圖3-3和圖3-4分別給出了各個方法在數(shù)據(jù)集??BCS08—11、BET08—11?和?GIM08」0?上的綜合指標?macro-i^.s?的值。??il^MANN??I?EiiBLR??0.8?-?I?-?FFi週?SVM??、?〇?Ir!????:?n?Jljp?1?lL??D?r>,?:?[t]?llj]?II?fl?I?m?Citation-KNN??C?|?JI?1?:?[?l?1?ML-kNN??A?In!?I?I?|?:?|?Our?method??r?|?y?il?I?r?fl??Term2?Term3?Term4?Term5?Term6?Temi7?Term8??圖3-2不同學期各方法在數(shù)據(jù)集BCS08_11上的性能比較??從圖3-2、圖3-3和圖3-4可以看出,在macro-巧.5指標上,本文方法在??多數(shù)情況下取得了最優(yōu)的性能。尤其在預測第2學期的課程時,由于可用課??程的信息量較少,大多數(shù)傳統(tǒng)單示例單標記方法的性能較差,即:在三組數(shù)??據(jù)上的macroi^值均低于0.6。然而
【參考文獻】:
期刊論文
[1]當代大學生學習動機的特征及其對學業(yè)成績的影響[J]. 高秀梅. 高教探索. 2020(01)
[2]基于模糊聚類和支持向量回歸的成績預測[J]. 申航杰,琚生根,孫界平. 華東師范大學學報(自然科學版). 2019(05)
[3]學生成績關鍵因素挖掘與成績預測[J]. 謝娟英,張宜,陳恩紅. 南京信息工程大學學報(自然科學版). 2019(03)
[4]ARPDF:基于對話流的學習者成績等級預測算法[J]. 羅達雄,葉俊民,郭霄宇,王志鋒,陳曙. 小型微型計算機系統(tǒng). 2019(02)
[5]大學生大五人格特征與英語學習之間的關系研究[J]. 楊蘊楨,黃芳,趙雯. 臺州學院學報. 2018(06)
[6]基于改進的聚類和關聯(lián)規(guī)則挖掘的學生成績分析[J]. 張?zhí)?尹長川,潘林,安杰. 北京郵電大學學報(社會科學版). 2018(02)
[7]專業(yè)興趣吻合度 大五人格對大學生學習成績的影響[J]. 李艷. 校園心理. 2018(02)
[8]利用電子簽到數(shù)據(jù)預測課程成績[J]. 劉俊嶺,李婷,孫煥良,于戈. 計算機科學與探索. 2018(06)
[9]面向在線智慧學習的教育數(shù)據(jù)挖掘技術研究[J]. 劉淇,陳恩紅,朱天宇,黃振亞,吳潤澤,蘇喻,胡國平. 模式識別與人工智能. 2018(01)
[10]基于校園卡消費預測學生掛科情況[J]. 周慶,尹春梅,全文君,張代英. 中國教育技術裝備. 2017(24)
博士論文
[1]大數(shù)據(jù)的教育領域應用之研究[D]. 張燕南.華東師范大學 2016
本文編號:3572218
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3572218.html
最近更新
教材專著