基于教育數(shù)據(jù)挖掘的高校學(xué)生學(xué)業(yè)表現(xiàn)建模研究
發(fā)布時(shí)間:2021-08-23 14:28
在分析國(guó)內(nèi)外研究的基礎(chǔ)上,提出從社會(huì)及人口統(tǒng)計(jì)特征、學(xué)校環(huán)境、個(gè)人特征和學(xué)生投入等四個(gè)維度構(gòu)建高校學(xué)生學(xué)業(yè)表現(xiàn)研究框架。以A大學(xué)為例,構(gòu)建整合型教育數(shù)據(jù)系統(tǒng),基于不同數(shù)據(jù)來(lái)源,應(yīng)用決策樹(shù)、貝葉斯網(wǎng)絡(luò)、人工神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)分別建立分類(lèi)模型,并對(duì)模型有效性進(jìn)行評(píng)判。結(jié)果表明,所建立的高校學(xué)生學(xué)業(yè)表現(xiàn)分類(lèi)模型具有一定的有效性和實(shí)用價(jià)值,可為高校應(yīng)用教育數(shù)據(jù)挖掘進(jìn)行科學(xué)管理和完善學(xué)業(yè)支持體系提供參考。
【文章來(lái)源】:黑龍江高教研究. 2020,38(02)北大核心
【文章頁(yè)數(shù)】:6 頁(yè)
【部分圖文】:
高校學(xué)生學(xué)業(yè)表現(xiàn)研究框架
整合型教育數(shù)據(jù)系統(tǒng)將分散在高校各種管理信息系統(tǒng)、業(yè)務(wù)處理系統(tǒng)、問(wèn)卷調(diào)查系統(tǒng)中的數(shù)據(jù),經(jīng)過(guò)篩選、清理、轉(zhuǎn)換后,集中存儲(chǔ),統(tǒng)一進(jìn)行管理。整合型教育數(shù)據(jù)系統(tǒng)分為數(shù)據(jù)源、數(shù)據(jù)整合和數(shù)據(jù)應(yīng)用等三個(gè)層次,總體結(jié)構(gòu)見(jiàn)圖2。數(shù)據(jù)源層包括學(xué)校中的各類(lèi)管理信息系統(tǒng)中的數(shù)據(jù)、問(wèn)卷調(diào)查數(shù)據(jù)和其他相關(guān)數(shù)據(jù),這個(gè)層次中的數(shù)據(jù)有以下四個(gè)特征:一是數(shù)據(jù)存儲(chǔ)類(lèi)型不一致;二是數(shù)據(jù)標(biāo)準(zhǔn)不一致;三是數(shù)據(jù)更新頻度不一致;四是數(shù)據(jù)采集難度不一致。數(shù)據(jù)整合層是經(jīng)過(guò)處理過(guò)后的數(shù)據(jù),有以下三個(gè)特征:一是數(shù)據(jù)標(biāo)準(zhǔn)化,不同數(shù)據(jù)源對(duì)于同一對(duì)象的表示采用統(tǒng)一的標(biāo)準(zhǔn),比如性別統(tǒng)一為1(男)和0(女);二是面向主題,可以依據(jù)不同的主題分為學(xué)生主題數(shù)據(jù)、教師主題數(shù)據(jù)、課程主題數(shù)據(jù)等;三是數(shù)據(jù)穩(wěn)定性,進(jìn)入數(shù)據(jù)整合層,各主題庫(kù)的數(shù)據(jù)是與業(yè)務(wù)處理系統(tǒng)分離的,數(shù)據(jù)在一段時(shí)間內(nèi)幾乎不變動(dòng),相對(duì)較為穩(wěn)定。數(shù)據(jù)整合層是整合型教育數(shù)據(jù)系統(tǒng)的核心,其中,各主題數(shù)據(jù)庫(kù)(數(shù)據(jù)集市)需要進(jìn)行設(shè)計(jì)。數(shù)據(jù)應(yīng)用層包括數(shù)據(jù)可視化和教育數(shù)據(jù)挖掘等。在該層中,用戶(hù)直接運(yùn)用相關(guān)工具軟件對(duì)數(shù)據(jù)整合層的數(shù)據(jù)進(jìn)行查詢(xún)、統(tǒng)計(jì)、分析、可視化和數(shù)據(jù)建模,相關(guān)結(jié)果不影響數(shù)據(jù)整合層中的數(shù)據(jù),但當(dāng)用戶(hù)在進(jìn)行數(shù)據(jù)應(yīng)用,發(fā)現(xiàn)需要補(bǔ)充或更新數(shù)據(jù)時(shí),數(shù)據(jù)整合層再?gòu)臄?shù)據(jù)源層采集數(shù)據(jù),并進(jìn)行清洗、存儲(chǔ),更新主題數(shù)據(jù)庫(kù)。
表2 基于整合型教育數(shù)據(jù)系統(tǒng)全部數(shù)據(jù)的支持向量機(jī)分類(lèi)模型評(píng)價(jià)指標(biāo) 分類(lèi)器 數(shù)據(jù)集 正確率 精確度 靈敏度 F1 學(xué)業(yè)表現(xiàn)優(yōu)秀 訓(xùn)練集 99.35% 100.00% 100.00% 1.00 測(cè)試集 75.68% 52.17% 44.44% 0.48 學(xué)業(yè)表現(xiàn)良好 訓(xùn)練集 99.35% 100.00% 100.00% 1.00 測(cè)試集 60.36% 51.22% 47.73% 0.49 學(xué)業(yè)表現(xiàn)一般 訓(xùn)練集 95.47% 93.88% 83.64% 0.88 測(cè)試集 90.99% 100.00% 70.00% 0.82 學(xué)業(yè)表現(xiàn)較低 訓(xùn)練集 95.79% 90.32% 77.78% 0.83 測(cè)試集 97.30% 100.00% 80.00% 0.88表2和圖3分別為整合型教育數(shù)據(jù)系統(tǒng)全部數(shù)據(jù)的支持向量機(jī)分類(lèi)模型的評(píng)價(jià)指標(biāo)和ROC曲線(xiàn),我們可以發(fā)現(xiàn),“學(xué)業(yè)表現(xiàn)優(yōu)秀”和“學(xué)業(yè)表現(xiàn)良好”兩個(gè)分類(lèi)器訓(xùn)練的精確度和靈敏度、F1都達(dá)到100%,但測(cè)試集F1值都只有0.5不到,說(shuō)明這兩個(gè)分類(lèi)器極其有效但不穩(wěn)定,存在過(guò)擬合現(xiàn)象!皩W(xué)業(yè)表現(xiàn)一般”和“學(xué)業(yè)表現(xiàn)較低”分類(lèi)器的F1值均穩(wěn)定在0.8以上?傮w而言,該模型是一個(gè)比較好的學(xué)生學(xué)業(yè)表現(xiàn)分類(lèi)模型。
【參考文獻(xiàn)】:
期刊論文
[1]以學(xué)為本,提高質(zhì)量,內(nèi)涵發(fā)展:中國(guó)大學(xué)生學(xué)情研究的學(xué)術(shù)涵義與政策價(jià)值[J]. 史靜寰,王文. 華東師范大學(xué)學(xué)報(bào)(教育科學(xué)版). 2018(04)
[2]基于教育數(shù)據(jù)挖掘?qū)W生表現(xiàn)預(yù)測(cè)模型構(gòu)建研究[J]. 彭濤,丁凌云. 黑龍江高教研究. 2015(11)
[3]基于教育數(shù)據(jù)挖掘的大學(xué)生學(xué)習(xí)成果分析[J]. 舒忠梅,屈瓊斐. 東北大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版). 2014(03)
[4]未完成的轉(zhuǎn)型——普及化階段首都高等教育的人才培養(yǎng)與學(xué)生發(fā)展[J]. 鮑威. 北京大學(xué)教育評(píng)論. 2010(01)
本文編號(hào):3358041
【文章來(lái)源】:黑龍江高教研究. 2020,38(02)北大核心
【文章頁(yè)數(shù)】:6 頁(yè)
【部分圖文】:
高校學(xué)生學(xué)業(yè)表現(xiàn)研究框架
整合型教育數(shù)據(jù)系統(tǒng)將分散在高校各種管理信息系統(tǒng)、業(yè)務(wù)處理系統(tǒng)、問(wèn)卷調(diào)查系統(tǒng)中的數(shù)據(jù),經(jīng)過(guò)篩選、清理、轉(zhuǎn)換后,集中存儲(chǔ),統(tǒng)一進(jìn)行管理。整合型教育數(shù)據(jù)系統(tǒng)分為數(shù)據(jù)源、數(shù)據(jù)整合和數(shù)據(jù)應(yīng)用等三個(gè)層次,總體結(jié)構(gòu)見(jiàn)圖2。數(shù)據(jù)源層包括學(xué)校中的各類(lèi)管理信息系統(tǒng)中的數(shù)據(jù)、問(wèn)卷調(diào)查數(shù)據(jù)和其他相關(guān)數(shù)據(jù),這個(gè)層次中的數(shù)據(jù)有以下四個(gè)特征:一是數(shù)據(jù)存儲(chǔ)類(lèi)型不一致;二是數(shù)據(jù)標(biāo)準(zhǔn)不一致;三是數(shù)據(jù)更新頻度不一致;四是數(shù)據(jù)采集難度不一致。數(shù)據(jù)整合層是經(jīng)過(guò)處理過(guò)后的數(shù)據(jù),有以下三個(gè)特征:一是數(shù)據(jù)標(biāo)準(zhǔn)化,不同數(shù)據(jù)源對(duì)于同一對(duì)象的表示采用統(tǒng)一的標(biāo)準(zhǔn),比如性別統(tǒng)一為1(男)和0(女);二是面向主題,可以依據(jù)不同的主題分為學(xué)生主題數(shù)據(jù)、教師主題數(shù)據(jù)、課程主題數(shù)據(jù)等;三是數(shù)據(jù)穩(wěn)定性,進(jìn)入數(shù)據(jù)整合層,各主題庫(kù)的數(shù)據(jù)是與業(yè)務(wù)處理系統(tǒng)分離的,數(shù)據(jù)在一段時(shí)間內(nèi)幾乎不變動(dòng),相對(duì)較為穩(wěn)定。數(shù)據(jù)整合層是整合型教育數(shù)據(jù)系統(tǒng)的核心,其中,各主題數(shù)據(jù)庫(kù)(數(shù)據(jù)集市)需要進(jìn)行設(shè)計(jì)。數(shù)據(jù)應(yīng)用層包括數(shù)據(jù)可視化和教育數(shù)據(jù)挖掘等。在該層中,用戶(hù)直接運(yùn)用相關(guān)工具軟件對(duì)數(shù)據(jù)整合層的數(shù)據(jù)進(jìn)行查詢(xún)、統(tǒng)計(jì)、分析、可視化和數(shù)據(jù)建模,相關(guān)結(jié)果不影響數(shù)據(jù)整合層中的數(shù)據(jù),但當(dāng)用戶(hù)在進(jìn)行數(shù)據(jù)應(yīng)用,發(fā)現(xiàn)需要補(bǔ)充或更新數(shù)據(jù)時(shí),數(shù)據(jù)整合層再?gòu)臄?shù)據(jù)源層采集數(shù)據(jù),并進(jìn)行清洗、存儲(chǔ),更新主題數(shù)據(jù)庫(kù)。
表2 基于整合型教育數(shù)據(jù)系統(tǒng)全部數(shù)據(jù)的支持向量機(jī)分類(lèi)模型評(píng)價(jià)指標(biāo) 分類(lèi)器 數(shù)據(jù)集 正確率 精確度 靈敏度 F1 學(xué)業(yè)表現(xiàn)優(yōu)秀 訓(xùn)練集 99.35% 100.00% 100.00% 1.00 測(cè)試集 75.68% 52.17% 44.44% 0.48 學(xué)業(yè)表現(xiàn)良好 訓(xùn)練集 99.35% 100.00% 100.00% 1.00 測(cè)試集 60.36% 51.22% 47.73% 0.49 學(xué)業(yè)表現(xiàn)一般 訓(xùn)練集 95.47% 93.88% 83.64% 0.88 測(cè)試集 90.99% 100.00% 70.00% 0.82 學(xué)業(yè)表現(xiàn)較低 訓(xùn)練集 95.79% 90.32% 77.78% 0.83 測(cè)試集 97.30% 100.00% 80.00% 0.88表2和圖3分別為整合型教育數(shù)據(jù)系統(tǒng)全部數(shù)據(jù)的支持向量機(jī)分類(lèi)模型的評(píng)價(jià)指標(biāo)和ROC曲線(xiàn),我們可以發(fā)現(xiàn),“學(xué)業(yè)表現(xiàn)優(yōu)秀”和“學(xué)業(yè)表現(xiàn)良好”兩個(gè)分類(lèi)器訓(xùn)練的精確度和靈敏度、F1都達(dá)到100%,但測(cè)試集F1值都只有0.5不到,說(shuō)明這兩個(gè)分類(lèi)器極其有效但不穩(wěn)定,存在過(guò)擬合現(xiàn)象!皩W(xué)業(yè)表現(xiàn)一般”和“學(xué)業(yè)表現(xiàn)較低”分類(lèi)器的F1值均穩(wěn)定在0.8以上?傮w而言,該模型是一個(gè)比較好的學(xué)生學(xué)業(yè)表現(xiàn)分類(lèi)模型。
【參考文獻(xiàn)】:
期刊論文
[1]以學(xué)為本,提高質(zhì)量,內(nèi)涵發(fā)展:中國(guó)大學(xué)生學(xué)情研究的學(xué)術(shù)涵義與政策價(jià)值[J]. 史靜寰,王文. 華東師范大學(xué)學(xué)報(bào)(教育科學(xué)版). 2018(04)
[2]基于教育數(shù)據(jù)挖掘?qū)W生表現(xiàn)預(yù)測(cè)模型構(gòu)建研究[J]. 彭濤,丁凌云. 黑龍江高教研究. 2015(11)
[3]基于教育數(shù)據(jù)挖掘的大學(xué)生學(xué)習(xí)成果分析[J]. 舒忠梅,屈瓊斐. 東北大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版). 2014(03)
[4]未完成的轉(zhuǎn)型——普及化階段首都高等教育的人才培養(yǎng)與學(xué)生發(fā)展[J]. 鮑威. 北京大學(xué)教育評(píng)論. 2010(01)
本文編號(hào):3358041
本文鏈接:http://sikaile.net/jiaoyulunwen/jiaoyugaigechuangxinlunwen/3358041.html
最近更新
教材專(zhuān)著