面向MOOCs的學習行為與情感分析
發(fā)布時間:2021-07-10 04:23
今春突發(fā)的新冠肺炎疫情是對我國在線教育的一次重大考驗,在疫情防控期間各類學校開展各種形式的在線教學工作,實現(xiàn)了“停課不停學”的目標,這表明進一步推進在線教育發(fā)展的必要性和重要性。大規(guī)模開放在線課程(Massive Open Online Courses,MOOCs)作為在線教育的一種形式,以其不受時空限制等諸多優(yōu)勢,近年來吸引了大量學習者,發(fā)展迅速。然而,由于寬松的學習環(huán)境,目前面向MOOCs的學習存在以下兩個問題:課程輟學率較高和學習者學習效果較差。研究表明,學習行為和情感是影響輟學和學習效果的重要因素。面向MOOCs的學習行為和情感分析是新型教育環(huán)境下降低輟學率、改善學習效果的突破口,迅速成為當前研究熱點。雖然已經(jīng)涌現(xiàn)出諸多相關研究,面向MOOCs的學習行為和情感分析在實際應用中,仍然面臨以下挑戰(zhàn):第一,在輟學行為預測方面,采用不同的學習行為特征預測結果不同,可能導致預測結果波動較大,識別準確率較低。第二,在學習行為和學習效果分析方面,目前大多研究重點關注學習行為和學習效果的相關關系分析,缺乏因果關系分析,導致分析的結論不可靠,無法提供有效的決策支持。第三,在情感分析方面,有監(jiān)督的...
【文章來源】:西北大學陜西省 211工程院校
【文章頁數(shù)】:133 頁
【學位級別】:博士
【部分圖文】:
輟學行為預測的實驗結果
第二章面向網(wǎng)絡日志的輟學行為預測29表2.5平均訓練時間(秒)方法DT-ELMTALSTMGA-ELM時間1.63832.427>1003.3649根據(jù)實驗結果,在整體性能方面,DT-ELM五周的平均準確率和F1值分別達到89.29%和91.49%,優(yōu)于對比方法在這兩個指標上的五周平均值,且它的平均訓練時間為1.6383秒,在所有類別中用時最少。具體地,TA在兩個指標上的結果最低,LSTM較TA在整體性能上有一定提升,但它的訓練時間大于100秒,在所有方法中用時最長,開銷過大。GA-ELM的結果優(yōu)于LSTM,略低于DT-ELM。根據(jù)實驗結果,第四周和第五周的預測結果高于其他幾周。為了分析原因,我們對每周的輟學率進行統(tǒng)計分析,與前三周相比,最后兩周的平均輟學率更高,這意味著學習者的行為模式更容易識別,另一方面也說明了輟學預測研究的重要性,輟學率在課程后期普遍高于課程初期。因此,為了進行有效的干預,首先需要準確地識別有輟學風險的學習者。從算法時間復雜度方面分析,DT-ELM結合了決策樹和ELM,C4.5算法的時間復雜度為,其中為樣本數(shù),為輸入的特征數(shù)[75]。ELM的算法時間復雜度為,其中為隱含神經(jīng)元個數(shù)[76]。因此,DT-ELM的時間復雜度等于C4.5和ELM的時間復雜度相加之和。盡管DT-ELM的時間復雜度高于一些對比算法,如LG的時間復雜度為,但從預測準確率和訓練開銷整體考慮,DT-ELM的預測效果較對比算法有一定優(yōu)勢。2.5.4特征選擇對模型性能的影響為了驗證特征選擇的有效性,本文對比了DT-ELM和ELM的實驗結果,如圖2.4所示。圖2.4特征選擇對模型性能的影響
西北大學博士學位論文30DT-ELM在兩個指標上的實驗結果優(yōu)于ELM,結果表明,特征選擇提高了輟學行為預測的結果,用較少的特征進行輟學行為預測比用所有學習行為特征進行預測取得更好的實驗結果,選擇盡可能多的學習行為特征并不能達到最佳的預測結果。根據(jù)前面提到的熵理論,具有不同的信息增益比的學習行為特征具有不同的分類能力,具有低增益比值的學習行為特征可能會削弱模型的預測能力。2.5.5特征增強和連接初始化對模型性能的影響為了驗證特征增強對模型的有效性,我們將DT-ELM與其去掉特征增強功能的方法Without-FE進行比較。類似地,為了驗證連接初始化對模型的有效性,我們將DT-ELM與其去掉連接初始化功能的方法Without-IC進行了比較。三種方法的實驗結果如圖2.5所示。根據(jù)實驗結果,DT-ELM的實驗結果均高于Without-FE和Without-IC,驗證了特征增強和連接初始化對模型性能的有效性。Without-IC方法的實驗結果在兩個指標上均高于Without-FE方法,說明特征增強對模型在提升預測準確性方面的貢獻大于連接初始化。圖2.5特征增強和連接初始化對模型性能的影響2.5.6訓練集大小對模型性能的影響為了驗證訓練集大小對模型性能的影響,我們設計了兩組實驗,第一組(DT-ELM-SE)包括在10門課程中注冊人數(shù)最少的5門課程,注冊人數(shù)從幾百人到約一千人,第二組(DT-ELM-LE)包括注冊人數(shù)最多的5門課程,注冊人數(shù)從幾千人到上萬人,我們使用本文提出的模型在這兩組課程數(shù)據(jù)上分別進行實驗,結果如圖2.6所示。根據(jù)實驗結果,用于模型訓練的數(shù)據(jù)越多,分類結果越好。在時間方面,DT-ELM-LE和DT-ELM-SE的平均訓練時間分別為1.6752秒和1.6014秒,差異不大。盡管模型在注冊人數(shù)較少的課程上的預測結果低于注冊人數(shù)較多的課程,但整體結果仍高于第一組
【參考文獻】:
期刊論文
[1]數(shù)據(jù)挖掘視角下網(wǎng)絡學習者行為特征聚類分析[J]. 王改花,傅鋼善. 現(xiàn)代遠程教育研究. 2018(04)
[2]網(wǎng)絡評論方面級觀點挖掘方法研究綜述[J]. 韓忠明,李夢琪,劉雯,張夢玫,段大高,于重重. 軟件學報. 2018(02)
[3]情感分類研究進展[J]. 陳龍,管子玉,何金紅,彭進業(yè). 計算機研究與發(fā)展. 2017(06)
[4]基于行為序列分析對在線學習參與模式的探索[J]. 李爽,鐘瑤,喻忱,程罡,魏順平. 中國電化教育. 2017(03)
[5]基于非時序觀察數(shù)據(jù)的因果關系發(fā)現(xiàn)綜述[J]. 蔡瑞初,陳薇,張坤,郝志峰. 計算機學報. 2017(06)
[6]因果關系及其在社會媒體上的應用研究綜述[J]. 趙森棟,劉挺. 軟件學報. 2014(12)
[7]基于MOOC數(shù)據(jù)的學習行為分析與預測[J]. 蔣卓軒,張巖,李曉明. 計算機研究與發(fā)展. 2015(03)
[8]基于句法與主題擴展的中文微博情感傾向性分析模型[J]. 陸浩,牛振東,張楠,孫星愷,劉文禮. 北京理工大學學報. 2014(08)
[9]行為科學理論指導下的高校大學生網(wǎng)絡學習行為研究[J]. 劉中宇,周曉. 中國電化教育. 2008(05)
博士論文
[1]面向e-Learning的學習者情感建模及應用研究[D]. 黃煥.華中師范大學 2014
本文編號:3275180
【文章來源】:西北大學陜西省 211工程院校
【文章頁數(shù)】:133 頁
【學位級別】:博士
【部分圖文】:
輟學行為預測的實驗結果
第二章面向網(wǎng)絡日志的輟學行為預測29表2.5平均訓練時間(秒)方法DT-ELMTALSTMGA-ELM時間1.63832.427>1003.3649根據(jù)實驗結果,在整體性能方面,DT-ELM五周的平均準確率和F1值分別達到89.29%和91.49%,優(yōu)于對比方法在這兩個指標上的五周平均值,且它的平均訓練時間為1.6383秒,在所有類別中用時最少。具體地,TA在兩個指標上的結果最低,LSTM較TA在整體性能上有一定提升,但它的訓練時間大于100秒,在所有方法中用時最長,開銷過大。GA-ELM的結果優(yōu)于LSTM,略低于DT-ELM。根據(jù)實驗結果,第四周和第五周的預測結果高于其他幾周。為了分析原因,我們對每周的輟學率進行統(tǒng)計分析,與前三周相比,最后兩周的平均輟學率更高,這意味著學習者的行為模式更容易識別,另一方面也說明了輟學預測研究的重要性,輟學率在課程后期普遍高于課程初期。因此,為了進行有效的干預,首先需要準確地識別有輟學風險的學習者。從算法時間復雜度方面分析,DT-ELM結合了決策樹和ELM,C4.5算法的時間復雜度為,其中為樣本數(shù),為輸入的特征數(shù)[75]。ELM的算法時間復雜度為,其中為隱含神經(jīng)元個數(shù)[76]。因此,DT-ELM的時間復雜度等于C4.5和ELM的時間復雜度相加之和。盡管DT-ELM的時間復雜度高于一些對比算法,如LG的時間復雜度為,但從預測準確率和訓練開銷整體考慮,DT-ELM的預測效果較對比算法有一定優(yōu)勢。2.5.4特征選擇對模型性能的影響為了驗證特征選擇的有效性,本文對比了DT-ELM和ELM的實驗結果,如圖2.4所示。圖2.4特征選擇對模型性能的影響
西北大學博士學位論文30DT-ELM在兩個指標上的實驗結果優(yōu)于ELM,結果表明,特征選擇提高了輟學行為預測的結果,用較少的特征進行輟學行為預測比用所有學習行為特征進行預測取得更好的實驗結果,選擇盡可能多的學習行為特征并不能達到最佳的預測結果。根據(jù)前面提到的熵理論,具有不同的信息增益比的學習行為特征具有不同的分類能力,具有低增益比值的學習行為特征可能會削弱模型的預測能力。2.5.5特征增強和連接初始化對模型性能的影響為了驗證特征增強對模型的有效性,我們將DT-ELM與其去掉特征增強功能的方法Without-FE進行比較。類似地,為了驗證連接初始化對模型的有效性,我們將DT-ELM與其去掉連接初始化功能的方法Without-IC進行了比較。三種方法的實驗結果如圖2.5所示。根據(jù)實驗結果,DT-ELM的實驗結果均高于Without-FE和Without-IC,驗證了特征增強和連接初始化對模型性能的有效性。Without-IC方法的實驗結果在兩個指標上均高于Without-FE方法,說明特征增強對模型在提升預測準確性方面的貢獻大于連接初始化。圖2.5特征增強和連接初始化對模型性能的影響2.5.6訓練集大小對模型性能的影響為了驗證訓練集大小對模型性能的影響,我們設計了兩組實驗,第一組(DT-ELM-SE)包括在10門課程中注冊人數(shù)最少的5門課程,注冊人數(shù)從幾百人到約一千人,第二組(DT-ELM-LE)包括注冊人數(shù)最多的5門課程,注冊人數(shù)從幾千人到上萬人,我們使用本文提出的模型在這兩組課程數(shù)據(jù)上分別進行實驗,結果如圖2.6所示。根據(jù)實驗結果,用于模型訓練的數(shù)據(jù)越多,分類結果越好。在時間方面,DT-ELM-LE和DT-ELM-SE的平均訓練時間分別為1.6752秒和1.6014秒,差異不大。盡管模型在注冊人數(shù)較少的課程上的預測結果低于注冊人數(shù)較多的課程,但整體結果仍高于第一組
【參考文獻】:
期刊論文
[1]數(shù)據(jù)挖掘視角下網(wǎng)絡學習者行為特征聚類分析[J]. 王改花,傅鋼善. 現(xiàn)代遠程教育研究. 2018(04)
[2]網(wǎng)絡評論方面級觀點挖掘方法研究綜述[J]. 韓忠明,李夢琪,劉雯,張夢玫,段大高,于重重. 軟件學報. 2018(02)
[3]情感分類研究進展[J]. 陳龍,管子玉,何金紅,彭進業(yè). 計算機研究與發(fā)展. 2017(06)
[4]基于行為序列分析對在線學習參與模式的探索[J]. 李爽,鐘瑤,喻忱,程罡,魏順平. 中國電化教育. 2017(03)
[5]基于非時序觀察數(shù)據(jù)的因果關系發(fā)現(xiàn)綜述[J]. 蔡瑞初,陳薇,張坤,郝志峰. 計算機學報. 2017(06)
[6]因果關系及其在社會媒體上的應用研究綜述[J]. 趙森棟,劉挺. 軟件學報. 2014(12)
[7]基于MOOC數(shù)據(jù)的學習行為分析與預測[J]. 蔣卓軒,張巖,李曉明. 計算機研究與發(fā)展. 2015(03)
[8]基于句法與主題擴展的中文微博情感傾向性分析模型[J]. 陸浩,牛振東,張楠,孫星愷,劉文禮. 北京理工大學學報. 2014(08)
[9]行為科學理論指導下的高校大學生網(wǎng)絡學習行為研究[J]. 劉中宇,周曉. 中國電化教育. 2008(05)
博士論文
[1]面向e-Learning的學習者情感建模及應用研究[D]. 黃煥.華中師范大學 2014
本文編號:3275180
本文鏈接:http://sikaile.net/shoufeilunwen/sklbs/3275180.html
最近更新
教材專著