基于K-Means的慕課用戶行為分析研究
發(fā)布時間:2019-09-20 01:55
【摘要】:隨著“互聯(lián)網(wǎng)+教育”的全民普及,慕課(大規(guī)模在線開放課程)的發(fā)展如火如茶,為人們接受在線教育提供了一個廣闊的平臺,而國內(nèi)慕課的實踐研究遠早于理論研究,眾多慕課平臺紛紛涌現(xiàn)。慕課用戶的知識背景和學(xué)習(xí)動機呈多樣性分布,并在學(xué)習(xí)的過程中產(chǎn)生豐富的學(xué)習(xí)行為數(shù)據(jù),為了探索蘊含在數(shù)據(jù)中的規(guī)律,針對不同的用戶群體提供個性化的環(huán)境和學(xué)習(xí)指導(dǎo),分析和研究用戶的行為數(shù)據(jù)是十分有必要的。聚類分析是一種常用的探索性數(shù)據(jù)挖掘方法,是無監(jiān)督機器學(xué)習(xí)的典型應(yīng)用,不僅可以用于分類數(shù)據(jù)的多元統(tǒng)計分析,也可以為其他算法提供預(yù)處理。在研究和歸納用戶行為分析方法的基礎(chǔ)上,本文選擇K-Means算法進行聚類分析,通過進行算法的優(yōu)化和構(gòu)建成績預(yù)測模型,成功實現(xiàn)了慕課用戶的成績預(yù)測,并構(gòu)建成績預(yù)測模塊,實現(xiàn)成績預(yù)測值的可視化展示。本文的主要研究工作有:(1)基于慕課用戶行為數(shù)據(jù),對用戶的學(xué)習(xí)行為數(shù)據(jù)的基本信息、用戶類型、影響成績的因素等三個方面進行深入地分析和探索,得出一些相關(guān)結(jié)論。(2)本文利用特征選擇和初始聚類中心的優(yōu)化選取算法,提出了一種K-Means特征選擇算法,并提出一個均衡判別函數(shù)平衡類簇內(nèi)差異和類簇間差異。(3)將K-Means特征選擇算法得到的聚類中心作為神經(jīng)網(wǎng)絡(luò)的中心,設(shè)置預(yù)測模型的參數(shù)和輸入輸出變量,選擇RBF神經(jīng)網(wǎng)絡(luò)構(gòu)建一個成績預(yù)測模型,并動態(tài)更新該模型,以更為準(zhǔn)確地實現(xiàn)成績的預(yù)測。本文設(shè)計了仿真實驗驗證算法的高效性,對比K-Means特征選擇算法和基于密度的K-Means算法,證明了本文算法性能的改進。同時,使用仿真實驗證明了成績預(yù)測模型對慕課用戶的成績具有較高的預(yù)測精度。最后利用預(yù)測模型設(shè)計和實現(xiàn)了一個成績預(yù)測模塊,可以直觀地輸出用戶的成績預(yù)測值,并對成績較低的用戶進行預(yù)警、建議和輔導(dǎo)。
【圖文】:
邐邋Table邋3-2邋Age邋Distribution邋of邋Users邐逡逑區(qū)間序號邐年齡分布區(qū)間邐邐逡逑1邐{19-34}邐14574邐19-34歲的用戶數(shù)量逡逑2邐{34-54}邐16923邐34-54歲的用戶數(shù)量逡逑3邐{55邋or邋older}邐5583邐55歲以上的用戶數(shù)量逡逑邐4邐{}邐288119邐屬性為空的用戶數(shù)量逡逑如表3-2所示,年齡分布于34歲到54歲的人數(shù)最多,占比45.6%,其次分布逡逑于19歲到34歲,最后是分布于55歲以上的用戶數(shù)量,僅有5583條數(shù)據(jù)。前兩逡逑個區(qū)間的用戶數(shù)量差距不大,但是遠遠高于后者區(qū)間的用戶數(shù)量。這說明,慕課逡逑用戶偏年輕化,熟悉網(wǎng)絡(luò)平臺,有強烈的求知欲和學(xué)習(xí)目標(biāo)。逡逑(2)教育水平分析逡逑慕課用戶的教育水平分布能夠在一定程度上解釋慕課的用戶群體,如圖3-1逡逑所示,慕課用戶主要集中于學(xué)士學(xué)歷和碩士學(xué)歷,占用戶數(shù)量的83.4%,而博士逡逑學(xué)歷和中學(xué)及以下學(xué)歷的人群占比極少,這說明慕課所吸引的用戶基本都是接受逡逑過良好的高等教育,,且慕課流行于擁有較高文化水準(zhǔn)的人群中。逡逑
圖3-2用戶的參與原因逡逑Figure邋3-2邋Reasons邋for邋Participation邋of邋Users逡逑
【學(xué)位授予單位】:北京交通大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2017
【分類號】:TP311.13
【圖文】:
邐邋Table邋3-2邋Age邋Distribution邋of邋Users邐逡逑區(qū)間序號邐年齡分布區(qū)間邐邐逡逑1邐{19-34}邐14574邐19-34歲的用戶數(shù)量逡逑2邐{34-54}邐16923邐34-54歲的用戶數(shù)量逡逑3邐{55邋or邋older}邐5583邐55歲以上的用戶數(shù)量逡逑邐4邐{}邐288119邐屬性為空的用戶數(shù)量逡逑如表3-2所示,年齡分布于34歲到54歲的人數(shù)最多,占比45.6%,其次分布逡逑于19歲到34歲,最后是分布于55歲以上的用戶數(shù)量,僅有5583條數(shù)據(jù)。前兩逡逑個區(qū)間的用戶數(shù)量差距不大,但是遠遠高于后者區(qū)間的用戶數(shù)量。這說明,慕課逡逑用戶偏年輕化,熟悉網(wǎng)絡(luò)平臺,有強烈的求知欲和學(xué)習(xí)目標(biāo)。逡逑(2)教育水平分析逡逑慕課用戶的教育水平分布能夠在一定程度上解釋慕課的用戶群體,如圖3-1逡逑所示,慕課用戶主要集中于學(xué)士學(xué)歷和碩士學(xué)歷,占用戶數(shù)量的83.4%,而博士逡逑學(xué)歷和中學(xué)及以下學(xué)歷的人群占比極少,這說明慕課所吸引的用戶基本都是接受逡逑過良好的高等教育,,且慕課流行于擁有較高文化水準(zhǔn)的人群中。逡逑
圖3-2用戶的參與原因逡逑Figure邋3-2邋Reasons邋for邋Participation邋of邋Users逡逑
【學(xué)位授予單位】:北京交通大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2017
【分類號】:TP311.13
【參考文獻】
相關(guān)期刊論文 前10條
1 孫利雷;秦進;;基于隨機擾動的K-Means聚類中心優(yōu)化方法[J];貴州大學(xué)學(xué)報(自然科學(xué)版);2016年04期
2 賀超凱;吳蒙;;edX平臺教育大數(shù)據(jù)的學(xué)習(xí)行為分析與預(yù)測[J];中國遠程教育;2016年06期
3 孫丙仁;楊敏;;基于機器學(xué)習(xí)聚類算法的學(xué)習(xí)者自動分類研究[J];天津電大學(xué)報;2016年02期
4 賈瑞玉;宋建林;;基于聚類中心優(yōu)化的k-means最佳聚類數(shù)確定方法[J];微電子學(xué)與計算機;2016年05期
5 姜丹;王美娜;周麗;;基于聚類分析技術(shù)的智能型MOOC平臺的研究與設(shè)計[J];現(xiàn)代計算機(專業(yè)版);2016年13期
6 孫洪濤;李秋R
本文編號:2538475
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2538475.html
最近更新
教材專著