如何分析慕課論壇中的數(shù)據(jù):六大分析方法述評(píng)
發(fā)布時(shí)間:2021-11-20 15:03
課程論壇是慕課師生交互和生生交互最主要的發(fā)生場(chǎng)所,面對(duì)其中不斷生成的數(shù)據(jù),如何選擇合適的方法分析和了解論壇的教學(xué)和交互活動(dòng)并優(yōu)化論壇環(huán)境,是慕課研究者們關(guān)注的重要問(wèn)題。以Web of Science Core Collection和Science Direct為文獻(xiàn)來(lái)源數(shù)據(jù)庫(kù),選取2014-2018年與慕課論壇(MOOC forum)數(shù)據(jù)分析最相關(guān)的30篇英文文獻(xiàn),結(jié)合實(shí)例詳細(xì)闡述網(wǎng)絡(luò)志、內(nèi)容分析、數(shù)理統(tǒng)計(jì)、聚類分析、網(wǎng)絡(luò)分析、文本挖掘等6類方法的具體分析過(guò)程。在此基礎(chǔ)上,探討以上方法及現(xiàn)有數(shù)據(jù)分析的局限,并為未來(lái)研究者分析慕課論壇數(shù)據(jù)提出建議:將數(shù)據(jù)分析結(jié)果服務(wù)于慕課利益相關(guān)者;加強(qiáng)對(duì)慕課論壇的動(dòng)態(tài)分析;探討相關(guān)背景,逐步擴(kuò)大研究的推廣范圍。
【文章來(lái)源】:現(xiàn)代遠(yuǎn)距離教育. 2019,(06)北大核心CSSCI
【文章頁(yè)數(shù)】:10 頁(yè)
【部分圖文】:
同伴交互網(wǎng)絡(luò)結(jié)構(gòu)圖
對(duì)慕課討論帖的主題進(jìn)行分類與識(shí)別的步驟具體如圖2所示。其中文本預(yù)處理包括文本清洗、文本分詞、去除停用詞等,對(duì)文本挖掘的效果至關(guān)重要;由于計(jì)算機(jī)程序不能直接對(duì)自然語(yǔ)言進(jìn)行理解,需要把文本轉(zhuǎn)化成能夠被計(jì)算機(jī)識(shí)別的形式,這就是文本表示過(guò)程的作用;特征提取則是將無(wú)關(guān)信息摒棄、關(guān)鍵特征信息提取出來(lái)的過(guò)程,通過(guò)構(gòu)造函數(shù)評(píng)估每個(gè)特征,選擇最佳特征作為特征子集,然后選擇合適的分類算法完成分類器的構(gòu)建,對(duì)未知類別的測(cè)試集進(jìn)行預(yù)測(cè)分類[48]。文本主題分類研究的核心內(nèi)容是特征提取和分類器算法選取這兩部分。針對(duì)論壇信息過(guò)載的問(wèn)題,布林頓(Brinton)等利用亞馬遜(Amazon)提供MTurk眾包服務(wù),雇傭工人對(duì)所有訓(xùn)練集主題帖的特征進(jìn)行人工標(biāo)記,結(jié)合支持向量機(jī)和樸素貝葉斯,對(duì)主題帖進(jìn)行分類并通過(guò)真陽(yáng)率、假陽(yáng)率證明兩種模型有效性[31]。宋(Song)等則選擇隱含狄利克雷分布(Latent Dirichlet Allocation,LDA)主題模型從討論帖文檔中提取主題特征,通過(guò)LDA構(gòu)建文本主題分布,挖掘文本的整體語(yǔ)義表達(dá),并選擇支持向量機(jī)完成分類器的構(gòu)建[33]。
本文編號(hào):3507575
【文章來(lái)源】:現(xiàn)代遠(yuǎn)距離教育. 2019,(06)北大核心CSSCI
【文章頁(yè)數(shù)】:10 頁(yè)
【部分圖文】:
同伴交互網(wǎng)絡(luò)結(jié)構(gòu)圖
對(duì)慕課討論帖的主題進(jìn)行分類與識(shí)別的步驟具體如圖2所示。其中文本預(yù)處理包括文本清洗、文本分詞、去除停用詞等,對(duì)文本挖掘的效果至關(guān)重要;由于計(jì)算機(jī)程序不能直接對(duì)自然語(yǔ)言進(jìn)行理解,需要把文本轉(zhuǎn)化成能夠被計(jì)算機(jī)識(shí)別的形式,這就是文本表示過(guò)程的作用;特征提取則是將無(wú)關(guān)信息摒棄、關(guān)鍵特征信息提取出來(lái)的過(guò)程,通過(guò)構(gòu)造函數(shù)評(píng)估每個(gè)特征,選擇最佳特征作為特征子集,然后選擇合適的分類算法完成分類器的構(gòu)建,對(duì)未知類別的測(cè)試集進(jìn)行預(yù)測(cè)分類[48]。文本主題分類研究的核心內(nèi)容是特征提取和分類器算法選取這兩部分。針對(duì)論壇信息過(guò)載的問(wèn)題,布林頓(Brinton)等利用亞馬遜(Amazon)提供MTurk眾包服務(wù),雇傭工人對(duì)所有訓(xùn)練集主題帖的特征進(jìn)行人工標(biāo)記,結(jié)合支持向量機(jī)和樸素貝葉斯,對(duì)主題帖進(jìn)行分類并通過(guò)真陽(yáng)率、假陽(yáng)率證明兩種模型有效性[31]。宋(Song)等則選擇隱含狄利克雷分布(Latent Dirichlet Allocation,LDA)主題模型從討論帖文檔中提取主題特征,通過(guò)LDA構(gòu)建文本主題分布,挖掘文本的整體語(yǔ)義表達(dá),并選擇支持向量機(jī)完成分類器的構(gòu)建[33]。
本文編號(hào):3507575
本文鏈接:http://sikaile.net/jiaoyulunwen/ktjx/3507575.html
最近更新
教材專著