基于機器學習的慕課論壇主題分類研究
發(fā)布時間:2021-04-12 12:10
慕課(Massive open online courses,MOOC)的興起和發(fā)展,使得在線教育成為了現(xiàn)在最受歡迎的教育模式之一,如何改善在線教育的教學質(zhì)量也成為了數(shù)據(jù)挖掘中一個比較熱門的應用研究方向。慕課論壇是慕課課程中學生與老師、助教進行交流的唯一平臺,是直接關(guān)乎到整個課程質(zhì)量的重要因素。對慕課論壇的主題進行合理準確的分類可以幫助學生更好地交流和提問問題,更加有效率地解決學習中遇到的困難。以往對慕課論壇主題分類的研究多是用自然語言處理或者文本分析的技術(shù),首先提取論壇文本的關(guān)鍵詞,然后利用關(guān)鍵詞構(gòu)建文本特征對論壇主題進行分類。但是由于不同課程的論壇內(nèi)容差異巨大,論壇用戶交流使用的語言多種多樣,導致在一個課程上訓練好的主題分類模型,很難直接從特定的論壇推廣應用到其他論壇。針對這些問題,本文提出了一種基于用戶行為特征的慕課論壇主題分類框架。本文首先分析了最大的慕課平臺Coursera上60門課程的論壇用戶行為特征數(shù)據(jù),并收集分析了3門最熱的Coursera中英文課程的論壇文本數(shù)據(jù),證明了用戶行為特征數(shù)據(jù)也可以較好地區(qū)分不同種類的慕課論壇主題。接著從主題的結(jié)構(gòu),主題的潛在社會網(wǎng)絡,主題的...
【文章來源】:大連理工大學遼寧省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:65 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景與意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 基于論壇文本特征的慕課論壇主題分類
1.2.2 基于用戶行為特征的慕課論壇主題分類
1.3 主要內(nèi)容及章節(jié)安排
1.3.1 主要內(nèi)容
1.3.2 章節(jié)安排
2 相關(guān)理論及定義
2.1 引言
2.2 欠采樣學習算法
2.2.1 隨機欠采樣
2.2.2 原型生成欠采樣
2.2.3 原型選擇欠采樣
2.3 過采樣學習算法
2.3.1 隨機過采樣
2.3.2 樣本合成過采樣
2.4 代價敏感學習
2.4.1 代價敏感支持向量機
2.4.2 自適應提升代價敏感算法
3 基于用戶行為特征的慕課論壇主題分類
3.1 引言
3.2 主題文本特征
3.3 用戶行為特征
3.3.1 用戶行為特征分析
3.3.2 用戶行為特征選取
3.3.3 用戶行為特征可視化
3.4 主題分類實驗結(jié)果與分析
3.4.1 實驗設置
3.4.2 評估準則
3.4.3 實驗結(jié)果分析
3.5 本章小結(jié)
4 基于特征融合的慕課論壇主題分類
4.1 引言
4.2 梯度提升樹特征融合算法
4.2.1 梯度提升樹
4.2.2 單棵決策樹特征融合
4.2.3 梯度提升樹特征融合
4.3 主題分類實驗結(jié)果與分析
4.3.1 實驗設置
4.3.2 實驗結(jié)果與分析
4.4 本章小結(jié)
結(jié)論
參考文獻
攻讀碩士學位期間發(fā)表學術(shù)論文情況
致謝
【參考文獻】:
期刊論文
[1]基于MOOC數(shù)據(jù)的學習行為分析與預測[J]. 蔣卓軒,張巖,李曉明. 計算機研究與發(fā)展. 2015(03)
[2]文本分類中詞語權(quán)重計算方法的改進與應用[J]. 熊忠陽,黎剛,陳小莉,陳偉. 計算機工程與應用. 2008(05)
[3]基于信息增益的特征詞權(quán)重調(diào)整算法研究[J]. 張玉芳,陳小莉,熊忠陽. 計算機工程與應用. 2007(35)
[4]基于文本分類TFIDF方法的改進與應用[J]. 張玉芳,彭時名,呂佳. 計算機工程. 2006(19)
本文編號:3133271
【文章來源】:大連理工大學遼寧省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:65 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景與意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 基于論壇文本特征的慕課論壇主題分類
1.2.2 基于用戶行為特征的慕課論壇主題分類
1.3 主要內(nèi)容及章節(jié)安排
1.3.1 主要內(nèi)容
1.3.2 章節(jié)安排
2 相關(guān)理論及定義
2.1 引言
2.2 欠采樣學習算法
2.2.1 隨機欠采樣
2.2.2 原型生成欠采樣
2.2.3 原型選擇欠采樣
2.3 過采樣學習算法
2.3.1 隨機過采樣
2.3.2 樣本合成過采樣
2.4 代價敏感學習
2.4.1 代價敏感支持向量機
2.4.2 自適應提升代價敏感算法
3 基于用戶行為特征的慕課論壇主題分類
3.1 引言
3.2 主題文本特征
3.3 用戶行為特征
3.3.1 用戶行為特征分析
3.3.2 用戶行為特征選取
3.3.3 用戶行為特征可視化
3.4 主題分類實驗結(jié)果與分析
3.4.1 實驗設置
3.4.2 評估準則
3.4.3 實驗結(jié)果分析
3.5 本章小結(jié)
4 基于特征融合的慕課論壇主題分類
4.1 引言
4.2 梯度提升樹特征融合算法
4.2.1 梯度提升樹
4.2.2 單棵決策樹特征融合
4.2.3 梯度提升樹特征融合
4.3 主題分類實驗結(jié)果與分析
4.3.1 實驗設置
4.3.2 實驗結(jié)果與分析
4.4 本章小結(jié)
結(jié)論
參考文獻
攻讀碩士學位期間發(fā)表學術(shù)論文情況
致謝
【參考文獻】:
期刊論文
[1]基于MOOC數(shù)據(jù)的學習行為分析與預測[J]. 蔣卓軒,張巖,李曉明. 計算機研究與發(fā)展. 2015(03)
[2]文本分類中詞語權(quán)重計算方法的改進與應用[J]. 熊忠陽,黎剛,陳小莉,陳偉. 計算機工程與應用. 2008(05)
[3]基于信息增益的特征詞權(quán)重調(diào)整算法研究[J]. 張玉芳,陳小莉,熊忠陽. 計算機工程與應用. 2007(35)
[4]基于文本分類TFIDF方法的改進與應用[J]. 張玉芳,彭時名,呂佳. 計算機工程. 2006(19)
本文編號:3133271
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3133271.html
最近更新
教材專著