教育數(shù)據(jù)挖掘中分類問題的可解釋性研究
發(fā)布時間:2021-07-31 22:59
教育數(shù)據(jù)挖掘(EDM,Educational Data Mining)運用機器學(xué)習(xí)等技術(shù)來解決教育研究與實踐中的問題,涉及計算機科學(xué)、教育學(xué)和心理學(xué)等多門學(xué)科。由于EDM的研究成果主要服務(wù)于廣大師生及教育決策者,它對機器學(xué)習(xí)模型的可解釋性有較高的要求。一方面,EDM的用戶一般不是信息技術(shù)專業(yè)人員,如果模型難于理解,他們可能拒絕使用該模型;另一方面,教育決策者通常要為自己的決策行為負(fù)責(zé),如果模型不能給出合理的依據(jù),他們可能不愿使用該模型來輔助決策。在過去幾十年中,機器學(xué)習(xí)模型的可解釋性問題一直備受關(guān)注,并取得了一些成果,但仍然存在一些問題,例如缺乏對不同模型可解釋性的統(tǒng)一度量標(biāo)準(zhǔn)、較少考慮人的認(rèn)知因素等。而EDM乃至整個數(shù)據(jù)挖掘領(lǐng)域的可解釋性研究也存在諸多不足,特別地,當(dāng)前研究主要集中于模型建立階段的可解釋性問題,忽略了數(shù)據(jù)挖掘生命周期中其他階段的可解釋性研究。針對以上問題,本文進(jìn)行了充分的研究,提出了一個涉及數(shù)據(jù)挖掘整個生命周期的可解釋性研究方案。鑒于分類模型在EDM乃至數(shù)據(jù)挖掘領(lǐng)域中應(yīng)用最為廣泛,本文只涉及EDM中的分類問題,主要工作包括以下五個方面:(1)系統(tǒng)地研究了數(shù)據(jù)挖掘中的可...
【文章來源】:重慶大學(xué)重慶市 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:168 頁
【學(xué)位級別】:博士
【文章目錄】:
中文摘要
英文摘要
1 緒論
1.1 研究背景和意義
1.1.1 本文的研究背景
1.1.2 本文的研究意義
1.2 國內(nèi)外研究進(jìn)展
1.2.1 機器學(xué)習(xí)模型的可解釋性
1.2.2 EDM中的可解釋性研究
1.2.3 當(dāng)前研究存在的問題
1.3 論文主要研究內(nèi)容及創(chuàng)新點
1.3.1 本文主要研究的內(nèi)容
1.3.2 本文的工作和創(chuàng)新點
1.4 論文組織結(jié)構(gòu)
2 論文相關(guān)的基礎(chǔ)知識介紹
2.1 引言
2.2 論文所依托的應(yīng)用背景
2.2.1 互聯(lián)網(wǎng)行為預(yù)測學(xué)生表現(xiàn)
2.2.2 就業(yè)層次預(yù)測
2.3 EDM中常見數(shù)據(jù)挖掘技術(shù)及其可解釋性
2.3.1 常見數(shù)據(jù)挖掘技術(shù)
2.3.2 模型的可解釋性
2.4 預(yù)測模型的評估標(biāo)準(zhǔn)
2.5 論文中所涉及數(shù)據(jù)集的介紹
2.5.1 教育數(shù)據(jù)集
2.5.2 其他數(shù)據(jù)集
2.6 本章小結(jié)
3 一個理解原始數(shù)據(jù)集的處理流程
3.1 引言
3.2 ⅡOD-DU流程
3.2.1 流程概述
3.2.2 兩種特征選擇方法
3.3 實驗結(jié)果與分析
3.3.1 數(shù)據(jù)集
3.3.2 理解問題的難度
3.3.3 理解類標(biāo)
3.3.4 理解特征
3.4 本章小結(jié)
4 一種兩階段的數(shù)據(jù)準(zhǔn)備方法
4.1 引言
4.2 TSDP方法
4.2.1 方法概述
4.2.2 Ⅰ階段的分析
4.2.3 Ⅱ階段的分析
4.3 兩種事后解釋方法
4.4實驗
4.4.1 實驗一:驗證TSDP方法的有效性
4.4.2 實驗二:使用事后解釋法理解特征
4.5 本章小結(jié)
5 一種解釋SVM分類模型的方法
5.1 引言
5.2 認(rèn)知心理學(xué)相關(guān)理論知識簡介
5.2.1 信息加工理論
5.2.2 范例理論
5.2.3 可得性啟發(fā)式
5.2.4 透鏡模型
5.3 研究框架
5.4 ISVM方法
5.4.1 范例選擇算法
5.4.2 事后解釋算法
5.5 實驗結(jié)果與分析
5.5.1 實驗數(shù)據(jù)
5.5.2 評估標(biāo)準(zhǔn)
5.5.3 對比方法
5.5.4 結(jié)果分析
5.6 本章小結(jié)
6 一種跨模型評估可解釋性的研究框架及其實現(xiàn)
6.1 引言
6.2 EIDM研究框架
6.3 提取特征
6.4 測量可解釋性
6.4.1 調(diào)查問卷的設(shè)計
6.4.2 調(diào)查問卷的實施
6.5 標(biāo)注類標(biāo)
6.6 構(gòu)建評判模型
6.7 實驗結(jié)果與分析
6.7.1 驗證調(diào)查的合理性
6.7.2 評估判別模型的性能
6.7.3 實驗小結(jié)
6.8 本章小結(jié)
7 總結(jié)與展望
7.1 主要結(jié)論
7.2 展望
致謝
參考文獻(xiàn)
附錄
A.作者在攻讀博士學(xué)位期間發(fā)表的論文目錄
B.作者在攻讀博士學(xué)位期間申請的發(fā)明專利
C.作者在攻讀博士學(xué)位期間參與的科研項目
【參考文獻(xiàn)】:
期刊論文
[1]教育數(shù)據(jù)挖掘研究進(jìn)展綜述[J]. 周慶,牟超,楊丹. 軟件學(xué)報. 2015(11)
[2]判斷與決策中的易得性啟發(fā)式[J]. 李燕,徐富明,孔詩曉. 心理研究. 2015(05)
[3]大學(xué)生上網(wǎng)情況與學(xué)業(yè)成績關(guān)系的實證研究[J]. 袁曉蕾,李曉東,吉運,王茁. 中國教育信息化. 2015(10)
[4]基于SVM的小樣本條件下繼電保護可靠性參數(shù)估計[J]. 何旭,姜憲國,張沛超,高翔,李仲青. 電網(wǎng)技術(shù). 2015(05)
[5]試論研究生就業(yè)競爭力的提升[J]. 耿紅,張海防. 江蘇高教. 2015(03)
[6]面向在線教育領(lǐng)域的大數(shù)據(jù)研究及應(yīng)用[J]. 陳池,王宇鵬,李超,張勇,邢春曉. 計算機研究與發(fā)展. 2014(S1)
[7]高校學(xué)生評獎評優(yōu)中馬太效應(yīng)的研究[J]. 毛穎,王麗君. 湖北科技學(xué)院學(xué)報. 2014(11)
[8]改革后的CET對學(xué)生課外英語學(xué)習(xí)過程的反撥效應(yīng)實證研究——基于學(xué)生的學(xué)習(xí)日志[J]. 辜向東,張正川,劉曉華. 解放軍外國語學(xué)院學(xué)報. 2014(05)
[9]基于特征子集區(qū)分度與支持向量機的特征選擇算法[J]. 謝娟英,謝維信. 計算機學(xué)報. 2014(08)
[10]基于主題的微博二級好友推薦模型研究[J]. 唐曉波,祝黎,謝力. 圖書情報工作. 2014(09)
博士論文
[1]Web評論文本情感分類方法研究[D]. 張璞.重慶大學(xué) 2015
碩士論文
[1]基于網(wǎng)絡(luò)日志的高校學(xué)生成績預(yù)測系統(tǒng)的研究與實現(xiàn)[D]. 鄭友杰.重慶大學(xué) 2016
[2]基于像素的可視化技術(shù)及其度量模型的研究[D]. 李勇.北京交通大學(xué) 2010
本文編號:3314336
【文章來源】:重慶大學(xué)重慶市 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:168 頁
【學(xué)位級別】:博士
【文章目錄】:
中文摘要
英文摘要
1 緒論
1.1 研究背景和意義
1.1.1 本文的研究背景
1.1.2 本文的研究意義
1.2 國內(nèi)外研究進(jìn)展
1.2.1 機器學(xué)習(xí)模型的可解釋性
1.2.2 EDM中的可解釋性研究
1.2.3 當(dāng)前研究存在的問題
1.3 論文主要研究內(nèi)容及創(chuàng)新點
1.3.1 本文主要研究的內(nèi)容
1.3.2 本文的工作和創(chuàng)新點
1.4 論文組織結(jié)構(gòu)
2 論文相關(guān)的基礎(chǔ)知識介紹
2.1 引言
2.2 論文所依托的應(yīng)用背景
2.2.1 互聯(lián)網(wǎng)行為預(yù)測學(xué)生表現(xiàn)
2.2.2 就業(yè)層次預(yù)測
2.3 EDM中常見數(shù)據(jù)挖掘技術(shù)及其可解釋性
2.3.1 常見數(shù)據(jù)挖掘技術(shù)
2.3.2 模型的可解釋性
2.4 預(yù)測模型的評估標(biāo)準(zhǔn)
2.5 論文中所涉及數(shù)據(jù)集的介紹
2.5.1 教育數(shù)據(jù)集
2.5.2 其他數(shù)據(jù)集
2.6 本章小結(jié)
3 一個理解原始數(shù)據(jù)集的處理流程
3.1 引言
3.2 ⅡOD-DU流程
3.2.1 流程概述
3.2.2 兩種特征選擇方法
3.3 實驗結(jié)果與分析
3.3.1 數(shù)據(jù)集
3.3.2 理解問題的難度
3.3.3 理解類標(biāo)
3.3.4 理解特征
3.4 本章小結(jié)
4 一種兩階段的數(shù)據(jù)準(zhǔn)備方法
4.1 引言
4.2 TSDP方法
4.2.1 方法概述
4.2.2 Ⅰ階段的分析
4.2.3 Ⅱ階段的分析
4.3 兩種事后解釋方法
4.4實驗
4.4.1 實驗一:驗證TSDP方法的有效性
4.4.2 實驗二:使用事后解釋法理解特征
4.5 本章小結(jié)
5 一種解釋SVM分類模型的方法
5.1 引言
5.2 認(rèn)知心理學(xué)相關(guān)理論知識簡介
5.2.1 信息加工理論
5.2.2 范例理論
5.2.3 可得性啟發(fā)式
5.2.4 透鏡模型
5.3 研究框架
5.4 ISVM方法
5.4.1 范例選擇算法
5.4.2 事后解釋算法
5.5 實驗結(jié)果與分析
5.5.1 實驗數(shù)據(jù)
5.5.2 評估標(biāo)準(zhǔn)
5.5.3 對比方法
5.5.4 結(jié)果分析
5.6 本章小結(jié)
6 一種跨模型評估可解釋性的研究框架及其實現(xiàn)
6.1 引言
6.2 EIDM研究框架
6.3 提取特征
6.4 測量可解釋性
6.4.1 調(diào)查問卷的設(shè)計
6.4.2 調(diào)查問卷的實施
6.5 標(biāo)注類標(biāo)
6.6 構(gòu)建評判模型
6.7 實驗結(jié)果與分析
6.7.1 驗證調(diào)查的合理性
6.7.2 評估判別模型的性能
6.7.3 實驗小結(jié)
6.8 本章小結(jié)
7 總結(jié)與展望
7.1 主要結(jié)論
7.2 展望
致謝
參考文獻(xiàn)
附錄
A.作者在攻讀博士學(xué)位期間發(fā)表的論文目錄
B.作者在攻讀博士學(xué)位期間申請的發(fā)明專利
C.作者在攻讀博士學(xué)位期間參與的科研項目
【參考文獻(xiàn)】:
期刊論文
[1]教育數(shù)據(jù)挖掘研究進(jìn)展綜述[J]. 周慶,牟超,楊丹. 軟件學(xué)報. 2015(11)
[2]判斷與決策中的易得性啟發(fā)式[J]. 李燕,徐富明,孔詩曉. 心理研究. 2015(05)
[3]大學(xué)生上網(wǎng)情況與學(xué)業(yè)成績關(guān)系的實證研究[J]. 袁曉蕾,李曉東,吉運,王茁. 中國教育信息化. 2015(10)
[4]基于SVM的小樣本條件下繼電保護可靠性參數(shù)估計[J]. 何旭,姜憲國,張沛超,高翔,李仲青. 電網(wǎng)技術(shù). 2015(05)
[5]試論研究生就業(yè)競爭力的提升[J]. 耿紅,張海防. 江蘇高教. 2015(03)
[6]面向在線教育領(lǐng)域的大數(shù)據(jù)研究及應(yīng)用[J]. 陳池,王宇鵬,李超,張勇,邢春曉. 計算機研究與發(fā)展. 2014(S1)
[7]高校學(xué)生評獎評優(yōu)中馬太效應(yīng)的研究[J]. 毛穎,王麗君. 湖北科技學(xué)院學(xué)報. 2014(11)
[8]改革后的CET對學(xué)生課外英語學(xué)習(xí)過程的反撥效應(yīng)實證研究——基于學(xué)生的學(xué)習(xí)日志[J]. 辜向東,張正川,劉曉華. 解放軍外國語學(xué)院學(xué)報. 2014(05)
[9]基于特征子集區(qū)分度與支持向量機的特征選擇算法[J]. 謝娟英,謝維信. 計算機學(xué)報. 2014(08)
[10]基于主題的微博二級好友推薦模型研究[J]. 唐曉波,祝黎,謝力. 圖書情報工作. 2014(09)
博士論文
[1]Web評論文本情感分類方法研究[D]. 張璞.重慶大學(xué) 2015
碩士論文
[1]基于網(wǎng)絡(luò)日志的高校學(xué)生成績預(yù)測系統(tǒng)的研究與實現(xiàn)[D]. 鄭友杰.重慶大學(xué) 2016
[2]基于像素的可視化技術(shù)及其度量模型的研究[D]. 李勇.北京交通大學(xué) 2010
本文編號:3314336
本文鏈接:http://sikaile.net/jiaoyulunwen/jiaoyuxinli/3314336.html
最近更新
教材專著