基于機(jī)器學(xué)習(xí)的試題多知識點(diǎn)和認(rèn)知動詞自動標(biāo)注研究
發(fā)布時間:2023-06-02 20:44
在互聯(lián)網(wǎng)教育時代,教育信息化為教育領(lǐng)域帶來了重大變革,很多教學(xué)資源都以數(shù)據(jù)的形式存儲。其中尤為重要的是試題數(shù)據(jù)資源。而現(xiàn)在普遍存在的情況是,這些試題數(shù)據(jù)在設(shè)計(jì)時僅僅包含試題的內(nèi)容和答案,并沒有直接給出試題所考察的目標(biāo),即缺少認(rèn)知動詞和知識點(diǎn)的標(biāo)注。因此,如何能自動地為試題標(biāo)注所考察的知識點(diǎn)和要求的認(rèn)知動詞層級,更好地發(fā)揮試題數(shù)據(jù)資源的作用是一項(xiàng)十分有意義的研究內(nèi)容;诖,針對數(shù)學(xué)試題數(shù)據(jù)本文的研究任務(wù)主要分為兩部分,分別是基于機(jī)器學(xué)習(xí)的知識點(diǎn)標(biāo)注和認(rèn)知動詞標(biāo)注。(1)提出了一種基于集成學(xué)習(xí)的多知識點(diǎn)標(biāo)注方法。在試題知識點(diǎn)標(biāo)注方面,首先對試題知識點(diǎn)標(biāo)注問題進(jìn)行了形式化的定義,將試題多知識點(diǎn)標(biāo)注問題轉(zhuǎn)化為多標(biāo)簽分類問題;借助教材目錄和領(lǐng)域知識構(gòu)建知識點(diǎn)的知識圖譜,并以此作為試題的知識點(diǎn)標(biāo)簽體系,并用知識圖譜對原始的試題知識點(diǎn)數(shù)據(jù)進(jìn)行了替換;構(gòu)建了以支持向量機(jī)為基分類器的集成學(xué)習(xí)多知識點(diǎn)標(biāo)注方法,通過設(shè)置子集準(zhǔn)確率閾值來篩選出優(yōu)基分類器進(jìn)行集成,以期達(dá)到更好的標(biāo)注效果。(2)提出了一種基于數(shù)據(jù)增強(qiáng)的數(shù)學(xué)試題認(rèn)知動詞標(biāo)注方法。首先,使用不同認(rèn)知動詞下的試題文本數(shù)據(jù)分別構(gòu)建深度文本生成模型,用...
【文章頁數(shù)】:62 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景與意義
1.1.1 研究背景
1.1.2 研究意義
1.2 研究內(nèi)容和論文結(jié)構(gòu)
2 相關(guān)理論概述
2.1 試題資源的知識點(diǎn)標(biāo)注和認(rèn)知動詞標(biāo)注
2.1.1 試題知識點(diǎn)標(biāo)注
2.1.2 知識點(diǎn)標(biāo)注國內(nèi)外研究現(xiàn)狀
2.1.3 試題認(rèn)知動詞標(biāo)注
2.1.4 認(rèn)知動詞標(biāo)注國內(nèi)外研究現(xiàn)狀
2.2 文本分類
2.1.1 一般文本分類過程
2.1.2 短文本分類
2.3 機(jī)器學(xué)習(xí)相關(guān)概念概述
2.3.1 監(jiān)督學(xué)習(xí)
2.3.2 集成學(xué)習(xí)
2.3.3 數(shù)據(jù)不平衡問題
2.4 深度學(xué)習(xí)相關(guān)概念概述
2.4.1 卷積神經(jīng)網(wǎng)絡(luò)
2.4.2 循環(huán)神經(jīng)網(wǎng)絡(luò)
2.4.3 深度文本生成
3 基于集成學(xué)習(xí)的試題多知識點(diǎn)標(biāo)注方法
3.1 試題知識點(diǎn)標(biāo)注問題
3.1.1 問題描述
3.1.2 問題形式化定義
3.2 標(biāo)注流程與標(biāo)注方法
3.2.1 試題題干處理
3.2.2 知識點(diǎn)的知識圖譜構(gòu)建
3.2.3 基分類器的構(gòu)建與集成
3.3 數(shù)值實(shí)驗(yàn)
3.3.1 實(shí)驗(yàn)數(shù)據(jù)集及評價指標(biāo)
3.3.2 實(shí)驗(yàn)過程及結(jié)果分析
3.4 小結(jié)
4 基于數(shù)據(jù)增強(qiáng)的試題認(rèn)知動詞標(biāo)注方法
4.1 認(rèn)知動詞標(biāo)注問題
4.1.1 問題描述
4.1.2 問題形式化定義
4.2 標(biāo)注流程與標(biāo)注方法
4.2.1 原始數(shù)據(jù)預(yù)處理
4.2.2 基于文本生成的試題數(shù)據(jù)增強(qiáng)方法
4.2.3 基于多層次不確定性抽樣的試題數(shù)據(jù)篩選方法
4.3 深度學(xué)習(xí)文本分類方法TextCNN
4.4 數(shù)值實(shí)驗(yàn)
4.4.1 實(shí)驗(yàn)數(shù)據(jù)構(gòu)建
4.4.2 實(shí)驗(yàn)評價指標(biāo)
4.4.3 實(shí)驗(yàn)設(shè)置
4.4.4 實(shí)驗(yàn)過程及結(jié)果分析
4.5 小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表學(xué)術(shù)論文情況
攻讀碩士學(xué)位期間參加科研項(xiàng)目情況
致謝
本文編號:3828007
【文章頁數(shù)】:62 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景與意義
1.1.1 研究背景
1.1.2 研究意義
1.2 研究內(nèi)容和論文結(jié)構(gòu)
2 相關(guān)理論概述
2.1 試題資源的知識點(diǎn)標(biāo)注和認(rèn)知動詞標(biāo)注
2.1.1 試題知識點(diǎn)標(biāo)注
2.1.2 知識點(diǎn)標(biāo)注國內(nèi)外研究現(xiàn)狀
2.1.3 試題認(rèn)知動詞標(biāo)注
2.1.4 認(rèn)知動詞標(biāo)注國內(nèi)外研究現(xiàn)狀
2.2 文本分類
2.1.1 一般文本分類過程
2.1.2 短文本分類
2.3 機(jī)器學(xué)習(xí)相關(guān)概念概述
2.3.1 監(jiān)督學(xué)習(xí)
2.3.2 集成學(xué)習(xí)
2.3.3 數(shù)據(jù)不平衡問題
2.4 深度學(xué)習(xí)相關(guān)概念概述
2.4.1 卷積神經(jīng)網(wǎng)絡(luò)
2.4.2 循環(huán)神經(jīng)網(wǎng)絡(luò)
2.4.3 深度文本生成
3 基于集成學(xué)習(xí)的試題多知識點(diǎn)標(biāo)注方法
3.1 試題知識點(diǎn)標(biāo)注問題
3.1.1 問題描述
3.1.2 問題形式化定義
3.2 標(biāo)注流程與標(biāo)注方法
3.2.1 試題題干處理
3.2.2 知識點(diǎn)的知識圖譜構(gòu)建
3.2.3 基分類器的構(gòu)建與集成
3.3 數(shù)值實(shí)驗(yàn)
3.3.1 實(shí)驗(yàn)數(shù)據(jù)集及評價指標(biāo)
3.3.2 實(shí)驗(yàn)過程及結(jié)果分析
3.4 小結(jié)
4 基于數(shù)據(jù)增強(qiáng)的試題認(rèn)知動詞標(biāo)注方法
4.1 認(rèn)知動詞標(biāo)注問題
4.1.1 問題描述
4.1.2 問題形式化定義
4.2 標(biāo)注流程與標(biāo)注方法
4.2.1 原始數(shù)據(jù)預(yù)處理
4.2.2 基于文本生成的試題數(shù)據(jù)增強(qiáng)方法
4.2.3 基于多層次不確定性抽樣的試題數(shù)據(jù)篩選方法
4.3 深度學(xué)習(xí)文本分類方法TextCNN
4.4 數(shù)值實(shí)驗(yàn)
4.4.1 實(shí)驗(yàn)數(shù)據(jù)構(gòu)建
4.4.2 實(shí)驗(yàn)評價指標(biāo)
4.4.3 實(shí)驗(yàn)設(shè)置
4.4.4 實(shí)驗(yàn)過程及結(jié)果分析
4.5 小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表學(xué)術(shù)論文情況
攻讀碩士學(xué)位期間參加科研項(xiàng)目情況
致謝
本文編號:3828007
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3828007.html
最近更新
教材專著