基于集成學(xué)習(xí)的主觀題自動(dòng)判分算法研究
發(fā)布時(shí)間:2024-03-22 20:44
近年來隨著互聯(lián)網(wǎng)在線教育的快速發(fā)展,人們的學(xué)習(xí)模式逐漸地由傳統(tǒng)的線下教育過渡到了線上學(xué)習(xí),這一方面帶來了大規(guī)模的線上判分任務(wù),另一方面使得計(jì)算機(jī)自動(dòng)評(píng)分相關(guān)的需求猛增。由于每道主觀題都要由兩名老師評(píng)分,成本很高,標(biāo)準(zhǔn)化的考試(包括筆試)變得越來越昂貴。當(dāng)前現(xiàn)有主觀題智能閱卷系統(tǒng),主要通過正則匹配得分關(guān)鍵詞的方式,完成判分。該判分方式存在判分精確度低、判分維度少、無法識(shí)別同義作答等問題。為此,本文提出了基于多模型特征集成的機(jī)器學(xué)習(xí)算法,克服了以上傳統(tǒng)判分模型中的種種問題,高效地完成了主觀題自動(dòng)判分相關(guān)任務(wù)。多模型特征集成的機(jī)器學(xué)習(xí)算法是通過利用不同機(jī)器學(xué)習(xí)模型對(duì)相同數(shù)據(jù)樣本提取不同維度特征,再利用相關(guān)機(jī)器學(xué)習(xí)算法完成相關(guān)預(yù)測(cè)的算法。本文研究了當(dāng)前主要的判分方法,并進(jìn)一步地定義了主觀題判分問題。通過研究主觀題判分相關(guān)邏輯,完成相應(yīng)作答文本的數(shù)據(jù)處理,同時(shí)從多個(gè)維度提取了TF-IDF、Word2vec、LDA等表征語義的向量特征,并最終比較不同機(jī)器學(xué)習(xí)分類模型在當(dāng)前特征上的預(yù)測(cè)的效果。實(shí)驗(yàn)結(jié)果表明在XGBoost模型上作答文本得分點(diǎn)預(yù)測(cè)精確率達(dá)到82%以上。通過本文提取出的多模型特征集成的機(jī)...
【文章頁(yè)數(shù)】:56 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
本文編號(hào):3934935
【文章頁(yè)數(shù)】:56 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖3-1判分邏輯框架圖
武漢郵電科學(xué)研究院碩士學(xué)位論文26答案中公共的概念數(shù)量,在進(jìn)行判分。其中每個(gè)概念本質(zhì)上是每個(gè)答案中的不可在細(xì)分的概念,同時(shí)為每個(gè)概念分配特定的權(quán)重,將學(xué)生作答中合格的概念中包含的權(quán)重分?jǐn)?shù)加起來的分?jǐn)?shù)就是該題學(xué)生獲得的總分?jǐn)?shù)。傳統(tǒng)主觀題判分邏輯主要通過分析整段學(xué)生作答文本與整個(gè)參考....
圖4-1語義相似度模型
武漢郵電科學(xué)研究院碩士學(xué)位論文35圖4-1語義相似度模型本語義相似度模型主要融合了LDA、Word2vec、TFIDF、文本共顯詞數(shù)目、文本長(zhǎng)度比值,文本字符串之間的編輯距離等多個(gè)語義相似度值,進(jìn)一步將這些特征值做歸一化,使得各個(gè)維度的特征值的幅值都在0到1之間。通過捕獲不同維度....
本文編號(hào):3934935
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3934935.html
最近更新
教材專著