天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 教育論文 > 初中教育論文 >

基于SVM的中職學(xué)生作文評(píng)分系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)

發(fā)布時(shí)間:2021-10-07 06:01
  結(jié)合機(jī)器學(xué)習(xí)和文本分類(lèi)技術(shù),研究了基于支持向量機(jī)(SVM)的中等職業(yè)學(xué)校作文評(píng)分系統(tǒng)。使用爬蟲(chóng)技術(shù)大規(guī)模爬取中職學(xué)生作文集作為訓(xùn)練和測(cè)試集,進(jìn)行中文分詞、去除停用詞和TF-IDF算法特征向量化,閾值過(guò)濾低價(jià)值詞語(yǔ),降低SVM算法的復(fù)雜度,將訓(xùn)練集的特征向量和標(biāo)記數(shù)據(jù)輸入SVM多分類(lèi)模型進(jìn)行訓(xùn)練,選取最優(yōu)作文分類(lèi)模型。分類(lèi)模型來(lái)預(yù)測(cè)或判斷未知級(jí)別的學(xué)生作文,給出相應(yīng)評(píng)分等級(jí)。實(shí)驗(yàn)結(jié)果表明,該系統(tǒng)能夠有效地分類(lèi)作文等級(jí),具有一定推廣應(yīng)用價(jià)值。 

【文章來(lái)源】:信息技術(shù). 2020,44(06)

【文章頁(yè)數(shù)】:5 頁(yè)

【部分圖文】:

基于SVM的中職學(xué)生作文評(píng)分系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)


SVM分類(lèi)原理圖

示意圖,示意圖,分類(lèi)器,類(lèi)別


由以上的分析可知,SVM被提出是用于解決二元分類(lèi)問(wèn)題,但實(shí)際的分類(lèi)問(wèn)題傾向于多分類(lèi)應(yīng)用[9]。多分類(lèi)問(wèn)題,通常是指多類(lèi)分類(lèi)器由多種支持向量的兩種分類(lèi)組成。在實(shí)際的應(yīng)用過(guò)程中,將SVM應(yīng)用于多分類(lèi)問(wèn)題主要有兩種方法,第一種是基于兩種支持向量機(jī)分類(lèi)器擴(kuò)展多分類(lèi)支持向量機(jī)分類(lèi)器,另一種方法是將更多分類(lèi)問(wèn)題逐步減少到兩種類(lèi)別。后者可分為一對(duì)多(1-v-r SVMs)和一對(duì)一(1-v-1 SVMs)的方法,它們的區(qū)別在于:一對(duì)一法采用在任意兩類(lèi)樣本之間構(gòu)造一個(gè)SVM分類(lèi)器,如果訓(xùn)練樣本中存在k個(gè)類(lèi)別,則需要構(gòu)造k(k-1)/2個(gè)SVM分類(lèi)器,對(duì)于輸入的測(cè)試樣本,計(jì)算出來(lái)的該樣本所屬最大概率的類(lèi)別即為該測(cè)試樣本的分類(lèi);一對(duì)多法只需要對(duì)于k個(gè)類(lèi)別的樣本數(shù)據(jù)構(gòu)造出k個(gè)SVM分類(lèi)器,初始情況下將某類(lèi)樣本歸為一類(lèi),剩下的樣本為另一類(lèi),然后再對(duì)另一類(lèi)樣本進(jìn)行二分類(lèi)操作,直至達(dá)到k個(gè)類(lèi)別為止,對(duì)于輸入的測(cè)試樣本,具有最大分類(lèi)概率值的類(lèi)別即為該測(cè)試樣本的類(lèi)別[10]。在實(shí)驗(yàn)過(guò)程中,本文采用的是一對(duì)多法,如圖2所示,即將所有樣本視為一個(gè)完整的二分法問(wèn)題,并且根據(jù)爬行標(biāo)簽“cp_rating rating4”將爬取的數(shù)據(jù)分為三類(lèi)——“優(yōu)秀”,“良好”,“差”,初始狀態(tài)下將訓(xùn)練集樣本分為一類(lèi),然后就可以按照分層的方法構(gòu)造三個(gè)SVM分類(lèi)器,分別對(duì)應(yīng)“優(yōu)秀”、“良好”和“差”三個(gè)不同的類(lèi)別,評(píng)估模型的效果,從中選取最好的訓(xùn)練模型。待模型訓(xùn)練穩(wěn)定后,就可以用驗(yàn)證集進(jìn)行驗(yàn)證,對(duì)預(yù)測(cè)集進(jìn)行分類(lèi)[11]。

流程圖,學(xué)生作文,流程圖


實(shí)驗(yàn)中采用的Python提供的SVM分類(lèi)類(lèi)庫(kù)Scikit-Learn作為實(shí)現(xiàn)SVM的工具。通過(guò)3.2節(jié)的運(yùn)算,可以將每篇文章的特征提取出來(lái),表示成一個(gè)列表,使用多分類(lèi)的SVM算法訓(xùn)練模型,并使用該模型來(lái)預(yù)測(cè)測(cè)試集或作文,將文章特征值列表與其對(duì)應(yīng)的評(píng)級(jí)值進(jìn)行匹配;赟VM的中職學(xué)生作文評(píng)分系統(tǒng)的整體流程圖,如圖3所示。本文設(shè)計(jì)的作文評(píng)分系統(tǒng)采用C/S架構(gòu)進(jìn)行開(kāi)發(fā),使用pyqt5進(jìn)行前端界面的編寫(xiě)。用戶可以注冊(cè)、登錄本系統(tǒng),在用戶登錄成功后,系統(tǒng)界面提供了兩種功能,一種是組合視圖,另一種是組成等級(jí),組成視圖可以使用戶能夠查看數(shù)據(jù)庫(kù)中的訓(xùn)練集學(xué)生作文,提取的特征和評(píng)分結(jié)果。組成等級(jí)功能允許用戶自己輸入或直接導(dǎo)入學(xué)生作文,使用評(píng)分分類(lèi)模型,得到對(duì)學(xué)生作文的評(píng)價(jià),作為輔助教師人員評(píng)判作文的一個(gè)參考。

【參考文獻(xiàn)】:
期刊論文
[1]基于支持向量機(jī)的語(yǔ)音情感識(shí)別算法研究[J]. 劉明珠,李曉琴,陳洪恒.  哈爾濱理工大學(xué)學(xué)報(bào). 2019(04)
[2]改進(jìn)SVM分類(lèi)和稀疏表示的圖像混合去噪算法[J]. 趙蒙娜,李東興,趙宗超,蔡亞南,吳秀東.  小型微型計(jì)算機(jī)系統(tǒng). 2019(07)
[3]機(jī)器學(xué)習(xí)方法在儲(chǔ)層分類(lèi)中的應(yīng)用[J]. 干磊,何東博,郭建林,孟凡坤.  數(shù)學(xué)的實(shí)踐與認(rèn)識(shí). 2019(13)
[4]基于SVM與DOM重心半徑模型的Web正文提取[J]. 易國(guó)洪,代瑜,馮智莉,黎慧源.  計(jì)算機(jī)工程. 2019(06)
[5]基于EMD和LSSVM組合模型的交通流量預(yù)測(cè)[J]. 連義平.  電子設(shè)計(jì)工程. 2019(11)
[6]基于支持向量機(jī)模型的復(fù)雜非線性系統(tǒng)試驗(yàn)不確定度評(píng)定方法[J]. 朱大業(yè),丁曉紅,王神龍,王海華,余慧杰.  機(jī)械工程學(xué)報(bào). 2018(08)
[7]基于模糊二范數(shù)二次曲面支持向量機(jī)的信用評(píng)分研究[J]. 何楊,李洪心.  統(tǒng)計(jì)與決策. 2018(05)

碩士論文
[1]基于多核學(xué)習(xí)的支持向量機(jī)方法研究[D]. 張嬌陽(yáng).北京建筑大學(xué) 2019
[2]基于改進(jìn)SVM算法的大規(guī)模中文網(wǎng)站分類(lèi)系統(tǒng)實(shí)現(xiàn)[D]. 張?zhí)熹?北京郵電大學(xué) 2019
[3]基于卷積神經(jīng)網(wǎng)絡(luò)的綠色信貸信用評(píng)價(jià)研究[D]. 唐亦瑋.上海師范大學(xué) 2019
[4]基于支持向量機(jī)的并行文本分類(lèi)方法研究[D]. 馮占芳.遼寧工業(yè)大學(xué) 2019
[5]基于SVD與SVM混合推薦的電影推薦系統(tǒng)的研究[D]. 薄慧麗.太原理工大學(xué) 2017



本文編號(hào):3421489

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/jiaoyulunwen/chuzhongjiaoyu/3421489.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶23723***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com