自動作文評分的關鍵技術研究
發(fā)布時間:2021-02-08 15:49
英語教育越來越受重視,寫作是其中的重要一環(huán),自動作文評分可以解決傳統(tǒng)人工閱卷的很多問題,比如可以減輕老師的工作量,加快學生寫作的反饋,提升考試的公平性等,吸引了許多學者的研究。自動作文評分系統(tǒng)并不能真正理解作文,而是通過構建能反映詞語、句子和篇章等各種尺度的特征來間接評估作文分數(shù),因此,挖掘出隱藏在數(shù)據(jù)中的更深層次特征對提升系統(tǒng)效果有很大的影響。一篇好的文章總是有一個特殊的高層邏輯及主題結構,其中實際的單詞和句子選擇以及它們之間的排列都是為這個高層結構服務的,因此一篇文章的語句通順度可以作為自動作文評分的重要指標。作文范文中存在大量詞匯、語法和語義信息,通過計算學生答案與范文的文本匹配度,使得對作文的評判多了一種重要的結合結構和語義信息的深層次參考標準。本論文的主要研究內(nèi)容和創(chuàng)新之處如下:(1)我們提出了一種融合多特征的深度語句通順度計算算法。針對傳統(tǒng)方式詞向量表示粗糙,不能發(fā)現(xiàn)無關詞和句子的問題,我們引入外部知識為訓練過程添加先驗信息,針對知識庫的知識表示學習可以學習到詞語的知識信息;詞語的同義詞表示可以幫助更好地解決一詞多義問題;通過將依存關系嵌入結合進來,可以更好地建模文本的語法...
【文章來源】:電子科技大學四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:80 頁
【學位級別】:碩士
【部分圖文】:
句法關系標注示意圖④
第二章相關基礎知識和理論介紹15首先介紹一元回歸分析方法,假設自變量為,這些變量認為和因變量y有關聯(lián),一元回歸分析假設:(2-8)其中為未知的參數(shù)向量,e稱為隨機誤差項,一般假設,且。對總體進行隨機抽樣時,假設有n個樣本,每個樣本有模型(2-9)表示成矩陣形式后為圖2-2:圖2-2一元回歸方程其中表示對總體變量的獨立重復觀測。一般假設誤差有下述性質:(1);(2);(3)。對于一元回歸分析,一般關心的任務有:(1)參數(shù)及其函數(shù)的估計問題(可估性,最小二乘估計)(2)參數(shù)估計量的性質(3)模型診斷方面,包括參數(shù)的檢驗問題(正態(tài)分布假設,似然比試驗),變量選擇問題,殘差分析(模型假設的檢查,數(shù)據(jù)清潔)(4)模型的預測功能其中,最小二乘估計的定義是對β的估計方法為使得殘差平方和達到最。(2-10)其中。當X為滿秩的時候(p<n),上述最小化殘差平方和的β可以得出(2-11)
方式。奇異值分解(Singular Value Decomposition,SVD)是線性代數(shù)中的一種技術,可以將任意矩陣 M 分解為三個獨立矩陣的乘積:M = U*S*V,其中 S 是矩陣M 奇異值的對角矩陣。為此,對于文檔—詞語矩陣 A,可以得到一個如下式的矩陣分解: (2-14) 奇異值和特征分解中的特征值類似,在奇異值矩陣中奇異值是按照從大到小排列的,而且奇異值減小地特別快,因此可以用最大的 k 個奇異值和對應的左右奇異向量來近似描述矩陣,即矩陣 A 可以通過圖 2-3 等號右側的三個小矩陣來近似描述:
【參考文獻】:
期刊論文
[1]自動作文評分系統(tǒng)對大學生英語寫作能力的影響實證研究[J]. 宋毅寧. 大學教育. 2019(10)
[2]基于文采特征的高考作文自動評分[J]. 劉明楊,秦兵,劉挺. 智能計算機與應用. 2016(01)
[3]知識表示學習研究進展[J]. 劉知遠,孫茂松,林衍凱,謝若冰. 計算機研究與發(fā)展. 2016(02)
[4]HSK自動作文評分的特征選取研究[J]. 黃志娥,謝佳莉,荀恩東. 計算機工程與應用. 2014(06)
[5]國外作文自動評分系統(tǒng)評述及啟示[J]. 梁茂成,文秋芳. 外語電化教學. 2007(05)
[6]使用潛語義分析的漢語作文自動評分研究[J]. 曹亦薇,楊晨. 考試研究. 2007(01)
碩士論文
[1]漢語作為第二語言測試的作文自動評分研究[D]. 李亞男.北京語言大學 2006
本文編號:3024162
【文章來源】:電子科技大學四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:80 頁
【學位級別】:碩士
【部分圖文】:
句法關系標注示意圖④
第二章相關基礎知識和理論介紹15首先介紹一元回歸分析方法,假設自變量為,這些變量認為和因變量y有關聯(lián),一元回歸分析假設:(2-8)其中為未知的參數(shù)向量,e稱為隨機誤差項,一般假設,且。對總體進行隨機抽樣時,假設有n個樣本,每個樣本有模型(2-9)表示成矩陣形式后為圖2-2:圖2-2一元回歸方程其中表示對總體變量的獨立重復觀測。一般假設誤差有下述性質:(1);(2);(3)。對于一元回歸分析,一般關心的任務有:(1)參數(shù)及其函數(shù)的估計問題(可估性,最小二乘估計)(2)參數(shù)估計量的性質(3)模型診斷方面,包括參數(shù)的檢驗問題(正態(tài)分布假設,似然比試驗),變量選擇問題,殘差分析(模型假設的檢查,數(shù)據(jù)清潔)(4)模型的預測功能其中,最小二乘估計的定義是對β的估計方法為使得殘差平方和達到最。(2-10)其中。當X為滿秩的時候(p<n),上述最小化殘差平方和的β可以得出(2-11)
方式。奇異值分解(Singular Value Decomposition,SVD)是線性代數(shù)中的一種技術,可以將任意矩陣 M 分解為三個獨立矩陣的乘積:M = U*S*V,其中 S 是矩陣M 奇異值的對角矩陣。為此,對于文檔—詞語矩陣 A,可以得到一個如下式的矩陣分解: (2-14) 奇異值和特征分解中的特征值類似,在奇異值矩陣中奇異值是按照從大到小排列的,而且奇異值減小地特別快,因此可以用最大的 k 個奇異值和對應的左右奇異向量來近似描述矩陣,即矩陣 A 可以通過圖 2-3 等號右側的三個小矩陣來近似描述:
【參考文獻】:
期刊論文
[1]自動作文評分系統(tǒng)對大學生英語寫作能力的影響實證研究[J]. 宋毅寧. 大學教育. 2019(10)
[2]基于文采特征的高考作文自動評分[J]. 劉明楊,秦兵,劉挺. 智能計算機與應用. 2016(01)
[3]知識表示學習研究進展[J]. 劉知遠,孫茂松,林衍凱,謝若冰. 計算機研究與發(fā)展. 2016(02)
[4]HSK自動作文評分的特征選取研究[J]. 黃志娥,謝佳莉,荀恩東. 計算機工程與應用. 2014(06)
[5]國外作文自動評分系統(tǒng)評述及啟示[J]. 梁茂成,文秋芳. 外語電化教學. 2007(05)
[6]使用潛語義分析的漢語作文自動評分研究[J]. 曹亦薇,楊晨. 考試研究. 2007(01)
碩士論文
[1]漢語作為第二語言測試的作文自動評分研究[D]. 李亞男.北京語言大學 2006
本文編號:3024162
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3024162.html
最近更新
教材專著