天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

自動作文評分模型及方法研究

發(fā)布時間:2019-01-16 09:30
【摘要】:寫作作為語言考試的一種必備題型,通常需要大規(guī)模的作文閱卷,采用人工評分的方法一方面浪費(fèi)大量的人力、物力,另一方面,人工評分依賴閱卷老師的主觀判斷,存在一定誤差。隨著自然語言處理技術(shù)的發(fā)展,其在句法分析,語義分析、情感分析等方面取得了突破性的進(jìn)展,利用自然語言處理技術(shù)對作文進(jìn)行自動評分具有重要的意義。傳統(tǒng)的自動作文評分方法主要對整篇文章進(jìn)行統(tǒng)計,提取詞法、句法、語義等特征,代入機(jī)器學(xué)習(xí)模型中進(jìn)行訓(xùn)練,從而預(yù)測評分,這種方法通常依賴于人工提取的規(guī)則特征,并且只簡單的考慮篇章整體質(zhì)量,沒有很好的考慮到其中更細(xì)節(jié)的信息,比如篇章的上下文信息等。基于這些問題,本文在傳統(tǒng)評分方法上,進(jìn)一步抽取句子層面的特征,并利用篇章的上下文的時序信息,挖掘作文潛在的邏輯性、連貫性對評分模型的影響。另外,針對語言考試中規(guī)定題目的寫作情景,從考察作文是否符合題意角度出發(fā),研究了作文主題相關(guān)度在評分模型中的效果。本文的研究內(nèi)容主要包括以下三個方面:(1)研究了句表示方法和深度學(xué)習(xí)模型在自動作文評分中的應(yīng)用。在寫作這個特定情境下,作文更適合看作具備邏輯性的語句序列,為了挖掘句子之間隱藏的邏輯信息,本文主要使用無監(jiān)督的方法表示句向量,其中包括Doc2Vec技術(shù)、遞歸自編碼器等。然后使用深度學(xué)習(xí)方法構(gòu)建模型,本文主要基于CNN模型在提取特征上的優(yōu)勢和LSTM模型適合時序性問題的特點,設(shè)計并實現(xiàn)了多種模型結(jié)構(gòu),找到適合該問題的建模方法。并與傳統(tǒng)評分模型進(jìn)行融合,使評分模型效果得到提升。(2)研究了說明文體裁作文的主題相關(guān)度在評分問題中的作用。主要通過提取題目文本與作文文本之間的相似度特征,并引入基于主題的語義離散度的概念,分析其對最終評分結(jié)果的影響。(3)設(shè)計并實現(xiàn)了一個作文自動評分系統(tǒng)。該系統(tǒng)能夠?qū)ψ魑馁|(zhì)量給出及時的評分反饋,并且在詞法、句法、邏輯、主題角度給出相關(guān)的反饋。并增加了糾錯模塊,可以一定程度上提供給用戶更好的寫作反饋體驗。
[Abstract]:As a necessary type of language test, writing usually requires a large scale composition marking. On the one hand, manual scoring method wastes a lot of manpower and material resources, on the other hand, manual scoring depends on the subjective judgment of the marking teacher. There is a certain error. With the development of natural language processing technology, it has made a breakthrough in syntactic analysis, semantic analysis, emotional analysis and so on. It is of great significance to use natural language processing technology to score composition automatically. The traditional automatic composition scoring method mainly carries on the statistics to the entire article, extracts the lexical, syntactic, semantic and so on characteristic, and substitutes in the machine learning model to train, thus predicts the score, this kind of method usually depends on the manual extraction rule characteristic. Furthermore, the overall quality of the text is simply considered, and the more detailed information, such as the context of the text, is not well considered. Based on these problems, this paper extracts the features of sentence level in the traditional scoring method, and uses the temporal information of the context of the text to explore the potential logic and coherence of the composition to influence the scoring model. In addition, according to the writing situation of the prescribed topic in the language test, the effect of the relevance of the composition theme in the scoring model is studied from the point of view of whether the composition conforms to the meaning of the question. The main contents of this paper are as follows: (1) the application of sentence representation and depth learning model in automatic composition scoring is studied. In the particular situation of writing, composition is more suitable to be regarded as a logical sentence sequence. In order to mine the hidden logic information between sentences, this paper mainly uses an unsupervised method to express sentence vectors, including Doc2Vec technology. Recursive self-encoder, etc. Based on the advantages of CNN model in extracting features and the characteristics of LSTM model suitable for temporal problem, this paper designs and implements a variety of model structures to find a modeling method suitable for this problem. And fusion with the traditional scoring model to improve the effectiveness of the scoring model. (2) this paper studies the role of theme relevance in the scoring problem of genre writing. By extracting the similarity feature between title text and composition text, and introducing the concept of topic based semantic dispersion, this paper analyzes its influence on the final score result. (3) A composition automatic scoring system is designed and implemented. The system can give timely scoring feedback on composition quality, and give related feedback in lexical, syntactic, logical and thematic perspectives. An error correction module is added to provide users with a better writing feedback experience to a certain extent.
【學(xué)位授予單位】:哈爾濱工業(yè)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2017
【分類號】:TP391.1

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 馬小涵;;創(chuàng)新推動作文圖書繁榮發(fā)展[J];出版參考;2009年06期

2 劉匯力;;學(xué)作文與學(xué)做人[J];新聞與寫作;1984年01期

3 張偉;;作文圖書的買方市場[J];出版廣角;1999年12期

4 景琳;作文圖書的必由之路[J];編輯之友;2002年03期

5 岳金秀;如何在作文教學(xué)中培養(yǎng)學(xué)生的素質(zhì)[J];甘肅科技縱橫;2005年03期

6 丁玲;;希望在這里——喜讀《學(xué)作文報》[J];新聞與寫作;1984年01期

7 陳明宏;系統(tǒng)·開放·辯證——讀《中學(xué)作文訓(xùn)練體系和方法》[J];中國圖書評論;1991年05期

8 ;《新高考》作文讀本系列圖書[J];新高考(高三理化生);2014年02期

9 ;《新高考》作文讀本系列圖書[J];新高考(高三理化生);2014年03期

10 施青瀕;;“小學(xué)專題作文”的探索與實踐[J];現(xiàn)代教學(xué);2005年12期

相關(guān)會議論文 前10條

1 仲梅;;有關(guān)作文教學(xué)的幾點體會[A];江蘇省教育學(xué)會、江蘇省寫作學(xué)會2006年年會論文集[C];2006年

2 彭慶;孫堅;;作文與做人[A];江蘇省教育學(xué)會、江蘇省寫作學(xué)會2006年年會論文集[C];2006年

3 林莉;;淺談中學(xué)研究性作文教學(xué)的內(nèi)涵與特點[A];江蘇省教育學(xué)會、江蘇省寫作學(xué)會2006年年會論文集[C];2006年

4 向水林;;作文教學(xué)要著眼素質(zhì)開啟心理[A];首屆“健康杯”全國中小學(xué)心理健康教育研討暨頒獎大會論文集[C];2002年

5 劉彥;;積累感動 凈化靈魂——用心靈相互取暖,用感動經(jīng)營作文[A];中國管理科學(xué)文獻(xiàn)[C];2008年

6 徐迎春;任德成;;綠色作文——作文教學(xué)的新境界——淺談初一作文教學(xué)[A];國家教師科研專項基金科研成果(語文建設(shè)卷2)[C];2013年

7 吳永堯;;淺談高中語文教學(xué)中的作文教學(xué)[A];中華教育理論與實踐科研論文成果選編(第七卷)[C];2014年

8 李彩萍;;守望精神交流的家園——作文教學(xué)隨想[A];國家教師科研基金“十一五”成果集(中國名校卷)(五)[C];2009年

9 王有壽;;作文教學(xué)應(yīng)注意的幾個環(huán)節(jié)[A];萃英集——青海省教育委員會、青海省教育學(xué)會優(yōu)秀教育論文集[C];2000年

10 唐秀華;;“反作文”引發(fā)的思考[A];山東省師范教育學(xué)會2002年度師范教育研究優(yōu)秀成果論文集[C];2002年

相關(guān)重要報紙文章 前10條

1 記者 王國平;作文訓(xùn)練要從“誠善美”出發(fā)[N];光明日報;2009年

2 山東省臨沭第二中學(xué) 季春娟;在作文中提升學(xué)生的做人素養(yǎng)[N];學(xué)知報;2010年

3 崇左市江洲區(qū)和平中學(xué) 甘必爭;作文講評之我見[N];學(xué)知報;2011年

4 陽信縣第二高級中學(xué) 何忠;作文教學(xué)[N];學(xué)知報;2011年

5 鹽城市亭湖區(qū)步鳳中學(xué) 李玉鈞;一種新的作文教學(xué)模式:快樂作文[N];學(xué)知報;2011年

6 洛陽市新安縣職業(yè)高中 王麗紅;走出作文教學(xué)的困境[N];學(xué)知報;2011年

7 李支舜 華東師大一附中語文特級教師;作文應(yīng)是個性化的表達(dá)[N];文匯報;2013年

8 栗洪武 陜西師范大學(xué)教育學(xué)院;加強(qiáng)習(xí)字和作文訓(xùn)練 應(yīng)對寫作危機(jī)蔓延[N];中國社會科學(xué)報;2013年

9 江蘇省海安高級中學(xué) 杭禮宏;突破“作文難”困境[N];中國教師報;2014年

10 本報記者 楊詠梅 南京師大附中語文教研組長 王棟生;“反作文”反出真作文[N];中國教育報;2001年

相關(guān)博士學(xué)位論文 前4條

1 李良炎;基于詞聯(lián)接的自然語言處理技術(shù)及其應(yīng)用研究[D];重慶大學(xué);2004年

2 魯松;自然語言處理中詞相關(guān)性知識無導(dǎo)獲取和均衡分類器構(gòu)建[D];中國科學(xué)院研究生院(計算技術(shù)研究所);2001年

3 周雅倩;最大熵方法及其在自然語言處理中的應(yīng)用[D];復(fù)旦大學(xué);2005年

4 王q,

本文編號:2409699


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2409699.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶6c161***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com