Read Math Problems Using A Multi-stage Method
發(fā)布時間:2021-07-28 08:33
教育是人類生活中不可或缺的領(lǐng)域,而考試是檢驗教育成果的基本手段之一。因此,在各級學(xué)校,尤其是中小學(xué)中,教師的很大一部分精力耗費在批改試卷和評分上,而且紙質(zhì)試卷也需要一定的空間進行存儲。因此,試卷的數(shù)字化和識別有助于減輕教師工作壓力,減少試卷的存儲和維護成本,同時方便查找特定試卷,并可以為未來的教育領(lǐng)域應(yīng)用,如自動評分系統(tǒng)提供數(shù)據(jù)準(zhǔn)備。為了識別試卷、將試卷數(shù)字化,本文提出了一種多階段的方法讀取數(shù)學(xué)試卷中的題目。該方法主要包括文檔版面分析、字符分割、中文與非中文文本分類、字符識別等四個階段。通過掃描得到的數(shù)學(xué)試卷圖片經(jīng)過二值化得到黑白兩色圖像,再使用圖像腐蝕方法對文本部分進行膨脹處理,然后使用文檔版面分析方法對圖片進行連通域分析,根據(jù)連通域的高度將圖片中的各種圖和文本分離。從圖片中提取文本部分之后,使用字符分割方法將純文本圖片分割成單個字符的圖片。在中文與非中文文本分類部分,使用深度學(xué)習(xí)方法,訓(xùn)練深層神經(jīng)網(wǎng)絡(luò)對字符分割的結(jié)果進行分類。由于網(wǎng)絡(luò)上已有很多程序接口和網(wǎng)站可以執(zhí)行中文識別,并且可以取得很好的效果,在本文所提出的多階段讀題方法中,不包含對中文字符的識別。在得到中文與非中文文本分類的...
【文章來源】:華中師范大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁數(shù)】:72 頁
【學(xué)位級別】:碩士
【文章目錄】:
abstract
摘要
Acknowledgements
Chapter 1 Introduction
1.1 Research Background
1.2 Research Challenges
1.3 Objectives and Contributions
1.4 Thesis Structure
Chapter 2 Literature Review
2.1 Document Layout Analysis
2.2 Character Recognition
2.3 Convolutional Neural Networks
2.4 Summary
Chapter 3 The Proposed Framework
3.1 Overview
3.2 Document Layout Analysis for Test Papers
3.3 Character Segmentation
3.4 The Two-stage Method for Character Recognition using DCNNs
3.5 Summary
Chapter 4 Experiments
4.1 Experiment Settings
4.1.1 Dataset
4.1.2 Development Environment
4.2 Experiment Results
4.2.1 Document Layout Analysis
4.2.2 Character Segmentation
4.2.3 Binary Classification
4.2.4 Character Recognition
4.2.5 Reading Problems
4.3 Summary
Chapter 5 Conclusion and Future Work
References
Index
本文編號:3307584
【文章來源】:華中師范大學(xué)湖北省 211工程院校 教育部直屬院校
【文章頁數(shù)】:72 頁
【學(xué)位級別】:碩士
【文章目錄】:
abstract
摘要
Acknowledgements
Chapter 1 Introduction
1.1 Research Background
1.2 Research Challenges
1.3 Objectives and Contributions
1.4 Thesis Structure
Chapter 2 Literature Review
2.1 Document Layout Analysis
2.2 Character Recognition
2.3 Convolutional Neural Networks
2.4 Summary
Chapter 3 The Proposed Framework
3.1 Overview
3.2 Document Layout Analysis for Test Papers
3.3 Character Segmentation
3.4 The Two-stage Method for Character Recognition using DCNNs
3.5 Summary
Chapter 4 Experiments
4.1 Experiment Settings
4.1.1 Dataset
4.1.2 Development Environment
4.2 Experiment Results
4.2.1 Document Layout Analysis
4.2.2 Character Segmentation
4.2.3 Binary Classification
4.2.4 Character Recognition
4.2.5 Reading Problems
4.3 Summary
Chapter 5 Conclusion and Future Work
References
Index
本文編號:3307584
本文鏈接:http://sikaile.net/jiaoyulunwen/ydsp/3307584.html
教材專著