基于Tesseract-OCR的古代漢語文字識別方法的設(shè)計與實現(xiàn)
發(fā)布時間:2023-05-06 20:02
目前市場上針對現(xiàn)代漢語的文字識別技術(shù)已趨于成熟,然而,由于古代文獻(xiàn)存在背景噪聲的干擾、不同書寫風(fēng)格等客觀原因,讓古代漢語文字的識別變得較為復(fù)雜,所以本文針對中國古代漢語文字識別方法進(jìn)行研究和設(shè)計實現(xiàn)。首先,通過對國內(nèi)外相關(guān)技術(shù)的研究現(xiàn)狀進(jìn)行分析,本文對文字圖像預(yù)處理方法和深度神經(jīng)網(wǎng)絡(luò)進(jìn)行了研究,建立模型識別和算法驗證測試。圖像預(yù)處理方面,在圖像預(yù)處理部分:先利用MATLAB工具,根據(jù)迭代法原理設(shè)計程序,完成圖像二值化的仿真實驗;其次利用線性灰度拉伸圖像增強(qiáng)算法和二次函數(shù)圖像增強(qiáng)算法和傾斜校正算法,通過四對透視變換前后對應(yīng)點的坐標(biāo)算出畸變參數(shù)從而求得變換前后關(guān)系,達(dá)到還原圖形,實現(xiàn)透視變換。深度神經(jīng)網(wǎng)絡(luò)技術(shù)方面:首先對Tesseract-OCR開源引擎基本原理進(jìn)行介紹;其次對LSTM神經(jīng)網(wǎng)絡(luò)識別算法進(jìn)行研究,包括基于CNN的圖像特征提取和基于LSTM的語義信息提取;最后,對模型結(jié)構(gòu)及測試結(jié)果進(jìn)行總結(jié)。最后,本文基于Tesseract-OCR進(jìn)行了古代漢語文字識別原型的設(shè)計,包括系統(tǒng)架構(gòu)、系統(tǒng)功能的設(shè)計和系統(tǒng)原型實現(xiàn)與功能測試,測試結(jié)果表明基于Tesseract-OCR的古代漢語文字識別方...
【文章頁數(shù)】:56 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 課題背景及研究意義
1.2 圖像預(yù)處理技術(shù)的國內(nèi)外研究
1.2.1 國內(nèi)研究
1.2.2 國外研究
1.3 Tesseract技術(shù)及深度神經(jīng)網(wǎng)絡(luò)的國內(nèi)外研究
1.3.1 國內(nèi)研究
1.3.2 國外研究
1.4 研究內(nèi)容
第二章 漢字識別相關(guān)技術(shù)介紹
2.1 圖像預(yù)處理技術(shù)
2.2 Tesseract技術(shù)
2.3 深度神經(jīng)網(wǎng)絡(luò)技術(shù)
2.3.1 基于CNN的圖像特征提取
2.3.2 基于LSTM的語義信息提取
2.4 本章小結(jié)
第三章 古代漢語文字圖像預(yù)處理和識別方法的設(shè)計
3.1 二值化
3.2 圖像增強(qiáng)
3.2.1 線性灰度值拉伸圖像增強(qiáng)
3.2.2 二次函數(shù)圖像增強(qiáng)
3.3 傾斜校正
3.4 Tesseract-OCR基本原理
3.4.1 引擎架構(gòu)介紹
3.4.2 文本字符識別
3.5 模型結(jié)構(gòu)及測試結(jié)果
3.6 本章小結(jié)
第四章 基于Tesseract-OCR的古代漢語文字識別系統(tǒng)實現(xiàn)
4.1 系統(tǒng)架構(gòu)設(shè)計
4.2 系統(tǒng)功能設(shè)計
4.2.1 圖像上傳模塊功能設(shè)計
4.2.2 圖像預(yù)處理模塊功能設(shè)計
4.2.3 文字識別模塊功能設(shè)計
4.3 系統(tǒng)原型實現(xiàn)與功能測試
4.3.1 系統(tǒng)原型實現(xiàn)
4.3.2 系統(tǒng)功能測試
4.4 本章小結(jié)
第五章 總結(jié)與展望
5.1 總結(jié)
5.2 展望
參考文獻(xiàn)
附錄1 攻讀碩士學(xué)位期間申請的專利
致謝
本文編號:3809534
【文章頁數(shù)】:56 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第一章 緒論
1.1 課題背景及研究意義
1.2 圖像預(yù)處理技術(shù)的國內(nèi)外研究
1.2.1 國內(nèi)研究
1.2.2 國外研究
1.3 Tesseract技術(shù)及深度神經(jīng)網(wǎng)絡(luò)的國內(nèi)外研究
1.3.1 國內(nèi)研究
1.3.2 國外研究
1.4 研究內(nèi)容
第二章 漢字識別相關(guān)技術(shù)介紹
2.1 圖像預(yù)處理技術(shù)
2.2 Tesseract技術(shù)
2.3 深度神經(jīng)網(wǎng)絡(luò)技術(shù)
2.3.1 基于CNN的圖像特征提取
2.3.2 基于LSTM的語義信息提取
2.4 本章小結(jié)
第三章 古代漢語文字圖像預(yù)處理和識別方法的設(shè)計
3.1 二值化
3.2 圖像增強(qiáng)
3.2.1 線性灰度值拉伸圖像增強(qiáng)
3.2.2 二次函數(shù)圖像增強(qiáng)
3.3 傾斜校正
3.4 Tesseract-OCR基本原理
3.4.1 引擎架構(gòu)介紹
3.4.2 文本字符識別
3.5 模型結(jié)構(gòu)及測試結(jié)果
3.6 本章小結(jié)
第四章 基于Tesseract-OCR的古代漢語文字識別系統(tǒng)實現(xiàn)
4.1 系統(tǒng)架構(gòu)設(shè)計
4.2 系統(tǒng)功能設(shè)計
4.2.1 圖像上傳模塊功能設(shè)計
4.2.2 圖像預(yù)處理模塊功能設(shè)計
4.2.3 文字識別模塊功能設(shè)計
4.3 系統(tǒng)原型實現(xiàn)與功能測試
4.3.1 系統(tǒng)原型實現(xiàn)
4.3.2 系統(tǒng)功能測試
4.4 本章小結(jié)
第五章 總結(jié)與展望
5.1 總結(jié)
5.2 展望
參考文獻(xiàn)
附錄1 攻讀碩士學(xué)位期間申請的專利
致謝
本文編號:3809534
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3809534.html
最近更新
教材專著