基于深度學習的場景漢字識別問題研究
發(fā)布時間:2021-03-16 05:02
文字識別是一種通用的圖像理解技術,對信息檢索、自動駕駛等應用的研究有著重要意義,基于自然場景圖像的文字識別逐漸成為計算機視覺研究中的熱點問題,而其中中文場景文字識別是圖像識別中最重要和最具挑戰(zhàn)的任務之一。與英文字符相比,中文字符結構復雜且種類繁多,識別難度大。隨著神經(jīng)網(wǎng)絡的復興,場景文字檢測和識別任務得到了很大推動,近年來涌現(xiàn)了許多基于深度學習的場景文字檢測和識別的算法,但大部分都是面向英文數(shù)據(jù)集的,針對中文場景圖像的研究相對欠缺。本文對當前文字檢測和識別領域的代表性算法進行研究。鑒于場景漢字識別的研究和實際應用需求,本文主要做了以下三個方面的工作:首先,對于在英文數(shù)據(jù)集上表現(xiàn)出色的場景文字檢測和識別算法分別在英文數(shù)據(jù)集和中文數(shù)據(jù)集上進行了大規(guī)模的實驗和性能對比分析,總結中文場景文字檢測和識別問題面臨的挑戰(zhàn);其次,對于自然場景中的非水平文本行不易識別的問題,通過在原始圖像上根據(jù)四邊形坐標點進行透視變換,從中裁剪出文本行區(qū)域進行識別;最后,根據(jù)當前的文字檢測和識別算法在中文場景圖像中存在的問題,設計了一個基于字符檢測的中文場景文字識別算法。一、場景文本檢測和識別算法在各個英文和中文數(shù)據(jù)集...
【文章來源】:河南大學河南省
【文章頁數(shù)】:83 頁
【學位級別】:碩士
【部分圖文】:
掃描文檔圖像
公開數(shù)據(jù)集發(fā)展歷程
EAST網(wǎng)絡結構圖[31]
本文編號:3085458
【文章來源】:河南大學河南省
【文章頁數(shù)】:83 頁
【學位級別】:碩士
【部分圖文】:
掃描文檔圖像
公開數(shù)據(jù)集發(fā)展歷程
EAST網(wǎng)絡結構圖[31]
本文編號:3085458
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3085458.html
最近更新
教材專著