基于深度學(xué)習(xí)的場景漢字識(shí)別問題研究
發(fā)布時(shí)間:2021-03-16 05:02
文字識(shí)別是一種通用的圖像理解技術(shù),對信息檢索、自動(dòng)駕駛等應(yīng)用的研究有著重要意義,基于自然場景圖像的文字識(shí)別逐漸成為計(jì)算機(jī)視覺研究中的熱點(diǎn)問題,而其中中文場景文字識(shí)別是圖像識(shí)別中最重要和最具挑戰(zhàn)的任務(wù)之一。與英文字符相比,中文字符結(jié)構(gòu)復(fù)雜且種類繁多,識(shí)別難度大。隨著神經(jīng)網(wǎng)絡(luò)的復(fù)興,場景文字檢測和識(shí)別任務(wù)得到了很大推動(dòng),近年來涌現(xiàn)了許多基于深度學(xué)習(xí)的場景文字檢測和識(shí)別的算法,但大部分都是面向英文數(shù)據(jù)集的,針對中文場景圖像的研究相對欠缺。本文對當(dāng)前文字檢測和識(shí)別領(lǐng)域的代表性算法進(jìn)行研究。鑒于場景漢字識(shí)別的研究和實(shí)際應(yīng)用需求,本文主要做了以下三個(gè)方面的工作:首先,對于在英文數(shù)據(jù)集上表現(xiàn)出色的場景文字檢測和識(shí)別算法分別在英文數(shù)據(jù)集和中文數(shù)據(jù)集上進(jìn)行了大規(guī)模的實(shí)驗(yàn)和性能對比分析,總結(jié)中文場景文字檢測和識(shí)別問題面臨的挑戰(zhàn);其次,對于自然場景中的非水平文本行不易識(shí)別的問題,通過在原始圖像上根據(jù)四邊形坐標(biāo)點(diǎn)進(jìn)行透視變換,從中裁剪出文本行區(qū)域進(jìn)行識(shí)別;最后,根據(jù)當(dāng)前的文字檢測和識(shí)別算法在中文場景圖像中存在的問題,設(shè)計(jì)了一個(gè)基于字符檢測的中文場景文字識(shí)別算法。一、場景文本檢測和識(shí)別算法在各個(gè)英文和中文數(shù)據(jù)集...
【文章來源】:河南大學(xué)河南省
【文章頁數(shù)】:83 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
掃描文檔圖像
公開數(shù)據(jù)集發(fā)展歷程
EAST網(wǎng)絡(luò)結(jié)構(gòu)圖[31]
本文編號(hào):3085458
【文章來源】:河南大學(xué)河南省
【文章頁數(shù)】:83 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
掃描文檔圖像
公開數(shù)據(jù)集發(fā)展歷程
EAST網(wǎng)絡(luò)結(jié)構(gòu)圖[31]
本文編號(hào):3085458
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3085458.html
最近更新
教材專著