基于深度學(xué)習(xí)的場景漢字識(shí)別問題研究

發(fā)布時(shí)間：2021-03-16 05:02

　　文字識(shí)別是一種通用的圖像理解技術(shù),對信息檢索、自動(dòng)駕駛等應(yīng)用的研究有著重要意義,基于自然場景圖像的文字識(shí)別逐漸成為計(jì)算機(jī)視覺研究中的熱點(diǎn)問題,而其中中文場景文字識(shí)別是圖像識(shí)別中最重要和最具挑戰(zhàn)的任務(wù)之一。與英文字符相比,中文字符結(jié)構(gòu)復(fù)雜且種類繁多,識(shí)別難度大。隨著神經(jīng)網(wǎng)絡(luò)的復(fù)興,場景文字檢測和識(shí)別任務(wù)得到了很大推動(dòng),近年來涌現(xiàn)了許多基于深度學(xué)習(xí)的場景文字檢測和識(shí)別的算法,但大部分都是面向英文數(shù)據(jù)集的,針對中文場景圖像的研究相對欠缺。本文對當(dāng)前文字檢測和識(shí)別領(lǐng)域的代表性算法進(jìn)行研究。鑒于場景漢字識(shí)別的研究和實(shí)際應(yīng)用需求,本文主要做了以下三個(gè)方面的工作:首先,對于在英文數(shù)據(jù)集上表現(xiàn)出色的場景文字檢測和識(shí)別算法分別在英文數(shù)據(jù)集和中文數(shù)據(jù)集上進(jìn)行了大規(guī)模的實(shí)驗(yàn)和性能對比分析,總結(jié)中文場景文字檢測和識(shí)別問題面臨的挑戰(zhàn);其次,對于自然場景中的非水平文本行不易識(shí)別的問題,通過在原始圖像上根據(jù)四邊形坐標(biāo)點(diǎn)進(jìn)行透視變換,從中裁剪出文本行區(qū)域進(jìn)行識(shí)別;最后,根據(jù)當(dāng)前的文字檢測和識(shí)別算法在中文場景圖像中存在的問題,設(shè)計(jì)了一個(gè)基于字符檢測的中文場景文字識(shí)別算法。一、場景文本檢測和識(shí)別算法在各個(gè)英文和中文數(shù)據(jù)集...

【文章來源】：河南大學(xué)河南省

【文章頁數(shù)】：83 頁

【學(xué)位級(jí)別】：碩士

【部分圖文】：

掃描文檔圖像

基于深度學(xué)習(xí)的場景漢字識(shí)別問題研究

公開數(shù)據(jù)集發(fā)展歷程

基于深度學(xué)習(xí)的場景漢字識(shí)別問題研究

EAST網(wǎng)絡(luò)結(jié)構(gòu)圖[31]

本文編號(hào)：3085458

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會(huì)員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3085458.html

上一篇：基于移動(dòng)錨節(jié)點(diǎn)的WSN三維節(jié)點(diǎn)定位算法研究
下一篇：基于貝葉斯神經(jīng)網(wǎng)絡(luò)的優(yōu)化移動(dòng)數(shù)據(jù)業(yè)務(wù)吞吐率方法的應(yīng)用研究

論文發(fā)表

·知網(wǎng)|萬方|維普|龍?jiān)磡省級(jí)|國家級(jí)|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于深度學(xué)習(xí)的場景漢字識(shí)別問題研究