天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于神經(jīng)網(wǎng)絡(luò)的自然場景中的字符識別算法的研究與實現(xiàn)

發(fā)布時間:2022-02-22 17:44
  近年來,隨著移動網(wǎng)絡(luò)的普及和手機的大量使用,人們從自然場景獲取和分享圖片的方式越來越多,從海量的自然場景圖片中識別出字符變得越來越重要,智慧城市、工業(yè)自動化等都需要實時的識別出場景字符。場景字符識別屬于文本識別的范圍。在傳統(tǒng)的識別方法中,往往需要手動去設(shè)計特征,鑒于背景的多樣化和隨意性,這種傳統(tǒng)的算法往往滿足不了實際的需求。而深度學習技術(shù)的快速發(fā)展為自然場景中字符檢測與識別帶來了新的契機。相比于傳統(tǒng)的識別方式,神經(jīng)網(wǎng)絡(luò)不但可以通過卷積自動提取圖像特征,還可避免傳統(tǒng)方式中手工設(shè)計特征帶來的龐大的工作量,因此,使用神經(jīng)網(wǎng)絡(luò)進行自然場景字符識別已經(jīng)成為當前的主要研究方向。當前的自然場景字符識別算法雖然已經(jīng)取得了很大的進步,但是還存在以下問題:對小目標的檢測的效果不好;很難區(qū)分粘連的文本;對于彎曲文本,檢測和識別效果一直都不好。針對以上問題,本文做了以下幾點創(chuàng)新性的改進工作,具體研究工作如下:1、針對小目標檢測效果不好的問題,本文結(jié)合了基于像素分割的檢測方法和形態(tài)學中的腐蝕和膨脹算法,通過腐蝕去除無關(guān)小目標,再進行膨脹對真正的小目標區(qū)域進行擴張,從而能有效的檢測出小目標,在Total-Text... 

【文章來源】:電子科技大學四川省211工程院校985工程院校教育部直屬院校

【文章頁數(shù)】:69 頁

【學位級別】:碩士

【文章目錄】:
摘要
abstract
第一章 緒論
    1.1 研究工作的背景與意義
    1.2 自然環(huán)境下字符識別技術(shù)的國內(nèi)外研究歷史與現(xiàn)狀
        1.2.1 基于候選框的文本檢測
        1.2.2 基于分割的文本檢測
        1.2.3 文本識別方法
    1.3 本文的主要內(nèi)容與創(chuàng)新
    1.4 本論文的結(jié)構(gòu)安排
第二章 相關(guān)理論和技術(shù)
    2.1 卷積神經(jīng)網(wǎng)絡(luò)
        2.1.1 卷積神經(jīng)網(wǎng)絡(luò)的基本原理
        2.1.2 卷積神經(jīng)網(wǎng)絡(luò)的基本概念
        2.1.3 優(yōu)化器
        2.1.4 網(wǎng)絡(luò)的訓練
        2.1.5 卷積神經(jīng)網(wǎng)絡(luò)和傳統(tǒng)神經(jīng)網(wǎng)絡(luò)
    2.2 循環(huán)神經(jīng)網(wǎng)絡(luò)
        2.2.1 RNN
        2.2.2 LSTM
        2.2.3 LSTM的內(nèi)部原理
        2.2.4 CTC
        2.2.5 Attention機制
    2.3 本章小結(jié)
第三章 文本檢測算法的研究與實現(xiàn)
    3.1 文本檢測與識別的常用方案
    3.2 通用的物體檢測模型
        3.2.1 SSD
        3.2.2 Faster-RCNN
    3.3 PSENet
        3.3.1 整體流程
        3.3.2 主干網(wǎng)絡(luò)
        3.3.3 漸進式尺度擴展算法
        3.3.4 Label生成
        3.3.5 損失函數(shù)
    3.4 PSENet的改進
        3.4.1 主干網(wǎng)絡(luò)的改進
        3.4.2 label生成的改進
        3.4.3 Loss改進
    3.5 實驗
        3.5.1 搭建實驗環(huán)境
        3.5.2 準備實驗數(shù)據(jù)
        3.5.3 定義評價指標
        3.5.4 定義網(wǎng)絡(luò)模型
        3.5.5 模型的訓練與測試
    3.6 本章小結(jié)
第四章 文本識別算法的研究與實現(xiàn)
    4.1 文本識別概述
    4.2 典型的文本識別結(jié)構(gòu)
        4.2.1 CRNN+CTC
        4.2.2 CNN+Seq2Seq+Attention
        4.2.3 Transformer
    4.3 文本識別模塊的實現(xiàn)
        4.3.1 識別架構(gòu)的設(shè)計與實現(xiàn)
        4.3.2 Encoder實現(xiàn)
        4.3.3 Decoder實現(xiàn)
        4.3.4 數(shù)據(jù)與預處理
        4.3.5 Loss函數(shù)選擇
        4.3.6 訓練過程設(shè)計
        4.3.7 預測過程設(shè)計
        4.3.8 文本識別效果展示
    4.4 本章小結(jié)
第五章 全文總結(jié)與展望
    5.1 全文總結(jié)
    5.2 后續(xù)工作展望
致謝
參考文獻



本文編號:3639935

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3639935.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶9497e***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com