天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于深度神經(jīng)網(wǎng)絡(luò)的自然場景文本識別

發(fā)布時間:2022-08-09 09:33
  文字,作為記錄思想、承載語言的工具,在人類社會的發(fā)展中發(fā)揮著舉足輕重的作用。自然場景下的文本含有豐富的信息,利用現(xiàn)代化技術(shù)獲取這些信息可以給人類的工作和生活帶來極大的便利。自然場景下的文本復(fù)雜多變,與排版標(biāo)準(zhǔn)、分辨率高的印刷文本相比,具有字體多樣、背景復(fù)雜、分布隨意、干擾因素多的特點,用傳統(tǒng)的光學(xué)字符識別技術(shù)(OCR技術(shù))對其進(jìn)行識別達(dá)到的識別率低,不能滿足實際使用需求。本文在對國內(nèi)外自然場景文本識別及深度學(xué)習(xí)領(lǐng)域的相關(guān)文獻(xiàn)研究的基礎(chǔ)上,提出了基于深度學(xué)習(xí)的自然場景文本識別方法,以實現(xiàn)自然場景下的文本識別,達(dá)到一定的識別準(zhǔn)確率和識別效率。本文的主要創(chuàng)新點和研究成果如下:(1)提出了一個卷積神經(jīng)網(wǎng)絡(luò)(CNN)和遞歸神經(jīng)網(wǎng)絡(luò)(RNN)相結(jié)合的端到端深度神經(jīng)網(wǎng)絡(luò)框架。自然場景下的文本識別分為特征提取和特征識別兩部分,該模型采用編碼器-譯碼器結(jié)構(gòu),將卷積神經(jīng)網(wǎng)絡(luò)作為模型的編碼器,完成特征提取部分的功能。遞歸神經(jīng)網(wǎng)絡(luò)作為模型的譯碼器,結(jié)合前后輸入進(jìn)行識別,完成特征識別部分的功能。將訓(xùn)練后得到的最終模型在4個當(dāng)下流行且具有代表性的數(shù)據(jù)集IC03、IC13、IIIT5K、SVT上進(jìn)行測試。結(jié)果表明,... 

【文章頁數(shù)】:64 頁

【學(xué)位級別】:碩士

【文章目錄】:
摘要
Abstract
第1章 緒論
    1.1 研究背景及意義
    1.2 國內(nèi)外研究現(xiàn)狀
        1.2.1 基于字符的識別
        1.2.2 基于整個單詞的識別
    1.3 本文主要研究內(nèi)容
        1.3.1 主要研究內(nèi)容
        1.3.2 論文的組織結(jié)構(gòu)
第2章 深度學(xué)習(xí)基本理論
    2.1 深度學(xué)習(xí)概述
    2.2 卷積神經(jīng)網(wǎng)絡(luò)
        2.2.1 卷積層
        2.2.2 池化層
        2.2.3 激活函數(shù)
        2.2.4 損失函數(shù)
    2.3 循環(huán)神經(jīng)網(wǎng)絡(luò)
        2.3.1 LSTM
        2.3.2 GRU
    2.4 神經(jīng)網(wǎng)絡(luò)的訓(xùn)練
        2.4.1 訓(xùn)練策略
            2.4.1.1 標(biāo)準(zhǔn)梯度下降法
            2.4.1.2 隨機(jī)梯度下降法
            2.4.1.3 小批量梯度下降法
        2.4.2 優(yōu)化器
            2.4.2.1 動量
            2.4.2.2 Adagrad
            2.4.2.3 AdaDelta
            2.4.2.4 Adam
        2.4.3 過擬合解決辦法
            2.4.3.1 提前終止
            2.4.3.2 數(shù)據(jù)集增廣
            2.4.3.3 Dropout
    2.5 小結(jié)
第3章 深度神經(jīng)網(wǎng)絡(luò)
    3.1 引言
    3.2 深度神經(jīng)網(wǎng)絡(luò)
        3.2.1 模型結(jié)構(gòu)
        3.2.2 卷積神經(jīng)網(wǎng)絡(luò)層
        3.2.3 雙向LSTM網(wǎng)絡(luò)層
        3.2.4 轉(zhuǎn)錄層
    3.3 網(wǎng)絡(luò)訓(xùn)練
    3.4 實驗與分析
        3.4.1 軟硬件環(huán)境配置
        3.4.2 深度學(xué)習(xí)框架TensorFlow
        3.4.3 數(shù)據(jù)集
            3.4.3.1 訓(xùn)練集
            3.4.3.2 測試集
        3.4.4 實驗結(jié)果分析
    3.5 小結(jié)
第4章 基于注意力機(jī)制的深度神經(jīng)網(wǎng)絡(luò)
    4.1 引言
    4.2 注意力機(jī)制
        4.2.1 軟注意力機(jī)制
        4.2.2 硬注意力機(jī)制
    4.3 基于軟注意力機(jī)制的深度神經(jīng)網(wǎng)絡(luò)
    4.4 實驗結(jié)果分析
    4.5 小結(jié)
結(jié)論
參考文獻(xiàn)
附錄 A (攻讀碩士學(xué)位期間所發(fā)表的學(xué)術(shù)論文)
附錄 B (攻讀碩士學(xué)位期間所參加的學(xué)術(shù)科研活動)
致謝



本文編號:3672313

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3672313.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶3b288***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com