天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 自動化論文 >

基于深度學習的視頻文字檢測技術

發(fā)布時間:2021-07-24 23:20
  隨著互聯(lián)網(wǎng)技術的飛速發(fā)展,計算機視覺內各個分支領域獲得突破性進展,特別在圖像檢測,目標跟蹤方向,結合卷積神經(jīng)網(wǎng)絡的圖像特征提取能力,已經(jīng)獲得了優(yōu)異的成績,在文字識別提取方向,深度學習與傳統(tǒng)圖像分析的結合使用使得圖像語義分析方向也有很大進展。本論文中設計了一套完整的視頻文字識別的架構,結合圖像文字檢測技術,視頻關鍵幀提取技術以及多語言文字識別技術,實現(xiàn)了視頻內部自然場景及人工添加文本的提取與識別。其中,文字檢測技術采用了YOLO與PixelLink相結合的方法,兩者原理可以互補,對檢測性能略有提升,另外,視頻關鍵幀處理技術中使用了文字區(qū)域作為關注重點,結合聚類算法與像素點等邏輯對幀畫面的重復信息進行壓縮篩選。最終,利用卷積循環(huán)神經(jīng)網(wǎng)絡實現(xiàn)對中文,英文,數(shù)字等字符的識別功能。在分別驗證完各個模塊的功能以后,結合了三個模塊,實現(xiàn)了視頻內文字的識別功能。 

【文章來源】:北京郵電大學北京市 211工程院校 教育部直屬院校

【文章頁數(shù)】:64 頁

【學位級別】:碩士

【部分圖文】:

基于深度學習的視頻文字檢測技術


圖2.1卷積神經(jīng)網(wǎng)絡(CNN)樣例圖??

原理圖,原理圖


2.3文字定位算法YOLO??YOLO算法將目標檢測問題理解為回歸預測,避免了對圖像進行一系列改動??生成中間圖像。YOLO之前的大多數(shù)物體檢測算法大多采用了分類器來進行物體??檢測,YOLO而是采用卷積神經(jīng)網(wǎng)絡對整個圖像的信息感知,直接預測目標的邊??緣、并能夠依照框內特征識別目標內容,從而實現(xiàn)端到端的目標檢測,如圖所示。??YOLO相比于之前的算法有許多優(yōu)點,首先是檢測速率非常快。之前的算法中,??分類器會選取圖像中的不同尺寸不同位置作為備選區(qū)域,然后采用分類器去判定??其內部是否包含物體,YOLO的檢測過程相比下較為簡單,甚至可以實現(xiàn)實時物??體檢測。YOLO采大大減少背景預測錯誤的產(chǎn)生,與其他方法所利用的滑動窗口??或區(qū)域策略不同的是,用整張圖像的感知信息進行預測,而其他方法則缺少了對??整體畫面的信息感知,例如Fast?R-CNN方法經(jīng)常會將背景塊檢測為目標物體,??而YOLO方法中背景預測錯誤率大大降低。YOLO可以學習到目標的概括信息。??YOLO在某種程度上檢測要比其他物體檢測方法好,因為YOLO可以對物體信??息進行訓練學習到高度泛化的特征,遷移性比其他方法強很多。??Inference??

原理圖,原理圖,官方,數(shù)據(jù)集


圖2.?3?darknet-53的網(wǎng)絡結構??采用YOLOv3目前可以直接采用官方網(wǎng)站所訓練好的一系列模型,除了可以??采取這些訓練好的模型進行微調遷移以外,一般情況下要訓練自己的數(shù)據(jù)集,所??

【參考文獻】:
期刊論文
[1]基于深度學習文字檢測的復雜環(huán)境車牌定位方法[J]. 李海燕,常富蓉.  現(xiàn)代計算機(專業(yè)版). 2017(33)
[2]基于小波變換的視頻流鏡頭切分及關鍵幀提取[J]. 吳紹根.  計算機與數(shù)字工程. 2016(09)
[3]基于目標變化的監(jiān)控視頻關鍵幀提取方法[J]. 周萍.  計算機與現(xiàn)代化. 2016(08)
[4]基于改進分塊顏色特征和二次提取的關鍵幀提取算法[J]. 劉華詠,李濤.  計算機科學. 2015(12)
[5]基于關鍵幀多特征融合的視頻拷貝檢測[J]. 張興忠,李皓,張三義.  太原理工大學學報. 2015(05)
[6]基于顏色聚類和多幀融合的視頻文字識別方法[J]. 易劍,彭宇新,肖建國.  軟件學報. 2011(12)
[7]基于梯度離散余弦變換的視頻文字定位[J]. 顏俊華,李丹,周亞同.  計算機科學. 2011(09)
[8]基于文字穿越線和筆畫連通性的視頻文字提取方法[J]. 田破荒,彭天強,李弼程.  電子學報. 2009(01)
[9]一種基于直方圖特征和AdaBoost的圖像中的文字定位算法[J]. 李闖,丁曉青,吳佑壽.  中國圖象圖形學報. 2006(03)

博士論文
[1]故事視頻的語義分析與提取[D]. 趙志誠.北京郵電大學 2008

碩士論文
[1]PixelLink:基于實例分割的自然場景文本檢測算法[D]. 鄧丹.浙江大學 2018
[2]視頻摘要的算法研究[D]. 張亞洲.杭州電子科技大學 2017
[3]基于內容的視頻檢索關鍵技術的研究[D]. 白慧茹.太原理工大學 2017
[4]基于聚類的視頻分類方法研究[D]. 查日盼.淮北師范大學 2017
[5]基于OpenCV手機拍照快遞單文字識別的研究[D]. 馬玲玉.哈爾濱商業(yè)大學 2016
[6]基于深度學習的自然場景文字識別[D]. 黃攀.浙江大學 2016
[7]視頻檢索中維吾爾文字幕關鍵幀提取研究[D]. 閆軻.新疆大學 2015
[8]基于深度學習的自然場景文本識別系統(tǒng)的設計與實現(xiàn)[D]. 馬然.吉林大學 2015
[9]視頻檢索中基于多特征的關鍵幀提取算法研究[D]. 柳雪.中國礦業(yè)大學 2015
[10]復雜背景圖像中的文字提取算法研究[D]. 汪波.長安大學 2014



本文編號:3301633

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3301633.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶0790e***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com