視頻廣告文本提取算法的研究
發(fā)布時(shí)間:2017-08-23 21:08
本文關(guān)鍵詞:視頻廣告文本提取算法的研究
更多相關(guān)文章: 視頻文本 支持向量機(jī) 圖割 卷積神經(jīng)網(wǎng)絡(luò)
【摘要】:隨著網(wǎng)絡(luò)和多媒體技術(shù)的發(fā)展以及智能終端的普及,錄制各種各樣的視頻廣告并將其投放在網(wǎng)絡(luò)上傳播變得越來越容易,視頻廣告已經(jīng)成為當(dāng)今社會(huì)最流行的商業(yè)媒介,已經(jīng)成為公司提升品牌認(rèn)知度的重要手段。視頻廣告中的文本主要包括廣告商品的名稱,商品的生產(chǎn)地,及對(duì)商品功能等的說明,是廣告視頻內(nèi)容的高度概括,能夠充分表現(xiàn)視頻內(nèi)容,因此視頻廣告文本提取技術(shù)對(duì)廣告視頻數(shù)據(jù)的管理有重要意義。而且視頻廣告文本提取技術(shù)研究可以幫助監(jiān)管部門自動(dòng)檢測(cè)和過濾廣告中敏感詞匯,保障廣告行業(yè)健康有序發(fā)展。為了能夠吸引觀眾的眼球,視頻廣告中的文本在字體,排列方式,顏色設(shè)計(jì)等方面變化多樣,表現(xiàn)形式非常復(fù)雜。與其他文本提取技術(shù)相比,從廣告視頻中提取文本更具有挑戰(zhàn)性。本文主要對(duì)現(xiàn)有文本定位,分割和識(shí)別技術(shù)進(jìn)行了詳細(xì)研究,并分析了它們的優(yōu)勢(shì)和不足,提出適用于廣告視頻中文本的定位,分割和識(shí)別方法。針對(duì)文本定位,采用由粗到細(xì)分兩階段的定位方法。首先利用圖像的邊緣特征和連通區(qū)域分析完成文本的粗定位。然后,在有標(biāo)簽協(xié)同數(shù)據(jù)集,利用基于小波分解的頻域特征和灰度共生矩陣特征用Co-training算法訓(xùn)練支持向量機(jī),用訓(xùn)練得到的支持向量機(jī)完成文本的細(xì)定位;谟袠(biāo)簽協(xié)同數(shù)據(jù)集的Co-training算法解決了傳統(tǒng)Co-training訓(xùn)練方法容易向訓(xùn)練數(shù)據(jù)集引入錯(cuò)誤分類樣本的問題。由于沒有公開的視頻廣告數(shù)據(jù)集,本文從網(wǎng)絡(luò)中收集廣告文本圖像集。針對(duì)文本分割,本文采用一種自動(dòng)種子算法,并將這個(gè)算法應(yīng)用到迭代圖割算法中,完成文本的分割。針對(duì)文本識(shí)別,本文對(duì)卷積網(wǎng)絡(luò)的結(jié)構(gòu)進(jìn)行了詳細(xì)的研究和分析,采用了基于卷積神經(jīng)網(wǎng)絡(luò)的文本識(shí)別程序的思想。在LeNet-5網(wǎng)絡(luò)模型的基礎(chǔ)上,設(shè)計(jì)了適用于廣告視頻文本識(shí)別的網(wǎng)絡(luò)結(jié)構(gòu)。為了中文的識(shí)別,利用文字生成器,建立文本圖片訓(xùn)練數(shù)據(jù)集,用于學(xué)習(xí)網(wǎng)絡(luò)結(jié)構(gòu)。
【關(guān)鍵詞】:視頻文本 支持向量機(jī) 圖割 卷積神經(jīng)網(wǎng)絡(luò)
【學(xué)位授予單位】:電子科技大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:TP391.1
,
本文編號(hào):727302
本文鏈接:http://sikaile.net/wenyilunwen/guanggaoshejilunwen/727302.html
最近更新
教材專著