電視視頻中的文字識(shí)別及檢索技術(shù)的研究
本文選題:視頻字幕 + 文字檢測(cè)��; 參考:《北京郵電大學(xué)》2016年碩士論文
【摘要】:信息時(shí)代的今天,視頻多媒體內(nèi)容呈現(xiàn)爆炸式增長(zhǎng),對(duì)大量視頻信息進(jìn)行自動(dòng)分析整理成為了當(dāng)下學(xué)術(shù)界和工業(yè)界的迫切需求。視頻字幕與視頻內(nèi)容相關(guān)度較強(qiáng),特征明顯,并且表達(dá)了豐富的視頻高級(jí)語(yǔ)義信息。本文通過(guò)研究視頻字幕檢測(cè)識(shí)別問(wèn)題,依此建立視頻檢索系統(tǒng),來(lái)解決視頻內(nèi)容提取和檢索的相關(guān)問(wèn)題,具體工作如下:(1)提出基于高對(duì)比度圖進(jìn)行圖像文字二值化的算法。本文通過(guò)分析了視頻字幕文字的常見(jiàn)特點(diǎn),利用自適應(yīng)局部對(duì)比度算法得到文字的高對(duì)比度圖像。然后,利用大津?yàn)V波和基于文字圖像灰度統(tǒng)計(jì)分布的方法進(jìn)行文字圖像二值化。(2)關(guān)注字符切分定位算法,通過(guò)分析漢字字形特點(diǎn)和常見(jiàn)切分錯(cuò)誤,使用基于字寬聚類的方法對(duì)二值化文字圖像進(jìn)行單字切分定位。另外,根據(jù)字幕文字在視頻流中停留的特點(diǎn),利用幀間字符融合的方法對(duì)濾波的二值化文字進(jìn)行圖像去噪。(3)實(shí)現(xiàn)了對(duì)大量視頻快速檢索方法。本文以視頻字幕為中心對(duì)視頻信息進(jìn)行結(jié)構(gòu)化分析,并根據(jù)鏡頭檢測(cè)算法提取出字幕對(duì)應(yīng)的關(guān)鍵幀。倒排索引和和空間向量模型的引入使得系統(tǒng)檢索的效率大大提升。(4)提出視頻字幕識(shí)別和檢索的前后端架構(gòu)并進(jìn)行代碼實(shí)現(xiàn)。前端系統(tǒng)負(fù)責(zé)對(duì)視頻流進(jìn)行文字濾波提取以及識(shí)別,由PC或者DSP實(shí)現(xiàn),識(shí)別結(jié)果回傳后端服務(wù)器進(jìn)行建立索引等信息綜合操作。實(shí)驗(yàn)證明,本文提出的算法對(duì)于多種樣式的字幕文字都具有較好的效果。本文根據(jù)不同視頻字幕的特點(diǎn),建立了視頻測(cè)試數(shù)據(jù)集,結(jié)果表明,在具有84%左右字幕識(shí)別準(zhǔn)確度的前提下,系統(tǒng)仍然具有很好的實(shí)時(shí)性,并且具有多路并行視頻處理的潛力。
[Abstract]:With the explosive growth of video multimedia content in the information age, the automatic analysis of a large number of video information has become an urgent need of academia and industry. Video subtitles have strong correlation with video content and are characterized by abundant advanced semantic information. By studying the problem of video subtitle detection and recognition, this paper establishes a video retrieval system to solve the related problems of video content extraction and retrieval. The main work is as follows: 1) an algorithm for binarization of image text based on high contrast graph is proposed. In this paper, we analyze the common features of video captioned text, and use adaptive local contrast algorithm to obtain the high contrast image of text. Then, the text image binarization is carried out by using the Otsu filter and the method based on the grayscale statistical distribution of the character image.) the algorithm of character segmentation localization is concerned. By analyzing the character of Chinese characters and common segmentation errors, A method based on word width clustering is used to locate the binary character image by single word segmentation. In addition, according to the characteristic of subtitle text staying in video stream, a fast retrieval method for a large number of video is realized by using the method of inter-frame character fusion to remove image noise from filtered binary text. In this paper, video subtitles are taken as the center for structured analysis of video information, and key frames corresponding to subtitles are extracted according to shot detection algorithm. With the introduction of inverted index and spatial vector model, the efficiency of system retrieval is greatly improved. (4) the front and back architecture of video subtitle recognition and retrieval is proposed and implemented in code. The front-end system is responsible for the text filtering and recognition of video stream, which is implemented by PC or DSP, and the result is sent back to the back-end server to build the index and other information synthesis operations. Experimental results show that the proposed algorithm is effective for various subtitles. According to the characteristics of different video subtitles, the video test data set is established in this paper. The results show that the system still has good real-time performance and has the potential of multi-channel parallel video processing under the premise of accuracy of about 84% subtitle recognition.
【學(xué)位授予單位】:北京郵電大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP391.41
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 安艷輝,董五洲;粘連搭接字符切分方法研究[J];河北師范大學(xué)學(xué)報(bào);2005年02期
2 安艷輝;董五洲;;基于識(shí)別反饋的粘連字符切分方法研究[J];河北省科學(xué)院學(xué)報(bào);2008年02期
3 劉剛,丁曉青,彭良瑞,劉長(zhǎng)松;多知識(shí)綜合判決的字符切分算法[J];計(jì)算機(jī)工程與應(yīng)用;2002年17期
4 魏湘輝;馬少平;;粘連字符切分綜述[J];計(jì)算機(jī)科學(xué);2004年11期
5 劉陽(yáng)興;;基于折線切分路徑的粘連搭接字符切分算法的研究[J];計(jì)算機(jī)應(yīng)用研究;2011年10期
6 鐘輝;劉輝;姜小帥;;一種基于數(shù)據(jù)分析的字符切分方法[J];沈陽(yáng)建筑大學(xué)學(xué)報(bào)(自然科學(xué)版);2006年01期
7 安艷輝;陳韶霞;劉宗敏;;基于字符類別的識(shí)別反饋混排字符切分方法[J];河北省科學(xué)院學(xué)報(bào);2011年01期
8 韓智;劉昌平;殷緒成;;手寫(xiě)中文信封的地址行字符切分算法[J];中文信息學(xué)報(bào);2006年01期
9 安艷輝;董五洲;張廣慧;;基于輪廓線搜索策略的搭接英文字符切分方法[J];河北省科學(xué)院學(xué)報(bào);2008年01期
10 吳燕;袁保社;;聯(lián)機(jī)手寫(xiě)維文字符切分算法研究[J];微計(jì)算機(jī)信息;2010年12期
相關(guān)會(huì)議論文 前7條
1 陳丹雯;吳玲達(dá);;一種基于互增強(qiáng)原則的視頻檢索重排序方法[A];第三屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2007)論文集[C];2007年
2 蔡奕奕;覃團(tuán)發(fā);;一種利用視頻切片進(jìn)行視頻檢索的方法[A];2007北京地區(qū)高校研究生學(xué)術(shù)交流會(huì)通信與信息技術(shù)會(huì)議論文集(上冊(cè))[C];2008年
3 韓智廣;吳玲達(dá);徐建軍;欒希道;;一種新的用于視頻檢索的語(yǔ)義索引[A];第四屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議論文集[C];2008年
4 孟巖;劉云;;基于字幕的視頻檢索[A];中國(guó)電子學(xué)會(huì)第十五屆信息論學(xué)術(shù)年會(huì)暨第一屆全國(guó)網(wǎng)絡(luò)編碼學(xué)術(shù)年會(huì)論文集(上冊(cè))[C];2008年
5 申鉉京;張婷;千慶姬;;基于內(nèi)容的視頻檢索中運(yùn)動(dòng)分析的研究[A];第三屆全國(guó)信息獲取與處理學(xué)術(shù)會(huì)議論文集[C];2005年
6 彥楠;曾豐;張洪剛;郭軍;;基于反饋的車(chē)牌顏色分類及字符切分[A];2007通信理論與技術(shù)新發(fā)展——第十二屆全國(guó)青年通信學(xué)術(shù)會(huì)議論文集(上冊(cè))[C];2007年
7 尹亞光;;一種基于視頻指紋的視頻檢索方法研究[A];中國(guó)新聞技術(shù)工作者聯(lián)合會(huì)第六次會(huì)員代表大會(huì)、2014年學(xué)術(shù)年會(huì)暨第七屆《王選新聞科學(xué)技術(shù)獎(jiǎng)》和優(yōu)秀論文獎(jiǎng)?lì)C獎(jiǎng)大會(huì)論文集(三等獎(jiǎng))[C];2014年
相關(guān)重要報(bào)紙文章 前2條
1 江西 譚明裕 肖慧清;文字識(shí)別利器——ABBYY Finereader[N];電子報(bào);2013年
2 記者 張建琛;文字識(shí)別技術(shù)為手機(jī)“掃盲”[N];科技日?qǐng)?bào);2005年
相關(guān)博士學(xué)位論文 前7條
1 顧志偉;面向結(jié)構(gòu)化數(shù)據(jù)的視頻檢索研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2008年
2 智敏;基于內(nèi)容的視頻檢索和瀏覽的關(guān)鍵技術(shù)[D];北京郵電大學(xué);2006年
3 曹政;電視節(jié)目自動(dòng)分割與相似視頻檢索[D];中國(guó)科學(xué)技術(shù)大學(xué);2010年
4 林名強(qiáng);視覺(jué)顯著性檢測(cè)模型研究及應(yīng)用[D];中國(guó)科學(xué)技術(shù)大學(xué);2016年
5 姚超;降維算法和手寫(xiě)文字識(shí)別中若干問(wèn)題研究[D];西安電子科技大學(xué);2014年
6 史迎春;基于內(nèi)容的視頻檢索語(yǔ)義提取若干問(wèn)題研究[D];南京理工大學(xué);2005年
7 李玉峰;基于內(nèi)容視頻檢索的鏡頭檢測(cè)及場(chǎng)景檢測(cè)研究[D];天津大學(xué);2009年
相關(guān)碩士學(xué)位論文 前10條
1 張望舒;電視視頻中的文字識(shí)別及檢索技術(shù)的研究[D];北京郵電大學(xué);2016年
2 劉娜;電影《從你的全世界路過(guò)》字幕俄譯實(shí)踐報(bào)告[D];黑龍江大學(xué);2017年
3 劉彥杰;中國(guó)美劇字幕組研究:合作模式與翻譯動(dòng)機(jī)[D];西南大學(xué);2017年
4 安艷輝;中英文混排字符切分方法研究[D];河北大學(xué);2004年
5 董五洲;基于統(tǒng)計(jì)分類的混排字符切分算法的研究[D];燕山大學(xué);2006年
6 張求真;輪胎表面標(biāo)識(shí)字符切分方法研究[D];沈陽(yáng)工業(yè)大學(xué);2013年
7 高麗媛;紀(jì)錄片《我從漢朝來(lái)》(節(jié)選)字幕英譯研究[D];山西師范大學(xué);2017年
8 陳威;基于字符切分和無(wú)監(jiān)督聚類的視頻字幕提取方法[D];北京郵電大學(xué);2011年
9 郭清;目的論視角下《始祖家族》(第三季)的字幕漢譯方法研究[D];西華大學(xué);2017年
10 賈薈弘;網(wǎng)絡(luò)自制綜藝節(jié)目特效字幕研究[D];廣西大學(xué);2017年
,本文編號(hào):1984975
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1984975.html