視頻內(nèi)容結(jié)構(gòu)化技術(shù)的研究與實(shí)現(xiàn)
本文選題:視頻內(nèi)容 + 視頻結(jié)構(gòu)化 ; 參考:《中國人民解放軍國防科學(xué)技術(shù)大學(xué)》2001年博士論文
【摘要】: 視頻媒體的無結(jié)構(gòu)性是阻礙新一代視頻應(yīng)用的瓶頸問題。本文全面而系統(tǒng)地研究了視頻無結(jié)構(gòu)性問題的解決之道。在對視頻制作和感知理論系統(tǒng)研究的基礎(chǔ)上,將語義標(biāo)注和句法分段技術(shù)有機(jī)的結(jié)合起來,在低中高三個不同的層次上對視頻內(nèi)容結(jié)構(gòu)化技術(shù)作了深入的研究,主要的工作和貢獻(xiàn)包括: ◆ 厘清了視頻內(nèi)容結(jié)構(gòu)化這一交叉研究領(lǐng)域,明確了要解決的根本問題,應(yīng)采取的技術(shù)途徑和基本方法論,提出了由句法分段和語義標(biāo)注構(gòu)成的低、中、高整體研究框架; ◆ 系統(tǒng)研究了視頻內(nèi)容制作和感知的一般過程,指出視頻內(nèi)容的制作和感知實(shí)質(zhì)上遵循共同的基本規(guī)律,剖析和總結(jié)了這些基本規(guī)律對視頻內(nèi)容結(jié)構(gòu)化技術(shù)的指示意義; ◆ 全面探索了中、低層視頻內(nèi)容結(jié)構(gòu)化技術(shù)的各種重要技術(shù),設(shè)計和改進(jìn)了部分關(guān)鍵算法,包括:視音頻鏡頭、故事單元、音頻大段等句法分段技術(shù)和閃光探測、音頻鏡頭分類、段落分界符、廣告、動作型故事單元等語義標(biāo)注技術(shù); ◆ 分別研究了新聞、體育、故事片和電視劇等類視頻的高層內(nèi)容結(jié)構(gòu)化技術(shù),解決了新聞故事探測、半透明字幕探測、角色標(biāo)注、精彩標(biāo)注等關(guān)鍵問題; ◆ 設(shè)計和實(shí)現(xiàn)了支撐視頻內(nèi)容結(jié)構(gòu)化研究的VideoCar實(shí)驗(yàn)床,,該實(shí)驗(yàn)床在實(shí)際使用中收到好的效果。
[Abstract]:The lack of structure of video media is the bottleneck of the new generation of video applications.In this paper, the solution to the problem of no structure in video is studied comprehensively and systematically.Based on the systematic research of video production and perception theory, this paper combines semantic tagging with syntactic segmentation technology, and makes a deep research on the structure technology of video content at three different levels of low, middle and high levels.The main work and contributions include:This paper clarifies the cross-research field of video content structure, clarifies the fundamental problems to be solved, the technical approach and basic methodology to be adopted, and puts forward a low, medium and high overall research framework composed of syntactic segmentation and semantic annotation.This paper systematically studies the general process of video content production and perception, points out that the production and perception of video content actually follow the common basic laws, and analyzes and summarizes the instructive significance of these basic laws to the structured video content technology.This paper comprehensively explores all kinds of important techniques of middle and low level video content structure technology, designs and improves some key algorithms, including: video and audio lens, story unit, audio segment and other syntactic segmentation techniques and flash detection.Audio shot classification, paragraph delimiter, advertising, action story unit and other semantic tagging technology;This paper studies the high-level content structure technology of news, sports, feature film and TV series, and solves the key problems, such as news story detection, translucent subtitle detection, role tagging, wonderful annotation and so on.The VideoCar experimental bed which supports the research of video content structure is designed and implemented. The experimental bed has good effect in practical use.
【學(xué)位授予單位】:中國人民解放軍國防科學(xué)技術(shù)大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2001
【分類號】:TN948.12
【引證文獻(xiàn)】
相關(guān)期刊論文 前2條
1 陳劍峗,李云浩,吳玲達(dá),老松揚(yáng),白亮;輔助足球視頻切分的音頻自動分類與分段[J];國防科技大學(xué)學(xué)報;2004年06期
2 朱健;曹紅兵;徐華安;劉海濤;;基于多傳感器信息融合的智能交通信息語義描述[J];現(xiàn)代電子技術(shù);2011年24期
相關(guān)博士學(xué)位論文 前2條
1 王辰;多媒體融合分析技術(shù)的研究與實(shí)現(xiàn)[D];中國人民解放軍國防科學(xué)技術(shù)大學(xué);2002年
2 凌堅;新聞視頻主題識別與跟蹤的研究[D];浙江大學(xué);2007年
相關(guān)碩士學(xué)位論文 前7條
1 白志杰;新聞視頻主題追蹤技術(shù)研究[D];解放軍信息工程大學(xué);2009年
2 于秀;近似字符串匹配在基于內(nèi)容的視頻檢索中的應(yīng)用[D];山東大學(xué);2011年
3 王軍偉;基于NMF垃圾郵件過濾系統(tǒng)研究[D];華中科技大學(xué);2009年
4 朱小俊;自適應(yīng)鏡頭探測技術(shù)的研究與實(shí)現(xiàn)[D];中國人民解放軍國防科學(xué)技術(shù)大學(xué);2002年
5 韓智廣;輔助視頻情報分析的字幕探測技術(shù)研究與實(shí)現(xiàn)[D];中國人民解放軍國防科學(xué)技術(shù)大學(xué);2002年
6 劉生貴;基于內(nèi)容的視頻檢索研究與實(shí)現(xiàn)[D];四川大學(xué);2006年
7 晉云功;基于壓縮域的視頻關(guān)鍵幀提取算法研究[D];北京交通大學(xué);2009年
本文編號:1733464
本文鏈接:http://sikaile.net/wenyilunwen/guanggaoshejilunwen/1733464.html