天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

面向視頻理解的視頻表征模型及應用研究

發(fā)布時間:2017-03-21 08:04

  本文關鍵詞:面向視頻理解的視頻表征模型及應用研究,由筆耕文化傳播整理發(fā)布。


【摘要】:視頻理解是研究視頻圖像并進行計算機解釋,實現(xiàn)人類視覺理解外部世界的一門學科。其主要任務是對視頻進行分割、識別,并進一步獲取有用信息,最后再將這些有用信息與應用的語義環(huán)境進行關聯(lián)。由于視頻結構復雜、語義信息豐富,因此視頻的理解一直是視頻相關分析中的重點和難點。在目前檢索、標注、分類等技術研究中,人們往往從視頻/圖像所描述的對象、場景或事件等高層次概念和語義上來建立對視頻相似性的理解。然而,計算機對視頻相似性的理解則是在諸如顏色、紋理、形狀等底層特征的基礎之上進行度量。由于人和計算機對視頻相似性的判斷依據(jù)存在差異,造成人所理解的“語義相似”與計算機所理解的“視覺相似”之間產(chǎn)生“語義鴻溝”。合理選擇視頻的屬性特征是視頻理解的關鍵步驟,也是后續(xù)各類應用研究的關鍵。簡潔有效的視頻表征不僅有利于視頻的壓縮存儲,而且有利于視頻的高效查找和管理。綜上所述,如何根據(jù)視頻的特有知識有效填補視頻理解中存在的“語義鴻溝”,對視頻的有效管理和分析應用具有重要的研究意義。本文旨在進一步縮小視頻理解中存在的“語義鴻溝”,重點研究視頻的有效表征及其在相關領域中的應用。首先,研究了基于全局特征的表征方法及應用;其次,基于局部特征提出一種多視角多層次并且融合語義信息的視頻表征模型;最后針對特殊視頻給出了融合領域知識的表征模型及其相關應用。本文的主要工作和創(chuàng)新之處在于以下幾個方面:1.提出一種在壓縮變換域中基于全局特征的視頻幀加權表征模型,并在此基礎上提出一種層次化(幀-鏡頭-視頻)的相似性度量方式。此外,進一步探討層次化度量模型在視頻例子檢索中的應用。2.提出一種多層次多視角的主題表征模型(Multi-Layer Multi-View TopicModel,mlmv-LDA)。針對全局特征在視頻幀表征時的不足,進一步尋求面向視頻圖像局部特征的多表達域、多視角、多種特征層次下的解決途徑,建立視頻元數(shù)據(jù)與各種應用需求的橋梁,有效填補了計算機和人對視頻理解時存在的“語義鴻溝”。提出的表征模型融合了建立在局部特征描述子之上的若干種中層特征以及高層特征,并結合主題模型中隱含狄利克雷分布(Latent Dirichlet Allocation LDA)來學習每個視頻的隱含主題分布,以對底層視覺特征和高層語義特征進行有效融合。3.提出一種針對廣告視頻的帶后驗概率的主題表征模型(posterior probabilityinvolved in LDA,pp LDA)。針對特定視頻的表征問題,本文以廣告視頻作為特定的研究對象,將廣告視頻中包含的品牌信息(Logo)和高層對象之間的共現(xiàn)概率信息整合到隱含狄利克雷分布(Latent Dirichelt Allocation,LDA)中進行學習,這是一種讀特定視頻領域知識和主題學習模型的有效融合。最后,還進一步探究了所提出的表征模型在分類中的應用。4.提出一種面向視頻高層語義表征的多標簽學習框(Directed ProbabilityLabel Graph,DPLG)。該學習框架主要針對含有特定對象或標記的視頻對象,是以廣告視頻作為該類視頻的典型代表,結合圖理論構建起來的。DPLG充分考慮了視頻中不同標簽之間的相關性,解決了該類視頻的標注問題
【關鍵詞】:視頻表征 相似性度量 視頻檢索 廣告視頻分類 多標簽學習
【學位授予單位】:重慶大學
【學位級別】:博士
【學位授予年份】:2015
【分類號】:TP391.41
【目錄】:
  • 中文摘要3-5
  • 英文摘要5-10
  • 1 緒論10-16
  • 1.1 研究背景10-11
  • 1.2 國內外研究現(xiàn)狀和存在的主要問題11-13
  • 1.3 本文的主要研究內容13-14
  • 1.4 本文的章節(jié)安排14-16
  • 2 視頻表達的理論框架16-26
  • 2.1 視頻的組織與結構16-19
  • 2.1.1 鏡頭分割17-19
  • 2.1.2 關鍵幀表示19
  • 2.2 視頻的視覺內容特征19-23
  • 2.2.1 全局特征20-21
  • 2.2.2 局部特征21-23
  • 2.3 視頻處理中用到的機器學習技術23-25
  • 2.3.1 聚類技術23
  • 2.3.2 分類技術23-25
  • 2.4 本章小結25-26
  • 3 面向壓縮域的視頻表征及其在視頻例子檢索中的應用26-38
  • 3.1 引言26-27
  • 3.2 理論基礎27-28
  • 3.2.1 視頻相似性度量27
  • 3.2.2 壓縮感知27-28
  • 3.3 視頻表征及分層次的相似性度量28-31
  • 3.3.1 視頻幀的全局表征28-29
  • 3.3.2 分層次的相似性度量29-31
  • 3.4 在視頻例子檢索中的應用及實驗分析31-35
  • 3.4.1 應用框架31-32
  • 3.4.2 實驗與討論32-35
  • 3.5 本章小結35-38
  • 4 多層次多視圖的主題模型視頻表征及其在視頻分類中的應用38-68
  • 4.1 引言38-39
  • 4.2 原始主題模型39-43
  • 4.2.1 Latent Dirichlet Allocation (LDA)模型39-41
  • 4.2.2 LDA模型的參數(shù)估計41-43
  • 4.3 基于多層次多視圖的主題模型的視頻表征43-51
  • 4.3.1 圖像的中高層表示43-45
  • 4.3.2 多層次多視圖主題模型45-48
  • 4.3.3 參數(shù)估計48-51
  • 4.3.4 初始化51
  • 4.4 在視頻分類中的應用及實驗分析51-66
  • 4.4.1 視頻數(shù)據(jù)集51
  • 4.4.2 實驗設置51-52
  • 4.4.3 實驗結果與討論52-66
  • 4.5 本章小結66-68
  • 5 帶后驗概率的主題模型視頻表征及其在廣告視頻分類中的應用68-92
  • 5.1 引言68
  • 5.2 基于后驗概率的廣告視頻表征68-78
  • 5.2.1 整體框架68-70
  • 5.2.2 廣告視頻中的Logo檢測70-71
  • 5.2.3 對象直方圖表征71-72
  • 5.2.4 基于后驗概率的主題表征模型(pp LDA )72-76
  • 5.2.5 參數(shù)估計和更新76-78
  • 5.3 在廣告視頻分類中的應用及實驗分析78-90
  • 5.3.1 數(shù)據(jù)集78-79
  • 5.3.2 實驗設置79
  • 5.3.3 實驗結果與討論79-90
  • 5.4 本章小結90-92
  • 6 基于高層語義表征的視頻多標簽學習及其在視頻標注中的應用92-110
  • 6.1 引言92-93
  • 6.2 有向概率標簽圖模型(DPLG)93-96
  • 6.3 DPLG模型與廣告視頻多標簽學習96-99
  • 6.3.1 DPLG實施96-98
  • 6.3.2 - 過濾和 - 剪枝98
  • 6.3.3 查找關聯(lián)標簽集98-99
  • 6.4 在視頻標注中的應用及實驗分析99-107
  • 6.4.1 實驗評價指標99-100
  • 6.4.2 在公開數(shù)據(jù)集上的多標簽學習100-103
  • 6.4.3 在廣告視頻集上的多標簽學習103-107
  • 6.5 本章小結107-110
  • 7 總結與展望110-112
  • 7.1 總結110-111
  • 7.2 展望111-112
  • 致謝112-114
  • 參考文獻114-130
  • 附錄 A作者在攻讀學位期間發(fā)表的論文目錄130

【相似文獻】

中國博士學位論文全文數(shù)據(jù)庫 前1條

1 侯素娟;面向視頻理解的視頻表征模型及應用研究[D];重慶大學;2015年


  本文關鍵詞:面向視頻理解的視頻表征模型及應用研究,由筆耕文化傳播整理發(fā)布。



本文編號:259285

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/259285.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶ec653***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com