基于深度學(xué)習(xí)的視頻鏡頭檢測(cè)與對(duì)象分割
發(fā)布時(shí)間:2020-12-27 20:49
在大數(shù)據(jù)時(shí)代,越來(lái)越多的視頻數(shù)據(jù)等待著被處理、分析和挖掘。然而,很多視頻在產(chǎn)生時(shí)并沒(méi)有進(jìn)行有效的標(biāo)注甚至沒(méi)有標(biāo)注,這給人們搜索并處理他們感興趣的視頻部分帶來(lái)了極大的挑戰(zhàn),因而開(kāi)發(fā)一套高效的視頻結(jié)構(gòu)化分析技術(shù)是很有必要的。其中,視頻鏡頭檢測(cè)技術(shù)和視頻對(duì)象分割技術(shù)是實(shí)現(xiàn)視頻結(jié)構(gòu)化分析的基礎(chǔ)和關(guān)鍵步驟。針對(duì)視頻鏡頭檢測(cè)本文做了如下貢獻(xiàn):提出了一個(gè)高效的視頻鏡頭檢測(cè)框架,指出高效的模型中應(yīng)必備的三個(gè)要素(預(yù)處理,特征提取和檢測(cè)算法),并給出了相應(yīng)的設(shè)計(jì)建議。根據(jù)提出的框架本文進(jìn)一步實(shí)現(xiàn)了基于深度學(xué)習(xí)的視頻鏡頭檢測(cè)算法。算法思路如下:首先應(yīng)用框架內(nèi)詳細(xì)介紹的基于二分比較的方法對(duì)給定視頻進(jìn)行預(yù)處理,濾除大量的非鏡頭幀并得到可能包含鏡頭邊界的候選段。然后使用AlexNet對(duì)每段提取深度特征,通過(guò)分析、篩選得到具有強(qiáng)表達(dá)能力的fc-6特征對(duì)候選段內(nèi)的幀進(jìn)行高效表征。最后分別針對(duì)突變邊界、漸變邊界候選段應(yīng)用相應(yīng)的檢測(cè)算法:對(duì)于突變邊界檢測(cè),本文綜合考慮了段內(nèi)平均相似度和連續(xù)幀間相似度的關(guān)系并定義了相似度“顯著”改變的標(biāo)準(zhǔn),進(jìn)而能夠精確檢測(cè)得到突變邊界的位置;對(duì)于漸變邊界檢測(cè),本文通過(guò)對(duì)漸變邊界的分析得到...
【文章來(lái)源】:上海交通大學(xué)上海市 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:92 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 課題研究背景和意義
1.2 課題研究現(xiàn)狀
1.2.1 視頻鏡頭檢測(cè)算法研究現(xiàn)狀
1.2.2 視頻對(duì)象分割算法研究現(xiàn)狀
1.3 本文的研究點(diǎn)
1.4 本文主要工作及章節(jié)安排
第二章 深度學(xué)習(xí)基礎(chǔ)
2.1 有監(jiān)督學(xué)習(xí)
2.2 最優(yōu)化算法
2.3 反向傳播算法
2.4 神經(jīng)網(wǎng)絡(luò)
2.4.1 BP神經(jīng)網(wǎng)絡(luò)
2.4.2 卷積神經(jīng)網(wǎng)絡(luò)
第三章 視頻鏡頭檢測(cè)
3.1 高效的視頻鏡頭檢測(cè)框架
3.1.1 預(yù)處理
3.1.2 特征提取
3.1.3 檢測(cè)算法
3.2 視頻鏡頭檢測(cè)算法的發(fā)展綜述
3.3 基于深度學(xué)習(xí)的視頻鏡頭檢測(cè)算法
3.3.1 深度特征分析
3.3.2 基于深度特征的檢測(cè)算法
3.4 實(shí)驗(yàn)部分
第四章 視頻對(duì)象分割
4.1 視頻對(duì)象分割領(lǐng)域的代表算法
4.1.1 無(wú)監(jiān)督算法和半監(jiān)督算法
4.1.2 深度學(xué)習(xí)應(yīng)用于視頻對(duì)象分割的挑戰(zhàn)
4.2 基于雙流深度編碼-解碼網(wǎng)絡(luò)的對(duì)象分割算法
4.2.1 編碼結(jié)構(gòu)
4.2.2 解碼結(jié)構(gòu)
4.2.3 融合結(jié)構(gòu)
4.2.4 訓(xùn)練過(guò)程
4.3 實(shí)驗(yàn)部分
第五章 總結(jié)與展望
5.1 全文工作總結(jié)
5.2 研究展望
參考文獻(xiàn)
致謝
攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文
攻讀學(xué)位期間申請(qǐng)的發(fā)明專(zhuān)利
本文編號(hào):2942461
【文章來(lái)源】:上海交通大學(xué)上海市 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:92 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 課題研究背景和意義
1.2 課題研究現(xiàn)狀
1.2.1 視頻鏡頭檢測(cè)算法研究現(xiàn)狀
1.2.2 視頻對(duì)象分割算法研究現(xiàn)狀
1.3 本文的研究點(diǎn)
1.4 本文主要工作及章節(jié)安排
第二章 深度學(xué)習(xí)基礎(chǔ)
2.1 有監(jiān)督學(xué)習(xí)
2.2 最優(yōu)化算法
2.3 反向傳播算法
2.4 神經(jīng)網(wǎng)絡(luò)
2.4.1 BP神經(jīng)網(wǎng)絡(luò)
2.4.2 卷積神經(jīng)網(wǎng)絡(luò)
第三章 視頻鏡頭檢測(cè)
3.1 高效的視頻鏡頭檢測(cè)框架
3.1.1 預(yù)處理
3.1.2 特征提取
3.1.3 檢測(cè)算法
3.2 視頻鏡頭檢測(cè)算法的發(fā)展綜述
3.3 基于深度學(xué)習(xí)的視頻鏡頭檢測(cè)算法
3.3.1 深度特征分析
3.3.2 基于深度特征的檢測(cè)算法
3.4 實(shí)驗(yàn)部分
第四章 視頻對(duì)象分割
4.1 視頻對(duì)象分割領(lǐng)域的代表算法
4.1.1 無(wú)監(jiān)督算法和半監(jiān)督算法
4.1.2 深度學(xué)習(xí)應(yīng)用于視頻對(duì)象分割的挑戰(zhàn)
4.2 基于雙流深度編碼-解碼網(wǎng)絡(luò)的對(duì)象分割算法
4.2.1 編碼結(jié)構(gòu)
4.2.2 解碼結(jié)構(gòu)
4.2.3 融合結(jié)構(gòu)
4.2.4 訓(xùn)練過(guò)程
4.3 實(shí)驗(yàn)部分
第五章 總結(jié)與展望
5.1 全文工作總結(jié)
5.2 研究展望
參考文獻(xiàn)
致謝
攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文
攻讀學(xué)位期間申請(qǐng)的發(fā)明專(zhuān)利
本文編號(hào):2942461
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2942461.html
最近更新
教材專(zhuān)著