基于深度學(xué)習(xí)的視頻總結(jié)算法研究與實現(xiàn)
發(fā)布時間:2023-10-27 17:55
隨著互聯(lián)網(wǎng)的發(fā)展,視頻數(shù)據(jù)也呈爆炸式增長,越來越多的視頻被上傳到網(wǎng)絡(luò)上。因此,如何幫助用戶快速、有效地,從海量的視頻中挑選他們感興趣的視頻內(nèi)容,便成為一個越來越重要的問題。其中,視頻總結(jié)就是解決這類問題的一個有效方法。視頻總結(jié)是視頻內(nèi)容的簡要概括,它包含了視頻中一些有趣的,能概括視頻的一些視頻幀或者視頻片段?偟恼f來,視頻總結(jié)可分為靜態(tài)視頻總結(jié)和動態(tài)視頻總結(jié)。靜態(tài)視頻總結(jié)將視頻濃縮為一些能描述視頻內(nèi)容的圖片(劇情梗概圖),而動態(tài)視頻總結(jié)則是提取視頻中具有代表性的,有趣的視頻片段作為最終的總結(jié)結(jié)果。視頻總結(jié)以靜態(tài)或動態(tài)的方式,為用戶提供視頻內(nèi)容的摘要,幫助用戶在較短時間內(nèi)充分了解視頻內(nèi)容,從而決定是否對完整的視頻進行觀看。本文對靜態(tài)視頻總結(jié)和動態(tài)視頻總結(jié)進行了研究。針對靜態(tài)視頻總結(jié),提出了一個新穎的基于密度的靜態(tài)視頻總結(jié)聚類算法。這個算法與已有的基于聚類的視頻總結(jié)算法不同,它不需要預(yù)先人為設(shè)定簇類的個數(shù),可以根據(jù)視頻的內(nèi)容適應(yīng)性地產(chǎn)生一定數(shù)量的簇類中心,來得到有代表性的,能概括視頻內(nèi)容的劇情梗概圖。本文提出的方法已經(jīng)在靜態(tài)視頻總結(jié)領(lǐng)域的兩個標(biāo)準(zhǔn)的數(shù)據(jù)庫中驗證,實驗結(jié)果證明該方法的性能具有...
【文章頁數(shù)】:56 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 研究背景和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 本文的主要研究內(nèi)容
1.4 本文的組織結(jié)構(gòu)
第2章 基于聚類的靜態(tài)視頻總結(jié)
2.1 相關(guān)研究工作
2.2 基于聚類的靜態(tài)視頻總結(jié)方法
2.2.1 預(yù)處理
2.2.2 視覺特征的提取和單詞表的構(gòu)造
2.2.3 詞袋模型直方圖的產(chǎn)生
2.2.4 用基于密度的聚類方法進行幀的聚類
2.2.5 靜態(tài)視頻總結(jié)結(jié)果的產(chǎn)生
2.3 實驗結(jié)果及分析
2.3.1 數(shù)據(jù)庫與評價標(biāo)準(zhǔn)
2.3.2 實驗部分
2.3.3 關(guān)于DCVS方法的不足之處
2.4 本章小結(jié)
第3章 基于眼動的雙通道卷積神經(jīng)網(wǎng)絡(luò)
3.1 相關(guān)研究工作
3.2 基于眼動的雙通道卷積神經(jīng)網(wǎng)絡(luò)
3.2.1 視網(wǎng)膜中央凹圖像的構(gòu)造
3.2.2 多幀運動矢量棧的構(gòu)造
3.2.3 基于眼動的雙通道卷積神經(jīng)網(wǎng)絡(luò)在動態(tài)視頻總結(jié)上的應(yīng)用
3.3 實驗部分
3.3.1 實驗設(shè)置
3.3.2 在SumMe數(shù)據(jù)庫上的實驗
3.3.3 在TVSum數(shù)據(jù)庫上的實驗
3.4 本章小結(jié)
第4章 總結(jié)與展望
4.1 總結(jié)
4.2 展望
參考文獻
致謝
攻讀碩士學(xué)位期間的研究成果
本文編號:3856994
【文章頁數(shù)】:56 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 研究背景和意義
1.2 國內(nèi)外研究現(xiàn)狀
1.3 本文的主要研究內(nèi)容
1.4 本文的組織結(jié)構(gòu)
第2章 基于聚類的靜態(tài)視頻總結(jié)
2.1 相關(guān)研究工作
2.2 基于聚類的靜態(tài)視頻總結(jié)方法
2.2.1 預(yù)處理
2.2.2 視覺特征的提取和單詞表的構(gòu)造
2.2.3 詞袋模型直方圖的產(chǎn)生
2.2.4 用基于密度的聚類方法進行幀的聚類
2.2.5 靜態(tài)視頻總結(jié)結(jié)果的產(chǎn)生
2.3 實驗結(jié)果及分析
2.3.1 數(shù)據(jù)庫與評價標(biāo)準(zhǔn)
2.3.2 實驗部分
2.3.3 關(guān)于DCVS方法的不足之處
2.4 本章小結(jié)
第3章 基于眼動的雙通道卷積神經(jīng)網(wǎng)絡(luò)
3.1 相關(guān)研究工作
3.2 基于眼動的雙通道卷積神經(jīng)網(wǎng)絡(luò)
3.2.1 視網(wǎng)膜中央凹圖像的構(gòu)造
3.2.2 多幀運動矢量棧的構(gòu)造
3.2.3 基于眼動的雙通道卷積神經(jīng)網(wǎng)絡(luò)在動態(tài)視頻總結(jié)上的應(yīng)用
3.3 實驗部分
3.3.1 實驗設(shè)置
3.3.2 在SumMe數(shù)據(jù)庫上的實驗
3.3.3 在TVSum數(shù)據(jù)庫上的實驗
3.4 本章小結(jié)
第4章 總結(jié)與展望
4.1 總結(jié)
4.2 展望
參考文獻
致謝
攻讀碩士學(xué)位期間的研究成果
本文編號:3856994
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3856994.html
最近更新
教材專著