基于深度學(xué)習(xí)的無參考立體視頻質(zhì)量評(píng)價(jià)方法的研究與實(shí)現(xiàn)
發(fā)布時(shí)間:2023-03-03 18:31
隨著立體技術(shù)的不斷發(fā)展,立體視頻相關(guān)應(yīng)用和服務(wù)系統(tǒng)開始走近人們的生活,扮演著越來越重要的角色,在這些立體視頻系統(tǒng)中,控制好視頻內(nèi)容的感知質(zhì)量是保證用戶體驗(yàn)的關(guān)鍵。然而,在立體視頻系統(tǒng)的各處理階段,由于帶寬、設(shè)備和技術(shù)的限制,立體視頻可能遭受不同程度的損壞,從而使得立體視頻系統(tǒng)的性能受到極大影響。而無參考立體視頻質(zhì)量評(píng)價(jià)(Stereoscopic video quality assessment,SVQA)算法可以實(shí)現(xiàn)對(duì)立體視頻視覺感知質(zhì)量的量化,可幫助系統(tǒng)對(duì)立體視頻質(zhì)量進(jìn)行監(jiān)測(cè)、控制和改善,成為立體視頻處理領(lǐng)域重要的研究課題。傳統(tǒng)的無參考立體視頻質(zhì)量評(píng)價(jià)方法大多數(shù)具有相似的框架,其一般采用分治法對(duì)該問題進(jìn)行簡化,包括手工特征提取和分類器設(shè)計(jì)。但是在現(xiàn)實(shí)場(chǎng)景中,我們?cè)谠u(píng)價(jià)視頻質(zhì)量時(shí)必須要考慮視頻內(nèi)容信息、深度感知信息和時(shí)域信息等復(fù)雜視覺因素的非直觀交互作用,因此我們很難設(shè)計(jì)出一組特征適用于各種失真類型和失真程度。為解決傳統(tǒng)方法的弊端,我們將卷積神經(jīng)網(wǎng)絡(luò)引入到立體視頻質(zhì)量評(píng)價(jià)領(lǐng)域,建立了一個(gè)基于3D卷積神經(jīng)網(wǎng)絡(luò)的無參考立體視頻質(zhì)量評(píng)價(jià)框架。首先,我們依據(jù)人類立體視覺特性和質(zhì)量評(píng)價(jià)相關(guān)特性完...
【文章頁數(shù)】:68 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 立體視頻質(zhì)量評(píng)價(jià)研究現(xiàn)狀
1.2.2 基于深度學(xué)習(xí)的圖像/視頻質(zhì)量評(píng)價(jià)研究現(xiàn)狀
1.3 本文創(chuàng)新點(diǎn)
1.4 本文結(jié)構(gòu)安排
第2章 算法理論背景
2.1 立體視覺
2.1.1 雙目視差
2.1.2 雙目融合
2.1.3 雙目競爭
2.2 人工神經(jīng)網(wǎng)絡(luò)
2.2.1 網(wǎng)絡(luò)結(jié)構(gòu)
2.2.2 誤差反向傳播算法
2.3 卷積神經(jīng)網(wǎng)絡(luò)
2.3.1 網(wǎng)絡(luò)基本部件
2.3.2 網(wǎng)絡(luò)基本思想
2.4 本章小結(jié)
第3章 基于3D卷積神經(jīng)網(wǎng)絡(luò)的立體視頻質(zhì)量評(píng)價(jià)
3.1 數(shù)據(jù)預(yù)處理
3.1.1 立體信息獲取
3.1.2 數(shù)據(jù)集增強(qiáng)
3.2 基于2D卷積神經(jīng)網(wǎng)絡(luò)的方法初步探究
3.3 3D卷積神經(jīng)網(wǎng)絡(luò)
3.3.1 3D卷積
3.3.2 3D池化
3.3.3 3D CNN網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)
3.3.4 3D卷積神經(jīng)網(wǎng)絡(luò)與支持向量回歸的結(jié)合
3.4 質(zhì)量分?jǐn)?shù)融合策略
3.5 本章小結(jié)
第4章 實(shí)驗(yàn)與分析
4.1 立體視頻數(shù)據(jù)庫
4.1.1 NAMA3DS1-COSPAD1 立體視頻質(zhì)量數(shù)據(jù)庫
4.1.2 QI-SVQA數(shù)據(jù)庫
4.2 性能評(píng)價(jià)指標(biāo)
4.3 算法性能對(duì)比與分析
4.4 算法各部件貢獻(xiàn)分析
4.5 數(shù)據(jù)增強(qiáng)所依賴的假設(shè)證明
4.6 跨庫交叉驗(yàn)證
4.7 算法效率分析
4.8 本章小結(jié)
第5章 總結(jié)與展望
5.1 總結(jié)
5.2 展望
參考文獻(xiàn)
發(fā)表論文和參與科研情況說明
致謝
本文編號(hào):3752890
【文章頁數(shù)】:68 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 研究背景及意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 立體視頻質(zhì)量評(píng)價(jià)研究現(xiàn)狀
1.2.2 基于深度學(xué)習(xí)的圖像/視頻質(zhì)量評(píng)價(jià)研究現(xiàn)狀
1.3 本文創(chuàng)新點(diǎn)
1.4 本文結(jié)構(gòu)安排
第2章 算法理論背景
2.1 立體視覺
2.1.1 雙目視差
2.1.2 雙目融合
2.1.3 雙目競爭
2.2 人工神經(jīng)網(wǎng)絡(luò)
2.2.1 網(wǎng)絡(luò)結(jié)構(gòu)
2.2.2 誤差反向傳播算法
2.3 卷積神經(jīng)網(wǎng)絡(luò)
2.3.1 網(wǎng)絡(luò)基本部件
2.3.2 網(wǎng)絡(luò)基本思想
2.4 本章小結(jié)
第3章 基于3D卷積神經(jīng)網(wǎng)絡(luò)的立體視頻質(zhì)量評(píng)價(jià)
3.1 數(shù)據(jù)預(yù)處理
3.1.1 立體信息獲取
3.1.2 數(shù)據(jù)集增強(qiáng)
3.2 基于2D卷積神經(jīng)網(wǎng)絡(luò)的方法初步探究
3.3 3D卷積神經(jīng)網(wǎng)絡(luò)
3.3.1 3D卷積
3.3.2 3D池化
3.3.3 3D CNN網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)
3.3.4 3D卷積神經(jīng)網(wǎng)絡(luò)與支持向量回歸的結(jié)合
3.4 質(zhì)量分?jǐn)?shù)融合策略
3.5 本章小結(jié)
第4章 實(shí)驗(yàn)與分析
4.1 立體視頻數(shù)據(jù)庫
4.1.1 NAMA3DS1-COSPAD1 立體視頻質(zhì)量數(shù)據(jù)庫
4.1.2 QI-SVQA數(shù)據(jù)庫
4.2 性能評(píng)價(jià)指標(biāo)
4.3 算法性能對(duì)比與分析
4.4 算法各部件貢獻(xiàn)分析
4.5 數(shù)據(jù)增強(qiáng)所依賴的假設(shè)證明
4.6 跨庫交叉驗(yàn)證
4.7 算法效率分析
4.8 本章小結(jié)
第5章 總結(jié)與展望
5.1 總結(jié)
5.2 展望
參考文獻(xiàn)
發(fā)表論文和參與科研情況說明
致謝
本文編號(hào):3752890
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3752890.html
最近更新
教材專著