面向深度圖像的3D-HEVC幀內(nèi)編碼模式?jīng)Q策快速算法研究
發(fā)布時間:2020-05-31 20:45
【摘要】:近年來隨著影視工業(yè)、新興智能視覺交互技術(shù)的快速發(fā)展,三維視頻處理研究迅速成為熱點。國際視頻編碼標(biāo)準(zhǔn)的兩大制定組織ITU-T和ISO/IET聯(lián)合制定了新一代的高效率三維視頻編碼標(biāo)準(zhǔn)(3D-HEVC)。為了顯著減少視點個數(shù),3D-HEVC增加了包含視頻場景幾何信息的深度圖像,顯著提高了三維視頻壓縮效率和合成視點的圖像質(zhì)量,但深度圖像編碼的計算復(fù)雜度非常高,其編碼時間是彩色圖像的六倍左右。因此,為了降低3D-HEVC中深度圖像編碼的復(fù)雜度,本論文對其計算最為集中的模式?jīng)Q策部分進(jìn)行研究,包括編碼單元(CU)劃分、幀內(nèi)預(yù)測模式?jīng)Q策以及深度預(yù)測模式(DMM)決策過程。主要完成的工作和成果如下:(1)針對CU劃分過程,提出了一種基于紋理特征分析的深度圖像CU劃分快速算法。首先利用深度圖像紋理變化特征與CU劃分特征之間的對應(yīng)關(guān)系進(jìn)行初級紋理特征分析;然后根據(jù)CU內(nèi)部像素分布統(tǒng)計特性進(jìn)行精細(xì)紋理特征分析;接著利用上述特征對CTU進(jìn)行劃分深度預(yù)測,并適當(dāng)終止部分CU的劃分。此外,本論文根據(jù)測試序列紋理特征和量化參數(shù)(QP)調(diào)整該快速算法中的灰度分級數(shù)和CU紋理復(fù)雜度閾值,使算法具有更好的序列適應(yīng)性。(2)針對幀內(nèi)預(yù)測模式?jīng)Q策過程,提出了一種基于機(jī)器學(xué)習(xí)分類的幀內(nèi)預(yù)測模式?jīng)Q策快速算法。首先通過對37種幀內(nèi)預(yù)測模式設(shè)置類別標(biāo)簽,提取相關(guān)特征進(jìn)行離線訓(xùn)練得到隨機(jī)森林預(yù)測模型;然后用模型預(yù)測當(dāng)前預(yù)測單元(PU)最佳類別標(biāo)簽,建立與類別標(biāo)簽對應(yīng)的候選預(yù)測模式列表,以減少模式?jīng)Q策過程中進(jìn)行哈達(dá)碼優(yōu)化的預(yù)測模式個數(shù);最后利用候選模式列表內(nèi)預(yù)測模式之間哈達(dá)瑪代價的幅值關(guān)系來減少進(jìn)行率失真代價計算的候選預(yù)測模式個數(shù)。(3)針對深度圖像深度預(yù)測模式引入的計算復(fù)雜度,提出了一種基于像素特征分析的DMM預(yù)測模式?jīng)Q策算法,首先分析當(dāng)前PU內(nèi)部像素的分布特征以及當(dāng)前PU尺寸與DMM模式選擇的相關(guān)性;然后通過計算當(dāng)前PU上下左右四個邊界DMM特征標(biāo)識來判斷當(dāng)前PU是否采用DMM預(yù)測模式,以減少部分PU的DMM模式計算,進(jìn)一步優(yōu)化PU的模式判決。
【圖文】:
DC 模式[27],每個模式代表了圖像紋理的預(yù)測在HEVC參考模型中,幀內(nèi)預(yù)測先進(jìn)行粗級模式[28],通過計算 35 種 PU 的殘差信號哈達(dá)瑪代價的絕對誤差和(Sum of Absolute Transformed 測模式,對于尺寸為 4×4 和 8×8 的 PU,候選預(yù)6、32×32 和 64×64 的 PU,候選預(yù)測模式個數(shù)性,將空間相鄰的預(yù)測模式添加到預(yù)測模式集Distortion Optimization, RDO)[30],選取最佳幀與運動矢量(Motion Vector, MV)相關(guān)的 Mernced Motion Vector Prediction, AMVP)[33]編碼模列表選擇最佳MV并通過運動搜索對得到的M含 5 個 MV 的候選列表,列表中率失真代價最Merge 模式只需要傳輸最佳預(yù)測 MV 的索引特數(shù)。
根據(jù)方向?qū)呙璺绞椒譃樗、對角和垂直。對于尺寸?8×8 和 4×4 的 TU 根據(jù)幀內(nèi)預(yù)測模式選擇掃描方式,其他尺寸 TU 采用對角掃描方式。此外,HEVC 只采用了 CABAC 編碼[37],CABAC 包括二進(jìn)制化、上下文建模和二進(jìn)制算術(shù)編碼[38]這三個過程。1.2.2 3D-HEVC 標(biāo)準(zhǔn)編碼框架3D-HEVC 繼承了 HEVC 的混合編碼框架,為了平衡視頻數(shù)據(jù)量與視點個數(shù)之間的矛盾,3D-HEVC 還引入了深度視頻的編碼,大幅度降低了視頻數(shù)據(jù)量的同時又最大限度的利用了視點間的相關(guān)性來增加 3D 視頻的視點數(shù)目,為用戶提供了更為自由的交互體驗。圖 1-4 為 3D-HEVC 視頻系統(tǒng)結(jié)構(gòu),,包含編碼部分和在解碼顯示部分。在編碼端利用 3D-HEVC 編碼器對各個視點的彩色視頻和深度視頻進(jìn)行壓縮編碼得到對應(yīng)的子比特流,子比特流融合為一個比特流可用于網(wǎng)絡(luò)傳輸和存儲。在解碼端可根據(jù)實際顯示設(shè)備的播放條件,選擇適合的子比特流,若為多視點視頻顯示設(shè)備則提取所有彩色和深度視頻子比特流用于解碼播放,若為傳統(tǒng) 3D 視頻則提取彩色視頻兩個子比特流,若為傳統(tǒng) 2D 播放設(shè)備則僅提取彩色視頻一個子比特流。
【學(xué)位授予單位】:浙江工業(yè)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:TN919.81
【圖文】:
DC 模式[27],每個模式代表了圖像紋理的預(yù)測在HEVC參考模型中,幀內(nèi)預(yù)測先進(jìn)行粗級模式[28],通過計算 35 種 PU 的殘差信號哈達(dá)瑪代價的絕對誤差和(Sum of Absolute Transformed 測模式,對于尺寸為 4×4 和 8×8 的 PU,候選預(yù)6、32×32 和 64×64 的 PU,候選預(yù)測模式個數(shù)性,將空間相鄰的預(yù)測模式添加到預(yù)測模式集Distortion Optimization, RDO)[30],選取最佳幀與運動矢量(Motion Vector, MV)相關(guān)的 Mernced Motion Vector Prediction, AMVP)[33]編碼模列表選擇最佳MV并通過運動搜索對得到的M含 5 個 MV 的候選列表,列表中率失真代價最Merge 模式只需要傳輸最佳預(yù)測 MV 的索引特數(shù)。
根據(jù)方向?qū)呙璺绞椒譃樗、對角和垂直。對于尺寸?8×8 和 4×4 的 TU 根據(jù)幀內(nèi)預(yù)測模式選擇掃描方式,其他尺寸 TU 采用對角掃描方式。此外,HEVC 只采用了 CABAC 編碼[37],CABAC 包括二進(jìn)制化、上下文建模和二進(jìn)制算術(shù)編碼[38]這三個過程。1.2.2 3D-HEVC 標(biāo)準(zhǔn)編碼框架3D-HEVC 繼承了 HEVC 的混合編碼框架,為了平衡視頻數(shù)據(jù)量與視點個數(shù)之間的矛盾,3D-HEVC 還引入了深度視頻的編碼,大幅度降低了視頻數(shù)據(jù)量的同時又最大限度的利用了視點間的相關(guān)性來增加 3D 視頻的視點數(shù)目,為用戶提供了更為自由的交互體驗。圖 1-4 為 3D-HEVC 視頻系統(tǒng)結(jié)構(gòu),,包含編碼部分和在解碼顯示部分。在編碼端利用 3D-HEVC 編碼器對各個視點的彩色視頻和深度視頻進(jìn)行壓縮編碼得到對應(yīng)的子比特流,子比特流融合為一個比特流可用于網(wǎng)絡(luò)傳輸和存儲。在解碼端可根據(jù)實際顯示設(shè)備的播放條件,選擇適合的子比特流,若為多視點視頻顯示設(shè)備則提取所有彩色和深度視頻子比特流用于解碼播放,若為傳統(tǒng) 3D 視頻則提取彩色視頻兩個子比特流,若為傳統(tǒng) 2D 播放設(shè)備則僅提取彩色視頻一個子比特流。
【學(xué)位授予單位】:浙江工業(yè)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2019
【分類號】:TN919.81
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 周自顧;曹杰;郝群;高澤東;肖宇晴;;保留邊界特征的深度圖像增強(qiáng)算法研究[J];應(yīng)用光學(xué);2018年02期
2 劉田間;郭連朋;朱y
本文編號:2690433
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/2690433.html
最近更新
教材專著