360度視頻編碼中塊劃分技術(shù)研究
發(fā)布時(shí)間:2020-08-27 12:47
【摘要】:近年來,隨著計(jì)算機(jī)處理能力的提升及傳感顯示元件成本的降低,虛擬現(xiàn)實(shí)技術(shù)日益成熟,已成為如今計(jì)算機(jī)科學(xué)和工業(yè)應(yīng)用等領(lǐng)域的熱點(diǎn)話題。隨著虛擬現(xiàn)實(shí)在商業(yè)上的廣泛應(yīng)用,360度視頻作為一種提供沉浸式體驗(yàn)的新型媒體已經(jīng)引起越來越多的關(guān)注,逐漸成為熱門研究方向。正在探索下一代視頻編碼標(biāo)準(zhǔn)的聯(lián)合探索小組JVET將360視頻與SDR和HDR視頻一起納入標(biāo)準(zhǔn)范圍內(nèi)。和傳統(tǒng)的視頻相比,360度視頻的分辨率更高,數(shù)據(jù)量更大,給實(shí)際應(yīng)用帶來了巨大的挑戰(zhàn),編碼效率問題亟待解決。本文針對(duì)360度視頻編碼中的塊劃分技術(shù)提出了兩種優(yōu)化算法。第一種是基于編碼樹單元緯度的360度視頻快速編碼算法。該算法根據(jù)ERP格式越靠近兩極采樣率越高的特性,將ERP格式分成3個(gè)區(qū)域,并根據(jù)采樣率高低確定每個(gè)區(qū)域的深度區(qū)間。算法執(zhí)行時(shí),首先根據(jù)編碼樹單元內(nèi)每個(gè)像素的緯度計(jì)算出當(dāng)前編碼樹單元的緯度,然后根據(jù)編碼樹單元緯度將編碼樹單元映射到其中一個(gè)區(qū)域,所屬區(qū)域的深度區(qū)間即為當(dāng)前編碼樹單元的深度區(qū)間。本算法在RA10配置、端到端WS-PSNR評(píng)價(jià)標(biāo)準(zhǔn)下,與國際標(biāo)準(zhǔn)參考軟件HM16.15-360Lib3.0相比,在造成亮度分量編碼性能損失0.6%時(shí)能夠獲得11.9%的編碼時(shí)間節(jié)省。第二種是基于相鄰CTU深度和當(dāng)前CTU梯度的快速深度決策算法。該算法包括兩個(gè)部分,第一部分根據(jù)相鄰CTU深度對(duì)當(dāng)前CTU進(jìn)行深度范圍的預(yù)測,這部分算法利用了相鄰編碼樹單元的最大和最小深度信息,同時(shí)考慮到360度視頻的高分辨率特性,進(jìn)一步縮小了劃分深度范圍。第二部分根據(jù)當(dāng)前編碼樹單元的梯度對(duì)第一部分得到的劃分深度范圍進(jìn)行調(diào)整,主要針對(duì)第一部分中劃分深度范圍過窄及紋理足夠簡單的編碼樹單元。兩部分相互結(jié)合得到最終深度范圍值。在RA10配置、端到端WS-PSNR評(píng)價(jià)標(biāo)準(zhǔn)下,該算法能夠在亮度分量只有0.3%的編碼性能損失時(shí),帶來29.1%的編碼時(shí)間節(jié)省。
【學(xué)位授予單位】:哈爾濱工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2018
【分類號(hào)】:TN919.81
【圖文】:
哈爾濱工業(yè)大學(xué)工學(xué)碩士學(xué)位論文第 2 章 360 度視頻的基本框架及相關(guān)技術(shù)聯(lián)合視頻探索小組 JVET 已經(jīng)開發(fā)出一個(gè) 360Lib 軟件包,該軟件包既可以作為獨(dú)立的轉(zhuǎn)換工具,方便各種投影格式之間進(jìn)行格式轉(zhuǎn)換,也可以與 HM或 JEM 結(jié)合使用,一起進(jìn)行編碼之前或者之后的投影格式轉(zhuǎn)換、壓縮及質(zhì)量評(píng)價(jià)計(jì)算,而無需存儲(chǔ)在中間步驟產(chǎn)生的 YUV 序列。在 360Lib 支持的投影格式中,還包括使用直線投影的視口生成。360Lib 軟件包包含 360 度視頻常見測試條件的示例配置文件以及軟件的使用手冊。2016 年 10 月的第五屆 JVET 會(huì)議上,360Lib 參考軟件同意成立。第一版的 360Lib v1.0 于 2016 年 12 月正式發(fā)布,第二版 360Lib v2.0 于 2017年 2 月發(fā)布。
圖 2-3 360Lib 中的(u, v)平面中的采樣坐標(biāo)定義來介紹幾種主要的投影格式。等矩形投影格式(ERP)矩形影格式是 360 度視頻使用最為廣泛的投影格式。該格式只影時(shí),將整個(gè)球面視頻映射到一個(gè) 2D 矩形面上。如下圖 2-4θ =-90θ =0 =-180 =0 =180vmn
圖 2-7 八面體投影格式 的面拼接如下圖 2-8(a)所示,其中的邊緣,這種不連續(xù)邊緣可能難以編碼滑這些不連續(xù)邊緣[35]。如圖 2-8(b)所充樣本的帶,這 16 個(gè)填充樣本(p)是性混合并垂直內(nèi)插得到。COHP 中八個(gè)三角面拼接成一張矩形圖像
本文編號(hào):2806121
【學(xué)位授予單位】:哈爾濱工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2018
【分類號(hào)】:TN919.81
【圖文】:
哈爾濱工業(yè)大學(xué)工學(xué)碩士學(xué)位論文第 2 章 360 度視頻的基本框架及相關(guān)技術(shù)聯(lián)合視頻探索小組 JVET 已經(jīng)開發(fā)出一個(gè) 360Lib 軟件包,該軟件包既可以作為獨(dú)立的轉(zhuǎn)換工具,方便各種投影格式之間進(jìn)行格式轉(zhuǎn)換,也可以與 HM或 JEM 結(jié)合使用,一起進(jìn)行編碼之前或者之后的投影格式轉(zhuǎn)換、壓縮及質(zhì)量評(píng)價(jià)計(jì)算,而無需存儲(chǔ)在中間步驟產(chǎn)生的 YUV 序列。在 360Lib 支持的投影格式中,還包括使用直線投影的視口生成。360Lib 軟件包包含 360 度視頻常見測試條件的示例配置文件以及軟件的使用手冊。2016 年 10 月的第五屆 JVET 會(huì)議上,360Lib 參考軟件同意成立。第一版的 360Lib v1.0 于 2016 年 12 月正式發(fā)布,第二版 360Lib v2.0 于 2017年 2 月發(fā)布。
圖 2-3 360Lib 中的(u, v)平面中的采樣坐標(biāo)定義來介紹幾種主要的投影格式。等矩形投影格式(ERP)矩形影格式是 360 度視頻使用最為廣泛的投影格式。該格式只影時(shí),將整個(gè)球面視頻映射到一個(gè) 2D 矩形面上。如下圖 2-4θ =-90θ =0 =-180 =0 =180vmn
圖 2-7 八面體投影格式 的面拼接如下圖 2-8(a)所示,其中的邊緣,這種不連續(xù)邊緣可能難以編碼滑這些不連續(xù)邊緣[35]。如圖 2-8(b)所充樣本的帶,這 16 個(gè)填充樣本(p)是性混合并垂直內(nèi)插得到。COHP 中八個(gè)三角面拼接成一張矩形圖像
【參考文獻(xiàn)】
相關(guān)期刊論文 前1條
1 周忠;周頤;肖江劍;;虛擬現(xiàn)實(shí)增強(qiáng)技術(shù)綜述[J];中國科學(xué):信息科學(xué);2015年02期
相關(guān)碩士學(xué)位論文 前1條
1 王洋;HEVC幀內(nèi)編碼優(yōu)化算法研究[D];哈爾濱工業(yè)大學(xué);2014年
本文編號(hào):2806121
本文鏈接:http://sikaile.net/kejilunwen/wltx/2806121.html
最近更新
教材專著