高效視頻編碼碼率控制算法研究
發(fā)布時(shí)間:2020-06-16 00:08
【摘要】:隨著科技的進(jìn)步,通信與多媒體技術(shù)得到了迅猛的發(fā)展。其中,視頻是信息占有量最大且最為常用的交流媒介,F(xiàn)實(shí)生活中,有限的存儲(chǔ)空間和傳輸帶寬使得人們需要對(duì)視頻先進(jìn)行編碼壓縮,再進(jìn)行保存和傳輸。新一代視頻編碼技術(shù)(High Efficiency Video Coding,HEVC)相比于前一代視頻編碼標(biāo)準(zhǔn)H.264/AVC,具有更高的壓縮性能。但是,如何高效地利用傳輸帶寬,依然是研究的重點(diǎn)和難點(diǎn)。碼率控制是實(shí)現(xiàn)壓縮視頻在有限帶寬中傳輸?shù)年P(guān)鍵技術(shù),其主要目的就是在給定的碼率下,盡可能高地還原重建視頻的質(zhì)量。在HEVC標(biāo)準(zhǔn)中,采納了一種λ域的碼率控制算法,該算法將拉格朗日參數(shù)l作為控制碼率的主要因素,并通過(guò)自適應(yīng)的碼率分配和參數(shù)更新來(lái)計(jì)算拉格朗日參數(shù)λ,但是這樣并不能選擇最優(yōu)的l進(jìn)行編碼。另外,在特殊場(chǎng)景下,碼率的分配方案和λ的選擇策略也需要進(jìn)一步的研究。本文主要從人類視覺特性、監(jiān)控視頻特點(diǎn)和最優(yōu)λ選擇三個(gè)方面對(duì)碼率控制算法進(jìn)行研究,從而可以更加合理有效地利用帶寬資源,提高編碼性能。主要的研究?jī)?nèi)容和創(chuàng)新成果包括:(1)根據(jù)空-時(shí)域視覺敏感度對(duì)碼率進(jìn)行分配。首先,在空間域上,根據(jù)人類視覺對(duì)圖像中不同的紋理具有不同的敏感程度,采用恰可感知失真(Just Noticeable Distortion,JND)模型獲得一幀圖像的最大失真。通過(guò)圖像的最大失真可以得到每個(gè)編碼樹單元(Coding Tree Unit,CTU)最大失真度,從而獲取空域圖像中每個(gè)CTU的敏感度權(quán)重。然后,在時(shí)域上,根據(jù)幀間差值對(duì)幀級(jí)的碼率進(jìn)行分配,為變化較為明顯的幀進(jìn)行較高質(zhì)量的編碼,這樣利于提高主觀感受。與此同時(shí),利用幀差方法,獲得時(shí)域連續(xù)幀中引起視覺自底向上的關(guān)注區(qū)域,并根據(jù)差值計(jì)算每個(gè)CTU在時(shí)域上的敏感度權(quán)重。最后,結(jié)合空域和時(shí)域的敏感權(quán)重因子,將碼率更加合理地分配到每幀和每個(gè)CTU上。實(shí)驗(yàn)結(jié)果表明,該碼率分配策略可以有效地提高編碼的主觀質(zhì)量,同時(shí)保持較高的碼率控制精度。(2)針對(duì)監(jiān)控視頻特性,提出一種分離式最優(yōu)λ選擇算法。首先,利用低復(fù)雜度像素級(jí)分割方法獲取監(jiān)控視頻的前景和背景。根據(jù)監(jiān)控視頻背景長(zhǎng)時(shí)間保持不變、而前景主要由于幀間對(duì)應(yīng)像素變化引起這一特點(diǎn),利用時(shí)域上連續(xù)四幀,差分得到一幀中的前景像素和背景像素。由于前景像素都較為集中,所以可以獲取前景CTU和背景CTU。然后,根據(jù)實(shí)驗(yàn)結(jié)果,可以得到前景和背景的率失真特性不同但都滿足雙曲線模型。推導(dǎo)前景與背景區(qū)域的率失真優(yōu)化,得出前景CTU和背景CTU的拉格朗日參數(shù)均值需要等于當(dāng)前幀的拉格朗日值。通過(guò)對(duì)前景或背景當(dāng)前編碼CTU的拉格朗日參數(shù)進(jìn)行區(qū)域限制,使得兩個(gè)區(qū)域的拉格朗日參數(shù)均值逐漸趨近于當(dāng)前幀的拉格朗日參數(shù)值。最后,對(duì)于前景與背景區(qū)域的碼控參數(shù)分別進(jìn)行更新,使得更新參數(shù)更加符合兩個(gè)區(qū)域的變化特點(diǎn)。實(shí)驗(yàn)結(jié)果顯示,該算法在保持高碼控精度的前提下,有效地提高了前景區(qū)域的編碼質(zhì)量,同時(shí)對(duì)整體的編碼質(zhì)量也有所提升。(3)本文在Low Delay模式下,對(duì)多級(jí)拉格朗日參數(shù)進(jìn)行最優(yōu)選擇。首先,實(shí)驗(yàn)得到運(yùn)動(dòng)補(bǔ)償預(yù)測(cè)誤差(Motion Compensation Prediction Error,MCPE)與幀級(jí)碼率的近似線性關(guān)系,并根據(jù)這個(gè)近似線性關(guān)系,對(duì)幀級(jí)碼率進(jìn)行分配。然后,將序列級(jí)的率失真優(yōu)化轉(zhuǎn)化為對(duì)所有GoP(Group of Picture)組的率失真優(yōu)化。在對(duì)GoP組的率失真優(yōu)化過(guò)程中,可以得到GoP組的拉格朗日參數(shù)與幀級(jí)拉格朗日參數(shù)關(guān)系,通過(guò)計(jì)算獲取幀間的拉格朗日參數(shù)最優(yōu)比例。最后,對(duì)幀級(jí)進(jìn)行率失真優(yōu)化,推導(dǎo)出當(dāng)前幀中CTU的拉格朗日參數(shù)均值需要等于當(dāng)前幀的拉格朗日參數(shù)值。所以利用區(qū)間限制方法,使得幀中已編碼CTU的拉格朗日參數(shù)均值逐漸趨近于當(dāng)前幀的拉格朗日參數(shù)值。實(shí)驗(yàn)結(jié)果顯示,該算法具有較高的碼率控制精度,編碼性能具有明顯的提升。(4)本文根據(jù)失真?zhèn)鬟f的影響,在Random Access模式下對(duì)拉格朗日參數(shù)進(jìn)行最優(yōu)選擇。首先,對(duì)RA模式下參考關(guān)系進(jìn)行分析,實(shí)驗(yàn)統(tǒng)計(jì)參考比率,建立主要的參考關(guān)系模型。通過(guò)失真?zhèn)鬟f的影響,估計(jì)由當(dāng)前失真引起的后續(xù)失真,從而推導(dǎo)出RA模式下的失真?zhèn)鬟f模型。然后對(duì)序列級(jí),GoP組級(jí)和幀級(jí)分別進(jìn)行率失真優(yōu)化分析,得到序列與GoP組、GoP組與幀以及幀與CTU的拉格朗日參數(shù)關(guān)系。最后推導(dǎo)出GoP組之間單數(shù)幀的最優(yōu)拉格朗日參數(shù)比例,幀之間的最優(yōu)拉格朗日參數(shù)比例以及CTU之間的最優(yōu)拉格朗日參數(shù)比例,從而使得編碼性能分別從序列層面,GoP組層面和幀層面得到提升。實(shí)驗(yàn)結(jié)果顯示,該算法對(duì)編碼性能具有明顯的提高,改善了編碼的主觀質(zhì)量,同時(shí)具有良好的碼率控制性能。
【學(xué)位授予單位】:上海大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2018
【分類號(hào)】:TN919.81
【圖文】:
圖 1.1 視頻編碼標(biāo)準(zhǔn)的發(fā)展1.2.2 碼率控制技術(shù)研究概況視頻編碼的碼率控制,就是在編碼過(guò)程中,對(duì)產(chǎn)生的碼流進(jìn)行有目的的調(diào)整,使得碼率保持在規(guī)定的水平上。由于各類視頻編碼標(biāo)準(zhǔn)并沒有制定碼率控制算法,而碼率控制又具有十分重要的地位,所以各類視頻編碼標(biāo)準(zhǔn)會(huì)對(duì)優(yōu)秀的碼率控制算法進(jìn)行推薦。如 MPEG-1 中的可變(VBR)碼率控制算法[32]、MPEG-2 中的 TM5[33]、H.263 的 TMN8 碼率控制模型[34]、MPEG-4 的 VM8 碼率控制模型[35]、MPEG-4 改進(jìn)碼控模型[36]等。在視頻編碼過(guò)程中,碼率和失真通常表現(xiàn)出相悖的關(guān)系,即高碼率帶來(lái)小失真,低碼率帶來(lái)大失真。所以,人們希望可以平衡碼率和失真關(guān)系,使得編碼系統(tǒng)達(dá)到最優(yōu),這就是率失真優(yōu)化(Rate Distortion Optimization, RDO)[37]技術(shù)。對(duì)編碼的一些關(guān)鍵模塊進(jìn)行率失真優(yōu)化,可以有效地提高編碼性能[38],[39]。H.264/AVC 在碼率控制過(guò)程中使用了
第二章 高效視頻編碼技術(shù)1 HEVC 視頻編碼關(guān)鍵技術(shù).1 HEVC 編碼結(jié)構(gòu))HEVC 編碼單元HEVC 編碼的基本單元為編碼樹單元(Coding Tree Unit, CTU),其大小64。一個(gè) CTU 包含一個(gè)亮度編碼樹塊(Coding Tree Block, CTB)和兩個(gè)碼樹塊,并采用四叉樹遞歸方式劃分成多個(gè)編碼單元(Coding Unit, CU CU 包含一個(gè)亮度編碼塊(Coding Block, CB)和兩個(gè)色度編碼塊,CU 8×8。圖 2.1 所示為 CTU 四叉樹遞歸劃分結(jié)構(gòu)。
本文編號(hào):2715205
【學(xué)位授予單位】:上海大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位授予年份】:2018
【分類號(hào)】:TN919.81
【圖文】:
圖 1.1 視頻編碼標(biāo)準(zhǔn)的發(fā)展1.2.2 碼率控制技術(shù)研究概況視頻編碼的碼率控制,就是在編碼過(guò)程中,對(duì)產(chǎn)生的碼流進(jìn)行有目的的調(diào)整,使得碼率保持在規(guī)定的水平上。由于各類視頻編碼標(biāo)準(zhǔn)并沒有制定碼率控制算法,而碼率控制又具有十分重要的地位,所以各類視頻編碼標(biāo)準(zhǔn)會(huì)對(duì)優(yōu)秀的碼率控制算法進(jìn)行推薦。如 MPEG-1 中的可變(VBR)碼率控制算法[32]、MPEG-2 中的 TM5[33]、H.263 的 TMN8 碼率控制模型[34]、MPEG-4 的 VM8 碼率控制模型[35]、MPEG-4 改進(jìn)碼控模型[36]等。在視頻編碼過(guò)程中,碼率和失真通常表現(xiàn)出相悖的關(guān)系,即高碼率帶來(lái)小失真,低碼率帶來(lái)大失真。所以,人們希望可以平衡碼率和失真關(guān)系,使得編碼系統(tǒng)達(dá)到最優(yōu),這就是率失真優(yōu)化(Rate Distortion Optimization, RDO)[37]技術(shù)。對(duì)編碼的一些關(guān)鍵模塊進(jìn)行率失真優(yōu)化,可以有效地提高編碼性能[38],[39]。H.264/AVC 在碼率控制過(guò)程中使用了
第二章 高效視頻編碼技術(shù)1 HEVC 視頻編碼關(guān)鍵技術(shù).1 HEVC 編碼結(jié)構(gòu))HEVC 編碼單元HEVC 編碼的基本單元為編碼樹單元(Coding Tree Unit, CTU),其大小64。一個(gè) CTU 包含一個(gè)亮度編碼樹塊(Coding Tree Block, CTB)和兩個(gè)碼樹塊,并采用四叉樹遞歸方式劃分成多個(gè)編碼單元(Coding Unit, CU CU 包含一個(gè)亮度編碼塊(Coding Block, CB)和兩個(gè)色度編碼塊,CU 8×8。圖 2.1 所示為 CTU 四叉樹遞歸劃分結(jié)構(gòu)。
【參考文獻(xiàn)】
相關(guān)期刊論文 前3條
1 馬思偉;;AVS視頻編碼標(biāo)準(zhǔn)技術(shù)回顧及最新進(jìn)展[J];計(jì)算機(jī)研究與發(fā)展;2015年01期
2 袁武;林守勛;牛振東;羅海勇;張勇東;;H.264/AVC碼率控制優(yōu)化算法[J];計(jì)算機(jī)學(xué)報(bào);2008年02期
3 馬思偉,高文,袁祿軍,呂巖;一種面向H.264/AVC的碼率控制算法[J];電子學(xué)報(bào);2004年12期
本文編號(hào):2715205
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/2715205.html
最近更新
教材專著