可伸縮高性能視頻編碼的擴展技術(shù)研究
本文選題:可伸縮高性能視頻編碼 + 多視角聯(lián)合深度信息數(shù)據(jù)結(jié)構(gòu)。 參考:《中國科學技術(shù)大學》2015年碩士論文
【摘要】:近年來,隨著微博和微信等新型社交媒體迅速發(fā)展,網(wǎng)絡(luò)中視頻數(shù)據(jù)量急劇增加,網(wǎng)絡(luò)帶寬和存儲資源的缺口越來越大,視頻壓縮的重要性日益凸顯。2013年1月,視頻編碼國際標準組織JCT-VC發(fā)布了最新一代的視頻編碼國際標準—高性能視頻編碼(HEVC)。相對于上一代視頻編碼國際標準H.264/AVC, HEVC編碼效率提升了50%。為了滿足市場中對視頻各種各樣的需求,在標準發(fā)布的同時,JCT-VC和JCT-3V積極推進HEVC擴展版本的研究。其中主要的擴展版本包括:支持可伸縮編碼的可伸縮高性能視頻編碼(SHVC)、支持多視角編碼的多視角高性能視頻編碼(MV-HEVC),支持三維視頻中多視角聯(lián)合深度視頻(MVD)數(shù)據(jù)格式的三維高性能視頻編碼(3D-HEVC)。多個擴展版本能夠很好地滿足市場需求,但在實際應(yīng)用中,可能造成用戶不知如何選擇和使用合適的版本。如果用統(tǒng)一的HEVC擴展版本能夠很好地應(yīng)對以上幾種需求,會顯著提升標準的易用性。 在視頻傳輸中,和傳統(tǒng)的采用有狀態(tài)的協(xié)議如RTSP協(xié)議相比,基于HTTP無狀態(tài)的協(xié)議能夠提供漸進式服務(wù),降低了服務(wù)器和客戶端的負擔,提升了通信的效率,已逐漸成為市場的主流。2012年,由MPEG組織制定的基于HTTP的自適應(yīng)流媒體傳輸技術(shù)(MPEG-DASH),能夠根據(jù)網(wǎng)絡(luò)環(huán)境和用戶需求的變化動態(tài)調(diào)整多媒體資源碼率,為用戶提供了一個動態(tài)自適應(yīng)的方法傳輸視頻。為了支持在MPEG-DASH中的場景切換,通常需要在碼流段的邊界插入隨機接入點。在底層編碼隨機接入點時,由于采用開放圖片集使得場景切換點處的一些圖片無法解碼而產(chǎn)生碼流中斷,所以一般采用閉合的圖片集的形式保證DASH場景順利切換。 本文利用SHVC編碼框架的靈活性,做了兩方面的研究。一方面僅僅通過高層語法的改動,使得SHVC能夠較好地編碼MVD數(shù)據(jù),從而將HEVC的主要擴展版本統(tǒng)一用SHVC編碼。另一方面提出了在MEPG-DASH中利用SHVC提升其編碼性能的方法。具體來說,本文的主要工作以及創(chuàng)新之處在于: 1.提出了改進的SHVC編碼MVD數(shù)據(jù)框架,并在此基礎(chǔ)上提出了分量間預(yù)測,提升了深度視頻和合成視頻的編碼性能。由于MV-HEVC和SHVC采用的都是Reference-index-based編碼結(jié)構(gòu),二者可以自然統(tǒng)一。采用本文提出的SHVC編碼MVD數(shù)據(jù)方法,可以將HEVC三個主要的擴展版本統(tǒng)一用SHVC編碼,提高了標準的易用性。實驗表明,本文所提出的分量間預(yù)測方法在深度序列編碼性能和合成性能分別提升了3.6%和1.0%,很好地去除了MVD數(shù)據(jù)中紋理-分量之間的冗余。 2.提出了三種方法使得在MPEG-DASH中,利用開發(fā)圖片集編碼提升MPEG-DASH編碼性能的同時,避免場景切換而產(chǎn)生碼流中斷。第一種方法不需要修改標準解碼器,容易獲取市場認同,但編碼效率提升有限。第二種方法能夠很好地提升編碼效率,但是需要對HEVC標準解碼器做簡單的修改。基于此,在本文充分利用了SHVC編碼靈活性基礎(chǔ)上,提出了第三種方法—冗余自適應(yīng)分辨率切換法,很好地解決了第一種方法編碼效率低的問題,同時不需要修改標準解碼器。因此相對于前兩種方法,第三種方法更有利于市場推廣和認同。實驗表明,本文提出的冗余自適應(yīng)分辨率切換法相對于原來的MPEG-DASH采用閉合圖片集編碼,平均編碼性能提升了5.6%,同時解碼的圖片的主觀質(zhì)量未有明顯下降。
[Abstract]:In recent years, along with micro-blog and WeChat and other new social media rapid development, a sharp increase in the amount of video data in the network, network bandwidth and storage resources gap is more and more big, the importance of video compression has become increasingly prominent in January.2013, the video encoding of JCT-VC international standards organization released a video encoding standard - the new generation of high performance video encoding (HEVC). Compared to the previous generation of video encoding of H.264/AVC international standard, HEVC encoding efficiency of 50%. in order to meet the needs of a variety of video market, in the standard JCT-VC JCT-3V released at the same time, and actively promote the HEVC extended version of the study. The extended version mainly include: support for scalable high scalable encoding the performance of video encoding (SHVC), high performance multi view video encoding support multi view encoding (MV-HEVC), support multi view 3D video and depth video (MVD) data Three dimensional high performance video encoding format (3D-HEVC). An extended version is able to meet the market demand, but in practical application, may make users do not know how to choose and use the appropriate version. If using a unified HEVC extended version can cope well with the above requirements, will significantly enhance the ease of use standard.
In video transmission, stateful protocols such as RTSP protocol and compared with traditional HTTP, a stateless protocol can provide incremental service based on reducing the server and the client's burden, improve the efficiency of communication, has gradually become the mainstream market.2012, developed by MPEG HTTP based adaptive streaming media transmission technology (MPEG-DASH), according to the dynamic changes of network environment and user needs to adjust the rate of multimedia resources, provides a method for dynamic adaptive video transmission for users. In order to support the scene switching in MPEG-DASH, usually need to insert a random access point in the stream segment boundary. At the bottom of encoding random access point. Because of the open picture set makes some pictures the scene change point cannot be decoded and stream interruption, it is generally used in the form of closed set the picture to ensure DASH scene Switch smoothly.
Using the SHVC encoding framework flexibility this paper, do the research from two aspects. On the one hand only by changing high-level syntax, so that SHVC can better encoding MVD data, which will be the main extended version of HEVC with SHVC encoding is proposed. A unified method of using SHVC in MEPG-DASH to enhance its encoding performance. On the other hand, specifically and the main work and innovations:
1. proposed SHVC encoding MVD data frame improved, and put forward the component prediction, enhance the performance of video encoding and video synthesis depth. Because MV-HEVC and SHVC are used in Reference-index-based encoding structure, two can be naturally unified. Using SHVC MVD data encoding method proposed in this paper, the HEVC can be three the main extended version use SHVC encoding, improves usability standards. Experimental results show that the proposed component prediction method in depth sequence encoding performance and synthesis performance were improved by 3.6% and 1%, very good to eliminate the redundant data between texture component MVD.
2. this paper puts forward three ways to make use of the development in MPEG-DASH, encoding MPEG-DASH encoding images to enhance performance and avoid the scene change caused interruption. Stream first method does not need to modify the standard decoder, easy to gain market recognition, but the encoding efficiency is limited. The second methods can well improve the encoding efficiency, but need to do a simple modification of the standard HEVC decoder. Based on this, in this paper makes use of SHVC encoding based on flexibility, puts forward third kinds of method of redundancy resolution adaptive switching method, a good solution to the first method of encoding the problem of low efficiency, also do not need to modify the standard decoder. Compared to the previous two methods, more third methods for market promotion and recognition. Experimental results show that the adaptive redundancy resolution switching method is discussed with respect to the original MPEG-DASH with closed Picture set coding, the average coding performance is improved by 5.6%, while the subjective quality of the decoded images is not significantly reduced.
【學位授予單位】:中國科學技術(shù)大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:TN919.81
【相似文獻】
相關(guān)期刊論文 前10條
1 張勇東,李桂苓;高性能三維小波視頻編碼方法[J];通信技術(shù);2002年01期
2 王維君;淺談圖像視頻編碼的國際標準[J];西部廣播電視;2004年05期
3 南敬昌;王英博;;精細空間可伸縮視頻編碼方案實現(xiàn)[J];遼寧工程技術(shù)大學學報;2004年S1期
4 朱秀昌;視頻編碼新技術(shù)12題 第四講 視頻編碼控制與實現(xiàn)(下)[J];中國數(shù)據(jù)通信;2005年06期
5 王麗豐 ,牛建偉 ,肖晨 ,胡建平;視頻編碼位率控制技術(shù)[J];微計算機信息;2005年20期
6 袁春,彭強;視頻編碼中的一種率失真模型研究與實現(xiàn)[J];西南科技大學學報(自然科學版);2005年03期
7 朱光喜;王溪;金欣;;一種新的視頻編碼變換與量化方法研究[J];計算機與數(shù)字工程;2005年12期
8 萬建;柯翰冰;樊旭東;;第二代視頻編碼及其應(yīng)用[J];有線電視技術(shù);2008年05期
9 鐘國韻;何小海;吳笛;滕奇志;;一種基于新閾值的視頻編碼全零塊提早判決方法(英文)[J];Journal of Southeast University(English Edition);2011年03期
10 尤晶晶;王韶霞;;多媒體傳感器網(wǎng)絡(luò)分布式視頻編碼新算法探討[J];遼寧科技學院學報;2013年01期
相關(guān)會議論文 前10條
1 楊任爾;陳懇;葉慶衛(wèi);;基于幀的多描述視頻編碼冗余插入研究[A];2009中國控制與決策會議論文集(2)[C];2009年
2 袁子立;胡世安;孟一鳴;王璀璨;;視頻編碼新技術(shù)新標準研究[A];全國第三屆信號和智能信息處理與應(yīng)用學術(shù)交流會專刊[C];2009年
3 巫戈明;孫立峰;鐘玉琢;;聯(lián)合零向量預(yù)測的分布式視頻編碼框架[A];第三屆和諧人機環(huán)境聯(lián)合學術(shù)會議(HHME2007)論文集[C];2007年
4 石春鶯;陳偉建;;分布式視頻編碼的近況和未來研究方向[A];2008年中國西部青年通信學術(shù)會議論文集[C];2008年
5 楊任爾;金煒;陳懇;;基于下抽樣多描述視頻編碼及解碼后處理研究[A];第二十七屆中國控制會議論文集[C];2008年
6 許鵬飛;羅建書;;率控制自組織矢量量化及在視頻編碼中的應(yīng)用[A];第十二屆全國圖象圖形學學術(shù)會議論文集[C];2005年
7 江濤;陳偉建;;可伸縮視頻編碼中運動模型的改進[A];2008年中國西部青年通信學術(shù)會議論文集[C];2008年
8 姜俊;胡駿;;新媒體視頻編碼方案比較研究[A];中國新聞技術(shù)工作者聯(lián)合會2008年學術(shù)年會論文集(下)[C];2008年
9 劉孝波;;基于聯(lián)合采樣的多描述視頻編碼[A];計算機技術(shù)與應(yīng)用進展·2007——全國第18屆計算機技術(shù)與應(yīng)用(CACIS)學術(shù)會議論文集[C];2007年
10 卿粼波;呂瑞;鄭敏;滕奇志;何小海;;基于迭代譯碼算法的分級分布式視頻編碼[A];第十五屆全國圖象圖形學學術(shù)會議論文集[C];2010年
相關(guān)重要報紙文章 前10條
1 記者 謝宏;我國主導的視頻編碼標準將頒為國際標準[N];科技日報;2013年
2 記者 徐建華;我國科學家主導的視頻編碼標準成國際標準[N];中國質(zhì)量報;2013年
3 中國工程院院士 高文;智慧城市中的視頻編碼、分析與評測[N];中國信息化周報;2013年
4 記者 徐建華;我國新一代視頻編碼標準公開征求意見[N];中國質(zhì)量報;2014年
5 湖北 褚達;視頻編碼一網(wǎng)打盡[N];電腦報;2003年
6 國際;第二代AVS開啟國際化征程[N];中國電子報;2009年
7 周汝波 賀學金;碟機常用視頻D/A轉(zhuǎn)換、視頻編碼集成電路維修資料[N];電子報;2007年
8 中國科學院計算技術(shù)研究所,,中國科學院研究生院$$ $$信息產(chǎn)業(yè)部“數(shù)字音視頻編解碼技術(shù)標準工作組”秘書長、組長 黃鐵軍 高文;視頻編碼有絕招[N];計算機世界;2003年
9 ;視頻編碼標準的發(fā)展[N];計算機世界;2005年
10 周汝波 賀學金;碟機常用視頻D/A轉(zhuǎn)換、視頻編碼集成電路維修資料[N];電子報;2007年
相關(guān)博士學位論文 前10條
1 張江山;基于變換的視頻編碼與率失真分析[D];華中科技大學;2003年
2 趙安邦;穩(wěn)健視頻編碼與傳輸技術(shù)研究[D];清華大學;2007年
3 楊志杰;可伸縮視頻編碼中的基礎(chǔ)算法研究[D];中國科學院研究生院(軟件研究所);2004年
4 張克新;可伸縮視頻編碼及傳輸理論與應(yīng)用研究[D];華南理工大學;2012年
5 孟麗麗;多視點視頻編碼的研究[D];北京交通大學;2013年
6 王鵬;分布式視頻編碼率失真特性研究[D];上海交通大學;2008年
7 錢大興;基于視頻內(nèi)容的可伸縮視頻編碼的研究[D];大連理工大學;2012年
8 朱海波;可伸縮視頻編碼傳輸速率控制技術(shù)研究[D];中國科學技術(shù)大學;2013年
9 張文豪;可分級與高效視頻編碼中關(guān)鍵技術(shù)的研究[D];北京郵電大學;2010年
10 任巨;基于流計算模型的視頻編碼關(guān)鍵技術(shù)研究[D];國防科學技術(shù)大學;2010年
相關(guān)碩士學位論文 前10條
1 萬衛(wèi)星;分級視頻編碼結(jié)構(gòu)及其量化技術(shù)的研究[D];中國科學技術(shù)大學;2009年
2 趙海濤;基于3D小波的多描述可分級視頻編碼[D];西安電子科技大學;2005年
3 王慧文;一種面向因特網(wǎng)的健壯視頻編碼方案的設(shè)計與實現(xiàn)[D];湖南大學;2006年
4 范鈺華;分布式多描述視頻編碼研究[D];上海交通大學;2008年
5 毛曉菲;移動視頻編碼與傳輸關(guān)鍵技術(shù)研究[D];哈爾濱工程大學;2011年
6 李環(huán)環(huán);基于分布式視頻編碼錯誤消除機制的研究與實現(xiàn)[D];山東科技大學;2011年
7 蘇卓涵;分布式視頻編碼重建算法研究[D];華南理工大學;2012年
8 李志平;分布式視頻編碼中關(guān)鍵幀處理技術(shù)研究[D];南京郵電大學;2013年
9 周榮華;立體視頻編碼的若干問題研究[D];廣東工業(yè)大學;2013年
10 張鵬;多描述分布式視頻編碼研究[D];西安電子科技大學;2013年
本文編號:1732982
本文鏈接:http://sikaile.net/kejilunwen/wltx/1732982.html