基于多層結(jié)構(gòu)的視頻編碼研究
本文關(guān)鍵詞: 多層編碼結(jié)構(gòu) 可分層視頻編碼 層間相關(guān)性 層間幀內(nèi)模式預測 層間運動信息預測 隨機訪問 視頻內(nèi)容分析 聚類 出處:《浙江大學》2017年博士論文 論文類型:學位論文
【摘要】:多層視頻編碼結(jié)構(gòu)是指將視頻編碼為多個視頻層,然后利用層間預測消除不同層之間相關(guān)性的編碼結(jié)構(gòu)。在傳統(tǒng)的多層編碼結(jié)構(gòu)中,基本層和增強層之間的視頻圖像是一一對應的,主要應用在可分層視頻編碼的空間可分層和質(zhì)量可分層中。而本文提出了一種新型的多層編碼結(jié)構(gòu),基本層由從視頻中抽取的少量具有通用信息的圖像組成,而增強層是完整的視頻序列。這樣的編碼結(jié)構(gòu)可以使得總的編碼效率高于單獨編碼增強層的效率。換句話說,新型的多層編碼結(jié)構(gòu)可以用于更高效的視頻編碼。本文研究了基于傳統(tǒng)多層結(jié)構(gòu)的可分層視頻編碼和基于新型多層結(jié)構(gòu)的更高效視頻編碼,并取得了以下創(chuàng)新:1、提出基于知識庫的新型多層編碼結(jié)構(gòu)在傳統(tǒng)的多層編碼結(jié)構(gòu)中,基本層圖像和增強層圖像一一對應。而新型的多層編碼結(jié)構(gòu)從對視頻內(nèi)容的分析出發(fā),提取出少量的代表圖像構(gòu)成基本層,再通過層間預測使得總的編碼效率高于單獨編碼增強層的效率。由于基本層的圖像在編解碼中需要長時間的存儲供增強層參考,本文提出了基于知識庫的視頻編碼框架,在該框架下解決了下面兩個主要的技術(shù)問題:第一、研究了知識庫基本層的構(gòu)造問題并提出了兩種構(gòu)造方法。第一種,提取視頻各場景的場景切換圖像和隨機訪問圖像作為關(guān)鍵圖像,通過聚類的方法剔除關(guān)鍵圖像中屬于重復場景的圖像,從而導出知識庫圖像,該方法在保證基本層的編碼碼率盡量小的情況下和待編碼視頻有盡量大的相關(guān)性,有利于促進視頻編碼的效率。第二種,對各場景的場景切換圖像基于SIFT進行重復場景檢測和剔除,形成基本層。然后在每個場景內(nèi)部根據(jù)累積的內(nèi)容變化再補充選擇新的知識庫圖像。該方法可以和視頻編碼同步進行,適用于實時編碼應用。第二、提出了使用知識庫圖像的編碼方法。為了提高視頻編碼的效率并保證隨機訪問的功能,知識庫圖像按照全幀內(nèi)的模式進行編碼,知識庫在隨機訪問點不會清空。在編解碼過程中,以隨機訪問片段為單位參考最相似的知識庫圖像進行編碼。最相似的知識庫圖像以顏色直方圖差為相似度準則查找,簡單高效且能保證知識庫圖像的預測效率。2、傳統(tǒng)多層編碼結(jié)構(gòu)下的編碼方法研究本文研究了傳統(tǒng)多層編碼結(jié)構(gòu)下的層間預測技術(shù),主要包括層間幀內(nèi)模式預測和層間運動信息預測,使得層間的幀內(nèi)模式和運動信息相關(guān)性能夠得到充分的利用,從而提高增強層的編碼效率和降低增強層的編碼復雜度。
[Abstract]:Multi-layer video coding structure refers to the coding structure in which the video is encoded into multiple video layers, and then interlayer prediction is used to eliminate the correlation between different layers. The video images between the basic layer and the enhancement layer are one-to-one correspondence, which are mainly used in layered space and quality-layered video coding. In this paper, a new multi-layer coding structure is proposed. The basic layer consists of a small number of images with common information extracted from the video, while the enhancement layer is a complete video sequence. Such a coding structure can make the overall coding efficiency higher than that of the individual coding enhancement layer. New multilayer coding architecture can be used for more efficient video coding. In this paper, layered video coding based on traditional multi-layer structure and more efficient video coding based on new multi-layer structure are studied. The following innovations are obtained: 1. A new multi-layer coding structure based on knowledge base is proposed. In the traditional multi-layer coding structure, the basic layer image and the enhancement layer image correspond one-to-one. However, the new multi-layer coding structure starts from the analysis of video content. A small number of representative images are extracted to form the basic layer, and then the overall coding efficiency is higher than that of the single coding enhancement layer through interlayer prediction. In this paper, a video coding framework based on knowledge base is proposed. The following two main technical problems are solved under this framework: first, the construction of the basic layer of knowledge base is studied and two construction methods are proposed. The scene switching images and random access images of each scene of the video are extracted as the key images, and the images belonging to the repeated scenes in the key images are eliminated by clustering method, and the knowledge base images are derived. This method has the greatest correlation with the video to be encoded under the condition that the coding rate of the basic layer is as small as possible, which is helpful to promote the efficiency of video coding. The scene switching images of each scene are detected and culled by repeated scenes based on SIFT. A basic layer is formed. Then a new knowledge base image is added and selected within each scene according to the accumulated content changes. The method can be synchronized with video coding and is suitable for real-time coding applications. Second, In order to improve the efficiency of video coding and guarantee the function of random access, the knowledge base image is encoded according to the mode of the whole frame. The knowledge base will not be emptied at random access points. In the process of coding and decoding, the most similar knowledge base images are encoded by reference to the most similar knowledge base images in the unit of random access fragments. The most similar knowledge base images are found by using the color histogram difference as the similarity criterion. It is simple and efficient and can guarantee the prediction efficiency of knowledge base image. The traditional coding method under multi-layer coding structure is studied. In this paper, the interlayer prediction technology based on traditional multi-layer coding structure is studied. It mainly includes intra-layer mode prediction and inter-layer motion information prediction, which can make full use of the inter-layer mode and motion information correlation, thus improving the coding efficiency of the enhancement layer and reducing the coding complexity of the enhancement layer
【學位授予單位】:浙江大學
【學位級別】:博士
【學位授予年份】:2017
【分類號】:TN919.81
【相似文獻】
相關(guān)期刊論文 前10條
1 徐琳;;重點項目“高效視頻編碼中的關(guān)鍵技術(shù)研究”取得重要進展[J];自然科學進展;2007年02期
2 趙珊;張玲;鄭建彬;楊杰;;H.264視頻編碼標準[J];有線電視技術(shù);2007年11期
3 蔣剛毅;朱亞培;郁梅;張云;;基于感知的視頻編碼方法綜述[J];電子與信息學報;2013年02期
4 林慶帆;;視頻編碼的新趨勢(英文)[J];西安郵電大學學報;2013年03期
5 ;我國科學家主導的視頻編碼標準成國際標準[J];中國標準導報;2013年07期
6 李衛(wèi)平;;是否使用可伸縮視頻編碼(英文)[J];中國科學技術(shù)大學學報;2013年11期
7 沈蘭蓀,魏海,黃祥林;基于子帶/小波分解的視頻編碼可分級性研究[J];電子學報;2000年07期
8 韋強,李曉輝,翟宗起;一種自適應快速視頻編碼的新方法[J];微機發(fā)展;2000年06期
9 張勇東,李桂苓;立體視頻編碼中視差估值算法的研究[J];電子測量與儀器學報;2002年01期
10 張勇東,李桂苓;高性能三維小波視頻編碼方法[J];通信技術(shù);2002年01期
相關(guān)會議論文 前10條
1 楊任爾;陳懇;葉慶衛(wèi);;基于幀的多描述視頻編碼冗余插入研究[A];2009中國控制與決策會議論文集(2)[C];2009年
2 袁子立;胡世安;孟一鳴;王璀璨;;視頻編碼新技術(shù)新標準研究[A];全國第三屆信號和智能信息處理與應用學術(shù)交流會專刊[C];2009年
3 巫戈明;孫立峰;鐘玉琢;;聯(lián)合零向量預測的分布式視頻編碼框架[A];第三屆和諧人機環(huán)境聯(lián)合學術(shù)會議(HHME2007)論文集[C];2007年
4 石春鶯;陳偉建;;分布式視頻編碼的近況和未來研究方向[A];2008年中國西部青年通信學術(shù)會議論文集[C];2008年
5 楊任爾;金煒;陳懇;;基于下抽樣多描述視頻編碼及解碼后處理研究[A];第二十七屆中國控制會議論文集[C];2008年
6 許鵬飛;羅建書;;率控制自組織矢量量化及在視頻編碼中的應用[A];第十二屆全國圖象圖形學學術(shù)會議論文集[C];2005年
7 江濤;陳偉建;;可伸縮視頻編碼中運動模型的改進[A];2008年中國西部青年通信學術(shù)會議論文集[C];2008年
8 姜俊;胡駿;;新媒體視頻編碼方案比較研究[A];中國新聞技術(shù)工作者聯(lián)合會2008年學術(shù)年會論文集(下)[C];2008年
9 劉孝波;;基于聯(lián)合采樣的多描述視頻編碼[A];計算機技術(shù)與應用進展·2007——全國第18屆計算機技術(shù)與應用(CACIS)學術(shù)會議論文集[C];2007年
10 卿粼波;呂瑞;鄭敏;滕奇志;何小海;;基于迭代譯碼算法的分級分布式視頻編碼[A];第十五屆全國圖象圖形學學術(shù)會議論文集[C];2010年
相關(guān)重要報紙文章 前10條
1 記者 謝宏;我國主導的視頻編碼標準將頒為國際標準[N];科技日報;2013年
2 記者 徐建華;我國科學家主導的視頻編碼標準成國際標準[N];中國質(zhì)量報;2013年
3 中國工程院院士 高文;智慧城市中的視頻編碼、分析與評測[N];中國信息化周報;2013年
4 記者 徐建華;我國新一代視頻編碼標準公開征求意見[N];中國質(zhì)量報;2014年
5 湖北 褚達;視頻編碼一網(wǎng)打盡[N];電腦報;2003年
6 國際;第二代AVS開啟國際化征程[N];中國電子報;2009年
7 周汝波 賀學金;碟機常用視頻D/A轉(zhuǎn)換、視頻編碼集成電路維修資料[N];電子報;2007年
8 中國科學院計算技術(shù)研究所,,中國科學院研究生院$$ $$信息產(chǎn)業(yè)部“數(shù)字音視頻編解碼技術(shù)標準工作組”秘書長、組長 黃鐵軍 高文;視頻編碼有絕招[N];計算機世界;2003年
9 ;視頻編碼標準的發(fā)展[N];計算機世界;2005年
10 周汝波 賀學金;碟機常用視頻D/A轉(zhuǎn)換、視頻編碼集成電路維修資料[N];電子報;2007年
相關(guān)博士學位論文 前10條
1 王苫社;基于率失真優(yōu)化的高效視頻編碼技術(shù)研究[D];哈爾濱工業(yè)大學;2014年
2 胡金暉;基于深度信息的多視點視頻編碼及圖像增強技術(shù)研究[D];武漢大學;2014年
3 陳方棟;基于背景建模的高性能視頻編碼方法研究[D];中國科學技術(shù)大學;2017年
4 左旭光;基于多層結(jié)構(gòu)的視頻編碼研究[D];浙江大學;2017年
5 張江山;基于變換的視頻編碼與率失真分析[D];華中科技大學;2003年
6 趙安邦;穩(wěn)健視頻編碼與傳輸技術(shù)研究[D];清華大學;2007年
7 楊志杰;可伸縮視頻編碼中的基礎算法研究[D];中國科學院研究生院(軟件研究所);2004年
8 張克新;可伸縮視頻編碼及傳輸理論與應用研究[D];華南理工大學;2012年
9 孟麗麗;多視點視頻編碼的研究[D];北京交通大學;2013年
10 王鵬;分布式視頻編碼率失真特性研究[D];上海交通大學;2008年
相關(guān)碩士學位論文 前10條
1 張正勇;基于高效視頻編碼標準中編碼單元分割的樣點自適應補償算法研究[D];華東師范大學;2015年
2 趙曉榮;基于HEVC的快速編碼算法研究[D];鄭州輕工業(yè)學院;2015年
3 趙睿思;基于壓縮感知的分布式視頻編碼研究[D];哈爾濱工業(yè)大學;2014年
4 劉娟;基于高性能視頻編碼(HEVC)算法的改進[D];東華理工大學;2014年
5 錢程;基于壓縮感知的分布式視頻編碼的研究與實現(xiàn)[D];南京郵電大學;2015年
6 檀會娟;分布式視頻編碼相關(guān)技術(shù)的研究[D];南京郵電大學;2015年
7 聶菁;H.264/AVC快速模式選擇算法研究[D];合肥工業(yè)大學;2015年
8 孟雷雷;基于參數(shù)選擇的視頻編碼算法優(yōu)化研究[D];中國計量學院;2015年
9 盧曉亮;面向4K的HEVC視頻編碼及其在高清網(wǎng)絡攝像機上應用的研究[D];浙江大學;2016年
10 郭健生;多視角多描述視頻編碼[D];北京交通大學;2016年
本文編號:1503025
本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/1503025.html