大跨度視頻編碼與傳輸體系研究
發(fā)布時(shí)間:2021-10-27 05:47
隨著人們對(duì)視覺內(nèi)容的消費(fèi)需求越來越高,互聯(lián)網(wǎng)中視頻數(shù)據(jù)的儲(chǔ)量呈爆炸式增長(zhǎng)。海量視頻的存儲(chǔ)和傳輸消耗著大量的存儲(chǔ)和帶寬資源。為了降低視頻數(shù)據(jù)量,視頻編碼方案使用了層出不窮的高效技術(shù)以提升編碼效率。但是為了支持靈活的隨機(jī)訪問,視頻碼流中存在著很多隨機(jī)訪問點(diǎn),它們將碼流分割為多段相互獨(dú)立的隨機(jī)訪問片段。由于不能相互參考,隨機(jī)訪問片段之間的冗余信息無法被有效剔除,以至于不能進(jìn)一步提升編碼效率。實(shí)際上,在很多視頻中,隨機(jī)訪問片段在大跨度的時(shí)間間隔內(nèi)存在著反復(fù)出現(xiàn)的背景或?qū)ο蟆榱死眠@種大跨度的相關(guān)信息,前人提出基于場(chǎng)景知識(shí)庫(kù)的視頻編碼方法,通過引入包含多樣場(chǎng)景內(nèi)容的外源知識(shí)圖像庫(kù),為主視頻中包含相似場(chǎng)景的隨機(jī)訪問片段提供外源參考信息。然而,外源知識(shí)圖像帶來了兩方面的問題。一方面,在編碼層,生成獲取的知識(shí)圖像的內(nèi)容和質(zhì)量會(huì)極大地影響視頻編碼的效率,而獲取內(nèi)容多樣又存儲(chǔ)精簡(jiǎn)的最優(yōu)知識(shí)圖像集會(huì)消耗很多的計(jì)算時(shí)間,這為其在海量視頻的壓縮上帶來了阻礙,如何快速地獲取最優(yōu)知識(shí)圖像是在編碼層獲得編碼性能增益的一個(gè)關(guān)鍵問題;另一方面,在系統(tǒng)層,外源知識(shí)圖像在大跨度時(shí)間上的交替共享使用為視頻碼流的隨機(jī)訪問的實(shí)現(xiàn)...
【文章來源】:浙江大學(xué)浙江省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:131 頁(yè)
【學(xué)位級(jí)別】:博士
【部分圖文】:
圖1.2視頻的混合編碼框架??
浙江大學(xué)博士學(xué)位論文?1緒論??^?^?^1?'^1?h?^?^??????RL-0?B-16??圖1.3?GOP大小為16的分層參考結(jié)構(gòu)示意圖??失真分析來選擇最佳的長(zhǎng)期參考鄭被選做長(zhǎng)期參考幀的視頻幀通常會(huì)進(jìn)行高質(zhì)量的編碼,??相fc于參考普通質(zhì)董的短期參考幀而言,后續(xù)的待編碼幀通過參考高質(zhì)量的長(zhǎng)期參考幀能??相應(yīng)地獲得高質(zhì)量的重建結(jié)果,從而提升編碼性能[441。但是由于視頻幀中通常都存在前景??遮擋,因此視頻重建幀中選擇出的長(zhǎng)期參考幀通常都不是“千凈”的背景。近期研究者們??提出通過構(gòu)造出一+背景圖像來作為長(zhǎng)期參考鄭Paul等人[45]利用高斯混合模型對(duì)一個(gè)視??頻中大量視頻幀在同一位置的像素進(jìn)行建模來生成背景圖像作為長(zhǎng)期參考鄭由于高斯混??合模型的建模會(huì)帶來大量的浮點(diǎn)計(jì)算,因此使得編碼時(shí)間大幅增加。為了降低生成背景圖??像的計(jì)算復(fù)雜度,Zhang等人[46]提出了通過簡(jiǎn)單地將多+圖片逐像素平均來生成背景圖像??作為長(zhǎng)期參考鄭在Zhang等人的算法中,背景圖像作為單獨(dú)的一幀只使用幀內(nèi)預(yù)測(cè)來編??碼,且由于其被大量的視顛幀所參考,因此會(huì)使用較小的量化參數(shù)來編碼,相應(yīng)地,背景??圖像對(duì)應(yīng)生成的位流通常會(huì)很大,在短時(shí)間內(nèi)傳輸背景圖像需要花費(fèi)大量的比特,從而可??能導(dǎo)致發(fā)生位流沖激,導(dǎo)致數(shù)據(jù)包丟失和嚴(yán)重的視頻質(zhì)量下降。為了解決這個(gè)問題,Chen??等人[47]提出了一種基于塊組成的背景圖像作為長(zhǎng)期參考鄭在Chen等人的方案中,他們??將整+背景像分成多個(gè)編碼單元塊,通過從不同的視頻幀中選擇出對(duì)應(yīng)位置的背景單元塊,??將背景圖像以編碼單元塊的方式分散到多幅視頻幀中,以實(shí)現(xiàn)平滑的位流輸出。??長(zhǎng)期參考幀最常見的應(yīng)
卡載控制、??'文#封?I?文件1?ixmr??、.氣器J?本“放?L?*斤丨器J?\??I?_?I??系統(tǒng)層?視頻碼流?I?視頻碼流??j?^r1?■??—?—?—?—?■?-_,?—?— ̄?—? ̄ ̄?—?^?—?—???—?—?—?—?—?—?—?—?—??—?—??^??編碼層??j?[編碼器j?|?[解碼器j??ii?■贊入jiff?i????輸出視頻?]??A?--—「-—?〇??圖1.4視頻的編碼與傳輸系統(tǒng)框架??編碼圖像提供高效的參考信息。該方法使用顏色直方圖度量知識(shí)庫(kù)圖像與編碼圖像之間的??相似度并使用K-Medoids的聚類方法獲取知識(shí)庫(kù)圖像集合9但是,在一方面,K-Medoids??方法主要用于將屬性或內(nèi)容相似的對(duì)象劃分為不同的類別以區(qū)分對(duì)象,其主要目的是分類,??而知識(shí)庫(kù)圖像集合生成的目標(biāo)并不僅僅是將視頻圖像劃分為不同的類別,還要求為每個(gè)類??別選出最能表現(xiàn)類別特性的代表對(duì)象作為知識(shí)庫(kù)圖像,因此K-Medoids方法的目的與知識(shí)??庫(kù)圖像集合生成的目標(biāo)并不完全一致。在另一方面,使用K-Medoids聚類方法需要指定聚??類數(shù)目并遍歷獲取最佳知識(shí)庫(kù)圖像集合的數(shù)目,這在對(duì)長(zhǎng)時(shí)視頻生成知識(shí)庫(kù)圖像集合時(shí)會(huì)??帶來較高的復(fù)雜度。在第三方面,以相似度作為編碼代價(jià)的估計(jì)方法并不準(zhǔn)確。??1.3系統(tǒng)層存儲(chǔ)和傳輸研究現(xiàn)狀??視頻的廣泛應(yīng)用除了依賴高效的視頻編碼,還離不開靈活的視頻存儲(chǔ)和傳輸。現(xiàn)有的??視頻編碼與傳輸體系架構(gòu)如圖1.4所示。輸入的視頻在編碼層被編碼單元壓縮為碼流,在系??統(tǒng)層的服務(wù)端被按照文件格式封裝為視頻文件
【參考文獻(xiàn)】:
期刊論文
[1]Error-Resilient Multi-view Video Coding Based on End-to-End Rate-Distortion Optimization[J]. GAO Pan,PENG Qiang,WANG Qionghua. Chinese Journal of Electronics. 2016(02)
本文編號(hào):3460995
【文章來源】:浙江大學(xué)浙江省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:131 頁(yè)
【學(xué)位級(jí)別】:博士
【部分圖文】:
圖1.2視頻的混合編碼框架??
浙江大學(xué)博士學(xué)位論文?1緒論??^?^?^1?'^1?h?^?^??????RL-0?B-16??圖1.3?GOP大小為16的分層參考結(jié)構(gòu)示意圖??失真分析來選擇最佳的長(zhǎng)期參考鄭被選做長(zhǎng)期參考幀的視頻幀通常會(huì)進(jìn)行高質(zhì)量的編碼,??相fc于參考普通質(zhì)董的短期參考幀而言,后續(xù)的待編碼幀通過參考高質(zhì)量的長(zhǎng)期參考幀能??相應(yīng)地獲得高質(zhì)量的重建結(jié)果,從而提升編碼性能[441。但是由于視頻幀中通常都存在前景??遮擋,因此視頻重建幀中選擇出的長(zhǎng)期參考幀通常都不是“千凈”的背景。近期研究者們??提出通過構(gòu)造出一+背景圖像來作為長(zhǎng)期參考鄭Paul等人[45]利用高斯混合模型對(duì)一個(gè)視??頻中大量視頻幀在同一位置的像素進(jìn)行建模來生成背景圖像作為長(zhǎng)期參考鄭由于高斯混??合模型的建模會(huì)帶來大量的浮點(diǎn)計(jì)算,因此使得編碼時(shí)間大幅增加。為了降低生成背景圖??像的計(jì)算復(fù)雜度,Zhang等人[46]提出了通過簡(jiǎn)單地將多+圖片逐像素平均來生成背景圖像??作為長(zhǎng)期參考鄭在Zhang等人的算法中,背景圖像作為單獨(dú)的一幀只使用幀內(nèi)預(yù)測(cè)來編??碼,且由于其被大量的視顛幀所參考,因此會(huì)使用較小的量化參數(shù)來編碼,相應(yīng)地,背景??圖像對(duì)應(yīng)生成的位流通常會(huì)很大,在短時(shí)間內(nèi)傳輸背景圖像需要花費(fèi)大量的比特,從而可??能導(dǎo)致發(fā)生位流沖激,導(dǎo)致數(shù)據(jù)包丟失和嚴(yán)重的視頻質(zhì)量下降。為了解決這個(gè)問題,Chen??等人[47]提出了一種基于塊組成的背景圖像作為長(zhǎng)期參考鄭在Chen等人的方案中,他們??將整+背景像分成多個(gè)編碼單元塊,通過從不同的視頻幀中選擇出對(duì)應(yīng)位置的背景單元塊,??將背景圖像以編碼單元塊的方式分散到多幅視頻幀中,以實(shí)現(xiàn)平滑的位流輸出。??長(zhǎng)期參考幀最常見的應(yīng)
卡載控制、??'文#封?I?文件1?ixmr??、.氣器J?本“放?L?*斤丨器J?\??I?_?I??系統(tǒng)層?視頻碼流?I?視頻碼流??j?^r1?■??—?—?—?—?■?-_,?—?— ̄?—? ̄ ̄?—?^?—?—???—?—?—?—?—?—?—?—?—??—?—??^??編碼層??j?[編碼器j?|?[解碼器j??ii?■贊入jiff?i????輸出視頻?]??A?--—「-—?〇??圖1.4視頻的編碼與傳輸系統(tǒng)框架??編碼圖像提供高效的參考信息。該方法使用顏色直方圖度量知識(shí)庫(kù)圖像與編碼圖像之間的??相似度并使用K-Medoids的聚類方法獲取知識(shí)庫(kù)圖像集合9但是,在一方面,K-Medoids??方法主要用于將屬性或內(nèi)容相似的對(duì)象劃分為不同的類別以區(qū)分對(duì)象,其主要目的是分類,??而知識(shí)庫(kù)圖像集合生成的目標(biāo)并不僅僅是將視頻圖像劃分為不同的類別,還要求為每個(gè)類??別選出最能表現(xiàn)類別特性的代表對(duì)象作為知識(shí)庫(kù)圖像,因此K-Medoids方法的目的與知識(shí)??庫(kù)圖像集合生成的目標(biāo)并不完全一致。在另一方面,使用K-Medoids聚類方法需要指定聚??類數(shù)目并遍歷獲取最佳知識(shí)庫(kù)圖像集合的數(shù)目,這在對(duì)長(zhǎng)時(shí)視頻生成知識(shí)庫(kù)圖像集合時(shí)會(huì)??帶來較高的復(fù)雜度。在第三方面,以相似度作為編碼代價(jià)的估計(jì)方法并不準(zhǔn)確。??1.3系統(tǒng)層存儲(chǔ)和傳輸研究現(xiàn)狀??視頻的廣泛應(yīng)用除了依賴高效的視頻編碼,還離不開靈活的視頻存儲(chǔ)和傳輸。現(xiàn)有的??視頻編碼與傳輸體系架構(gòu)如圖1.4所示。輸入的視頻在編碼層被編碼單元壓縮為碼流,在系??統(tǒng)層的服務(wù)端被按照文件格式封裝為視頻文件
【參考文獻(xiàn)】:
期刊論文
[1]Error-Resilient Multi-view Video Coding Based on End-to-End Rate-Distortion Optimization[J]. GAO Pan,PENG Qiang,WANG Qionghua. Chinese Journal of Electronics. 2016(02)
本文編號(hào):3460995
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3460995.html
最近更新
教材專著