基于內(nèi)容分析的圖像視頻編碼研究
[Abstract]:Digital image and video compression technology has been studied for more than 20 years and has achieved great success. However, many years of development have made the traditional coding framework based on "prediction-transformation" approach its performance limit more and more. The rapid development of computer vision in the last decade has inspired us to explore the visual correlation of images and improve the performance of image video coding based on visual content analysis.
In this paper, we focus on the combination of visual content analysis technology and image video coding technology. We use visual content analysis technology to analyze the visual correlation between images, eliminate visual redundancy at different levels in images and videos, so as to improve the coding efficiency of images and videos. Part of the work.
In the first part of our work, we propose an image coding method based on visual pattern analysis. This method describes the visual correlation between low and high frequencies of an image by a priori visual pattern, and thus adaptively discards some high frequency visual redundancy in the image at the coding end to improve the coding performance. In addition, we extend the analysis technique based on visual pattern to the application of scalable video coding, and propose a novel inter-layer prediction method based on visual pattern analysis. By mapping, the visual correlation of scalable video sequences in time domain and space domain is explored, and two high-quality inter-layer predictive signals are generated to improve the performance of scalable video coding. Our approach achieves a better balance between coding performance and complexity by combining multiple content analysis mechanisms and providing a multi-loop and single-loop system implementation.
In the second part of the work, we propose an efficient image coding method based on image features. This method establishes a closer local visual relationship through image local feature matching, and then combines the correlation analysis of pixel level to eliminate visual redundancy more effectively. Specifically, we use multi-scale wavelet transform. In SIFT feature extraction, the input image is decomposed into global information and local information in sub-band, and then encoded and compressed. SIFT features are used to retrieve a set of image slices with similar vision from cloud image database. Then, combined with the analysis and mapping based on visual pattern, the information in these similar image slices is fused with the decoded global information to reconstruct the target image. This method combines the advantages of local feature analysis and visual pattern analysis to achieve higher efficiency. Image coding performance.
In the third part, we propose an image set global optimization coding method based on global similarity analysis of image features. According to the global statistical characteristics of local features, we define feature distance to analyze the global similarity between images. On this basis, we cluster image sets into several correlations. Each node in the graph represents an image and each edge is weighted by the feature distance. By searching for the minimum weight spanning tree of the directed graph, the optimal coding structure with the minimum prediction cost can be obtained. In order to further enhance the graph and the graph. Firstly, we use SIFT feature matching and multi-model geometric motion estimation to eliminate geometric deformation in different regions. Secondly, we introduce photometric transformation to eliminate the difference between images caused by illumination changes. Motion compensation mechanism generates locally optimized predictive signals. The proposed image feature-based method makes full use of the advantages of various content analysis techniques. Feature-based global analysis techniques effectively determine the optimal coding structure; and image transformation based on local feature matching enhances the regional correlation between images and images. Therefore, our method effectively exploits the visual redundancy between related images, improves the overall coding efficiency of the image set, and provides a new idea for further research on large-scale image video coding in large data and cloud storage environment.
【學(xué)位授予單位】:中國科學(xué)技術(shù)大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2014
【分類號】:TN919.81
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 汪濱,王有德;擴(kuò)散泵振動對SEM的影響與消除振動[J];真空科學(xué)與技術(shù);1990年01期
2 王俊一,王乘,孫濤;小波變換閾值選取的博弈與圖像邊緣點(diǎn)檢測[J];微機(jī)發(fā)展;2005年04期
3 李東旭;;Delphi實(shí)現(xiàn)圖像邊緣檢測[J];電腦編程技巧與維護(hù);2009年S1期
4 周顥,戚飛虎;一種新的圖像邊緣檢測算法[J];計算機(jī)工程;2003年18期
5 周舒;;基于數(shù)學(xué)形態(tài)學(xué)的圖像邊緣檢測研究[J];科教文匯(上旬刊);2008年08期
6 曾友州;胡瑩;曾偉一;鄭曉霞;;提取數(shù)字圖像邊緣的算法比較[J];成都航空職業(yè)技術(shù)學(xué)院學(xué)報;2009年04期
7 黃炯;圖像邊緣處理[J];電視字幕.特技與動畫;2000年09期
8 張玉明,許曼;B超圖像邊緣增強(qiáng)技術(shù)的實(shí)現(xiàn)方法[J];電子技術(shù);1997年09期
9 劉剛;韓建棟;;一種新的基于梯度的2*圖像插值算法[J];紅外技術(shù);2006年06期
10 胡德明;;一種基于模糊梯度算法的圖像邊緣檢測方法[J];武漢理工大學(xué)學(xué)報(信息與管理工程版);2006年07期
相關(guān)會議論文 前10條
1 黃曉山;;數(shù)字圖像處理及其在醫(yī)學(xué)上的應(yīng)用[A];2009年浙江省醫(yī)學(xué)工程學(xué)術(shù)年會論文匯編[C];2009年
2 薛玉涵;錢亮;鞠浩;;基于模糊噪聲配套圖像的去運(yùn)動模糊方法[A];全國第三屆信號和智能信息處理與應(yīng)用學(xué)術(shù)交流會專刊[C];2009年
3 陳春寧;田睿;王毅楠;;基于色差插值的BAYER格式圖像色彩復(fù)原實(shí)現(xiàn)[A];第九屆全國信息獲取與處理學(xué)術(shù)會議論文集Ⅰ[C];2011年
4 羅強(qiáng);任慶利;;基于局部IFS理論提取圖像邊緣[A];第十二屆全國圖象圖形學(xué)學(xué)術(shù)會議論文集[C];2005年
5 徐慶偉;劉洲峰;李春雷;;一種基于小波變換的圖像邊緣檢測算法[A];第十四屆全國圖象圖形學(xué)學(xué)術(shù)會議論文集[C];2008年
6 蔣奇;高瑞;王雷;;管道漏磁場影響因素的研究[A];2005中國控制與決策學(xué)術(shù)年會論文集(下)[C];2005年
7 陸成剛;陳剛;張但;閔春燕;;圖像邊緣的優(yōu)化模型[A];'2002系統(tǒng)仿真技術(shù)及其應(yīng)用學(xué)術(shù)論文集(第四卷)[C];2002年
8 盧漢明;高德俊;;基于多尺度變換相結(jié)合的圖像增強(qiáng)算法[A];第二屆“測繪科學(xué)前沿技術(shù)論壇”論文精選[C];2010年
9 項(xiàng)昱暉;江開勇;夏濤;;基于動態(tài)域值的鞋幫圖像邊緣提取方法[A];2005年中國機(jī)械工程學(xué)會年會第11屆全國特種加工學(xué)術(shù)會議專輯[C];2005年
10 項(xiàng)昱暉;江開勇;夏濤;;基于動態(tài)域值的鞋幫圖像邊緣提取方法[A];2005年中國機(jī)械工程學(xué)會年會論文集第11屆全國特種加工學(xué)術(shù)會議專輯[C];2005年
相關(guān)重要報紙文章 前10條
1 ;B超術(shù)語解釋[N];農(nóng)村醫(yī)藥報(漢);2008年
2 ;用三星數(shù)碼DigimaxMaster軟件處理照片[N];科技日報;2007年
3 陜西 瞿貴榮;彩電特殊故障檢修五例[N];電子報;2007年
4 于亮、阿鯤;技術(shù)“掃”天下[N];中國計算機(jī)報;2002年
5 晶 瑩;三星新推精細(xì)大屏等離子顯示器[N];中國質(zhì)量報;2005年
6 馬駿睿 皓月;制作版畫效果圖片[N];中國攝影報;2007年
7 ;天敏隨心錄電視盒[N];中國電腦教育報;2004年
8 ;體驗(yàn)決定一切[N];中國計算機(jī)報;2003年
9 秦風(fēng);S9500——務(wù)實(shí)者的選擇[N];中國攝影報;2006年
10 芝麻糊;掃描的一些相關(guān)技術(shù) (1)[N];中國電腦教育報;2002年
相關(guān)博士學(xué)位論文 前10條
1 韓永華;農(nóng)田圖像的統(tǒng)計迭代分割方法研究[D];浙江大學(xué);2011年
2 陳少波;SAR圖像相干斑抑制算法研究[D];華中科技大學(xué);2010年
3 陳玫玫;手指靜脈圖像的去噪與分割算法研究[D];吉林大學(xué);2010年
4 陳國忠;SAR圖像紋斑噪聲抑制算法研究[D];上海交通大學(xué);2008年
5 康文煒;冠狀動脈造影圖像的分割方法研究[D];吉林大學(xué);2010年
6 邢坤;基于可見光遙感圖像的典型目標(biāo)識別關(guān)鍵技術(shù)研究及其系統(tǒng)實(shí)現(xiàn)[D];哈爾濱工業(yè)大學(xué);2010年
7 邢坤;基于可見光遙感圖像的典型目標(biāo)識別關(guān)鍵技術(shù)研究及其系統(tǒng)實(shí)現(xiàn)[D];哈爾濱工業(yè)大學(xué);2010年
8 李小兵;MRI圖像腦腫瘤分割與EEG腦癲癇檢測的研究[D];大連理工大學(xué);2010年
9 王繼陽;基于高分辨率航空遙感立體圖像的建筑物三維重建技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2009年
10 閆子飛;面向中醫(yī)舌診的舌下靜脈特征獲取與分析[D];哈爾濱工業(yè)大學(xué);2010年
相關(guān)碩士學(xué)位論文 前10條
1 王珊;X射線冠脈造影圖像的血管分割方法研究[D];蘭州大學(xué);2012年
2 高星星;基于稀疏分解的SAR圖像抑制斑點(diǎn)噪聲算法的研究[D];天津理工大學(xué);2011年
3 陳益新;基于DM6467的工件表面質(zhì)量圖像高速采集與處理技術(shù)研究[D];杭州電子科技大學(xué);2012年
4 李富城;多極化SAR圖像地物分類技術(shù)研究[D];解放軍信息工程大學(xué);2009年
5 關(guān)輝;基于Directionlet變換的SAR圖像噪聲抑制及邊緣檢測[D];西安電子科技大學(xué);2010年
6 陳國強(qiáng);準(zhǔn)雙曲面齒輪接觸圖像齒形輪廓和接觸斑點(diǎn)的二維重構(gòu)[D];河南理工大學(xué);2010年
7 滕揚(yáng);基于改進(jìn)的BP神經(jīng)網(wǎng)絡(luò)肺部CT圖像的結(jié)節(jié)識別[D];吉林大學(xué);2011年
8 李動節(jié);嵌入式圖像壓縮編解碼研究[D];鄭州大學(xué);2011年
9 王百超;圖像PDE濾波和盲恢復(fù)技術(shù)的理論研究及其在IVUS圖像處理中的應(yīng)用[D];山東大學(xué);2011年
10 鎖艷;基于分水嶺的SAR溢油圖像快速分割算法研究[D];大連海事大學(xué);2012年
,本文編號:2213954
本文鏈接:http://sikaile.net/kejilunwen/wltx/2213954.html