基于機(jī)器學(xué)習(xí)的多維數(shù)據(jù)壓縮算法研究
本文關(guān)鍵詞:基于機(jī)器學(xué)習(xí)的多維數(shù)據(jù)壓縮算法研究,,由筆耕文化傳播整理發(fā)布。
【摘要】:傳統(tǒng)基于字典學(xué)習(xí)的視頻編碼系統(tǒng)總是忽略其信號(hào)本身的特征分布,從而導(dǎo)致了很高的計(jì)算復(fù)雜度,降低了編碼效率。本文提出了一種基于時(shí)空在線字典學(xué)習(xí)算法()來(lái)加速字典學(xué)習(xí)的收斂速度,并保證了一定的估計(jì)誤差。所述算法利用隨機(jī)梯度下降法來(lái)構(gòu)造三維高頻與低頻的時(shí)空字典對(duì)。在每次的學(xué)習(xí)迭代過(guò)程中,基于塊梯度下降法學(xué)習(xí)算法優(yōu)化全部訓(xùn)練集樣本所產(chǎn)生的經(jīng)驗(yàn)代價(jià),例如。與之不同的是,隨機(jī)梯度下降法隨機(jī)地選擇一個(gè)訓(xùn)練集樣本,基于該樣本更新字典原子最小化近似期望代價(jià)。由于訓(xùn)練集中的樣本假設(shè)為獨(dú)立同分布,稀疏表示分解系數(shù)可以通過(guò)訓(xùn)練字典得到。相較于算法,本文所提出的基于時(shí)空在線字典學(xué)習(xí)算法理論上可以證明有更近似的稀疏表示,并能保持視頻信號(hào)的結(jié)構(gòu)化稀疏以及層間稀疏性。同時(shí),隨機(jī)梯度下降法比批量梯度下降法有著更快的收斂速度以及更低的計(jì)算復(fù)雜度,其預(yù)測(cè)誤差上限漸近地逼近訓(xùn)練誤差。大量實(shí)驗(yàn)證明,計(jì)算復(fù)雜度的降低能夠使基于時(shí)空在線字典學(xué)習(xí)的編碼框架比現(xiàn)有基于超分辨率的編碼方案以及標(biāo)準(zhǔn)編碼器H.264、HEVC有著更好的客觀、主觀質(zhì)量以及率失真表現(xiàn)。進(jìn)一步地,利用結(jié)構(gòu)化稀疏的機(jī)器學(xué)習(xí),本文提出了一種新的基于多尺度在線字典學(xué)習(xí)算法的質(zhì)量可分級(jí)視頻編碼框架。通過(guò)小波變換對(duì)圖像特征的層次化結(jié)構(gòu)進(jìn)行分解,將在線學(xué)習(xí)的搜索域優(yōu)化為帶有層次化稀疏的區(qū)塊。其中,基本層低頻子帶利用圖像組稀疏特征來(lái)獲得低頻子字典以及稀疏表示系數(shù)。可以證明,所設(shè)計(jì)的跨尺度分解重構(gòu)質(zhì)量可由一個(gè)有上界的估計(jì)誤差保證。在字典優(yōu)化模塊,通過(guò)隨機(jī)梯度下降法直接更新期望代價(jià)而不是經(jīng)驗(yàn)代價(jià)來(lái)降低計(jì)算復(fù)雜度。層次化的高頻結(jié)構(gòu)信息通過(guò)一個(gè)預(yù)先學(xué)習(xí)的子字典對(duì)來(lái)進(jìn)行預(yù)測(cè),實(shí)現(xiàn)可分級(jí)視頻編碼的目的。實(shí)驗(yàn)證明,所述算法能夠漸進(jìn)地實(shí)現(xiàn)質(zhì)量可分級(jí)性。對(duì)于不同傳輸環(huán)境的異構(gòu)網(wǎng)絡(luò),本文提出了一種基于漸進(jìn)式字典學(xué)習(xí)的時(shí)間可分級(jí)視頻編碼框架。通過(guò)可分級(jí)幀預(yù)測(cè)結(jié)構(gòu),視頻幀可以基于預(yù)先學(xué)習(xí)的時(shí)空字典連續(xù)重構(gòu)得到。在所述的漸進(jìn)式字典學(xué)習(xí)算法中,隨著重構(gòu)增強(qiáng)層的增加,重構(gòu)視頻幀提供了更多樣本來(lái)優(yōu)化學(xué)習(xí)字典。在實(shí)際編碼中,通過(guò)直接最小化期望代價(jià),基于隨機(jī)梯度下降法的字典更新極大的降低了編碼復(fù)雜度?梢宰C明,基于漸進(jìn)式時(shí)空字典學(xué)習(xí)的可分級(jí)視頻編碼框架能夠有效地保證視頻中的運(yùn)動(dòng)一致性。
【關(guān)鍵詞】:時(shí)空在線字典學(xué)習(xí) 結(jié)構(gòu)化稀疏表示 漸進(jìn)式字典學(xué)習(xí) 超分辨率 可分級(jí)視頻編碼
【學(xué)位授予單位】:上海交通大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類(lèi)號(hào)】:TN919.81;TP181
【目錄】:
- 摘要5-7
- ABSTRACT7-15
- 主要符號(hào)對(duì)照表15-16
- 第一章 緒論16-25
- 1.1 引言16
- 1.2 基于稀疏編碼的超分辨率算法16-18
- 1.3 現(xiàn)有的視頻編碼標(biāo)準(zhǔn)18-22
- 1.3.1 混合視頻編碼器框架18-21
- 1.3.2 可分級(jí)視頻編碼框架21-22
- 1.4 本文主要內(nèi)容與貢獻(xiàn)22-25
- 第二章 基于時(shí)空在線字典學(xué)習(xí)的超分辨率重建25-40
- 2.1 研究背景25-26
- 2.2 時(shí)空在線字典定義26-31
- 2.2.1 問(wèn)題定義26-27
- 2.2.2 時(shí)空在線字典學(xué)習(xí)算法27-29
- 2.2.3 時(shí)空在線字典學(xué)習(xí)的收斂速度29-31
- 2.3 基于時(shí)空在線字典學(xué)習(xí)的超分辨率算法31-36
- 2.3.1 基于時(shí)空在線字典學(xué)習(xí)的超分辨率算法31-32
- 2.3.2 算法計(jì)算復(fù)雜度分析32-34
- 2.3.3 算法預(yù)測(cè)誤差分析34-36
- 2.4 實(shí)驗(yàn)結(jié)果與分析36-38
- 2.4.1 基于時(shí)空在線字典學(xué)習(xí)的合成數(shù)據(jù)表示36-37
- 2.4.2 視頻序列的字典學(xué)習(xí)效果37-38
- 2.5 本章小結(jié)38-40
- 第三章 基于時(shí)空在線字典學(xué)習(xí)的視頻編碼框架40-56
- 3.1 研究背景40-41
- 3.2 基于時(shí)空在線字典學(xué)習(xí)的視頻編碼框架41-46
- 3.2.1 系統(tǒng)框架41-42
- 3.2.2 目標(biāo)函數(shù)定義42-44
- 3.2.3 訓(xùn)練視頻塊的提取44-46
- 3.3 基于超分辨率算法的視頻幀重構(gòu)46-48
- 3.3.1 合成過(guò)程46-47
- 3.3.2 時(shí)空在線字典的層間一致性47-48
- 3.4 實(shí)驗(yàn)結(jié)果與分析48-54
- 3.4.1 實(shí)驗(yàn)設(shè)置48-49
- 3.4.2 率失真表現(xiàn)49-51
- 3.4.3 主觀質(zhì)量51-52
- 3.4.4 計(jì)算復(fù)雜度52-53
- 3.4.5 關(guān)鍵幀的選擇53-54
- 3.5 本章小結(jié)54-56
- 第四章 基于時(shí)空在線字典學(xué)習(xí)的可分級(jí)視頻編碼框架56-74
- 4.1 研究背景56-57
- 4.2 基于多尺度時(shí)空在線字典學(xué)習(xí)的質(zhì)量可分級(jí)視頻編碼框架57-64
- 4.2.1 結(jié)構(gòu)化稀疏定義58-60
- 4.2.2 層次化多尺度字典構(gòu)造60-63
- 4.2.3 跨層間重構(gòu)63-64
- 4.3 基于層次化漸進(jìn)式字典學(xué)習(xí)的可分級(jí)視頻編碼框架64-68
- 4.3.1 系統(tǒng)框架65-67
- 4.3.2 漸進(jìn)式字典學(xué)習(xí)67-68
- 4.4 實(shí)驗(yàn)結(jié)果與分析68-72
- 4.4.1 實(shí)驗(yàn)設(shè)置68-69
- 4.4.2 質(zhì)量可分級(jí)性69-71
- 4.4.3 時(shí)間可分級(jí)性71-72
- 4.5 本章小結(jié)72-74
- 第五章 總結(jié)與展望74-77
- 5.1 全文總結(jié)與結(jié)論74-75
- 5.2 未來(lái)工作展望75-77
- 參考文獻(xiàn)77-84
- 致謝84-86
- 攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文目錄86
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 蘇秉華,金偉其,牛麗紅,劉廣榮;超分辨率圖像復(fù)原及其進(jìn)展[J];光學(xué)技術(shù);2001年01期
2 譚兵,徐青,耿則勛,邢帥;超分辨率圖象重建技術(shù)發(fā)展現(xiàn)狀[J];信息工程大學(xué)學(xué)報(bào);2003年04期
3 鐘山,沈振康;圖像靜態(tài)超分辨率重建[J];紅外與毫米波學(xué)報(bào);2004年02期
4 王勇,鄭輝,胡德文;視頻的超分辨率增強(qiáng)技術(shù)綜述[J];計(jì)算機(jī)應(yīng)用研究;2005年01期
5 焦斌亮;趙文蕾;;淺析互有位移圖像序列的超分辨率復(fù)原[J];遙測(cè)遙控;2006年01期
6 袁建華;殷學(xué)民;鄒謀炎;;一種有效的超分辨率重建計(jì)算方法[J];中國(guó)科學(xué)院研究生院學(xué)報(bào);2006年04期
7 張地;何家忠;彭宏;;低分辨率人臉序列的超分辨率重構(gòu)識(shí)別[J];韶關(guān)學(xué)院學(xué)報(bào);2007年06期
8 梁立恒;邢立新;姜紅艷;王明常;;高保真影像超分辨率重建應(yīng)用研究[J];吉林大學(xué)學(xué)報(bào)(地球科學(xué)版);2007年S1期
9 鄭麗賢;何小海;吳煒;楊曉敏;陳默;;基于學(xué)習(xí)的超分辨率技術(shù)[J];計(jì)算機(jī)工程;2008年05期
10 浦劍;張軍平;黃華;;超分辨率算法研究綜述[J];山東大學(xué)學(xué)報(bào)(工學(xué)版);2009年01期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條
1 潘明海;劉永坦;趙淑清;徐佳祥;干恒富;;一種多運(yùn)動(dòng)目標(biāo)的超分辨率檢測(cè)算法[A];第九屆全國(guó)信號(hào)處理學(xué)術(shù)年會(huì)(CCSP-99)論文集[C];1999年
2 李兵兵;陸耀;王曉明;李勁嫻;;基于金字塔回歸策略的人臉超分辨率[A];計(jì)算機(jī)技術(shù)與應(yīng)用進(jìn)展·2007——全國(guó)第18屆計(jì)算機(jī)技術(shù)與應(yīng)用(CACIS)學(xué)術(shù)會(huì)議論文集[C];2007年
3 戴光智;陳鐵群;薛家祥;;基于微掃描技術(shù)焊縫超聲圖像的超分辨率重建[A];第十七屆全國(guó)測(cè)控計(jì)量?jī)x器儀表學(xué)術(shù)年會(huì)(MCMI'2007)論文集(上冊(cè))[C];2007年
4 鄭杰;韓梅;;基于微位移的超分辨率重建技術(shù)[A];2008'中國(guó)信息技術(shù)與應(yīng)用學(xué)術(shù)論壇論文集(一)[C];2008年
5 張光昭;胡敬爐;謝澤明;;超分辨率亞毫米波付里葉變換譜[A];第四屆全國(guó)波譜學(xué)學(xué)術(shù)會(huì)議論文摘要集[C];1986年
6 繆泓;徐海明;;微平移序列圖像的超分辨率重建技術(shù)[A];中國(guó)力學(xué)學(xué)會(huì)學(xué)術(shù)大會(huì)'2009論文摘要集[C];2009年
7 徐啟飛;顏剛;陳武凡;;關(guān)于序列圖像的超分辨率重建算法[A];中國(guó)生物醫(yī)學(xué)工程進(jìn)展——2007中國(guó)生物醫(yī)學(xué)工程聯(lián)合學(xué)術(shù)年會(huì)論文集(上冊(cè))[C];2007年
8 徐忠強(qiáng);朱秀昌;;基于正則算法的壓縮視頻超分辨率重建[A];第十三屆全國(guó)圖象圖形學(xué)學(xué)術(shù)會(huì)議論文集[C];2006年
9 池小梅;馬建偉;黃景濤;;基于壓縮傳感的超分辨率紅外成像研究[A];中國(guó)自動(dòng)化學(xué)會(huì)中南六。▍^(qū))2010年第28屆年會(huì)·論文集[C];2010年
10 黃華;何惠婷;;一種基于CCA空間超分辨率的人臉識(shí)別方法[A];第18屆全國(guó)多媒體學(xué)術(shù)會(huì)議(NCMT2009)、第5屆全國(guó)人機(jī)交互學(xué)術(shù)會(huì)議(CHCI2009)、第5屆全國(guó)普適計(jì)算學(xué)術(shù)會(huì)議(PCC2009)論文集[C];2009年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 傅罡;多源遙感數(shù)據(jù)的道路提取方法研究[D];清華大學(xué);2014年
2 巴拉卡,雅各布Maiseli(Baraka Jacob Maiseli);基于正則化的非線性擴(kuò)散模型的超分辨率方法[D];哈爾濱工業(yè)大學(xué);2015年
3 王曉峰;基于樣本學(xué)習(xí)的人臉超分辨率重建技術(shù)研究[D];華中科技大學(xué);2015年
4 袁建華;超分辨率重建中若干問(wèn)題的研究[D];中國(guó)科學(xué)院研究生院(電子學(xué)研究所);2006年
5 范沖;三線陣影像超分辨率重建[D];中南大學(xué);2007年
6 張小紅;視頻去運(yùn)動(dòng)模糊及超分辨率研究[D];浙江大學(xué);2012年
7 江濤;同視域多幀視覺(jué)影像超分辨率重建技術(shù)研究[D];山東科技大學(xué);2005年
8 郭曉新;超分辨率重建問(wèn)題的研究[D];吉林大學(xué);2005年
9 韓玉兵;圖像及視頻序列的超分辨率重建[D];東南大學(xué);2006年
10 盧濤;低質(zhì)量監(jiān)控視頻人臉超分辨率技術(shù)研究[D];武漢大學(xué);2013年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 李智盛;壓縮傳感在超分辨率中的應(yīng)用[D];清華大學(xué);2011年
2 劉鵬;壓縮自編碼字典下的多機(jī)制鄰域嵌入超分辨率重建算法[D];華南理工大學(xué);2015年
3 蔣曉慧;自適應(yīng)正則化超分辨率重建方法的研究[D];蘇州大學(xué);2015年
4 楊國(guó)珂;基于壓縮傳感的圖像分辨率重構(gòu)方法和應(yīng)用[D];江西理工大學(xué);2015年
5 周才發(fā);基于流形對(duì)齊的WLAN室內(nèi)定位方法研究[D];哈爾濱工業(yè)大學(xué);2015年
6 陳果;單一醫(yī)學(xué)視頻時(shí)空超分辨率算法研究[D];北京理工大學(xué);2015年
7 李靖;基于壓縮感知的超分辨率理論與技術(shù)研究[D];電子科技大學(xué);2015年
8 黎媛;基于超分辨率的多視角混合分辨率視頻描述的關(guān)鍵技術(shù)研究[D];電子科技大學(xué);2015年
9 羅國(guó)中;面向低質(zhì)量視頻的目標(biāo)對(duì)象的超分辨率重建技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2013年
10 李華陽(yáng);手部深度圖像去噪與超分辨率方法研究[D];北京工業(yè)大學(xué);2015年
本文關(guān)鍵詞:基于機(jī)器學(xué)習(xí)的多維數(shù)據(jù)壓縮算法研究,由筆耕文化傳播整理發(fā)布。
本文編號(hào):266081
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/266081.html