基于拓?fù)湎∈杈幋a深度學(xué)習(xí)的視頻語義概念檢測方法研究
發(fā)布時(shí)間:2021-07-30 20:44
近年來,隨著互聯(lián)網(wǎng)、多媒體技術(shù)迅猛發(fā)展,網(wǎng)絡(luò)視頻數(shù)據(jù)傳輸更加方便、來源愈加多樣使網(wǎng)絡(luò)視頻數(shù)據(jù)量迅速增加。視頻數(shù)據(jù)作為當(dāng)前互聯(lián)網(wǎng)中的重要數(shù)據(jù)源,含有比其它類型數(shù)據(jù)更加復(fù)雜、豐富的信息。如此豐富的視頻數(shù)據(jù)促使人們在語義層面對視頻數(shù)據(jù)進(jìn)行分析建立視頻的語義概念標(biāo)簽以實(shí)現(xiàn)對數(shù)據(jù)的更高效管理和檢索。研究如何高效的學(xué)習(xí)和利用視頻數(shù)據(jù)特征實(shí)現(xiàn)視頻語義概念建模檢測成為視頻管理和檢索領(lǐng)域的熱點(diǎn)問題。本文在查閱大量國內(nèi)外文獻(xiàn)基礎(chǔ)上,首先對視頻語義概念檢測的研究背景、意義及現(xiàn)狀進(jìn)行介紹,然后簡明介紹幾種深度學(xué)習(xí)模型以及基于深度學(xué)習(xí)的視頻語義概念檢測研究應(yīng)用。本文分析以往研究中不足之處提出基于拓?fù)湎∈杈幋a預(yù)訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)的視頻語義分析、基于圖正則化優(yōu)化深度神經(jīng)網(wǎng)絡(luò)的視頻語義分析,并且設(shè)計(jì)實(shí)現(xiàn)語義概念檢測原型系統(tǒng)。本文主要研究內(nèi)容如下:(1)提出了基于拓?fù)湎∈杈幋a預(yù)訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)的視頻語義分析。針對以往研究中基于卷積神經(jīng)網(wǎng)絡(luò)的視頻特征學(xué)習(xí)模型沒有考慮對視頻圖像拓?fù)湫畔W(xué)習(xí)的問題,本文提出基于拓?fù)湎∈杈幋a預(yù)訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)的視頻語義分析方法,該方法為稀疏自動(dòng)編碼器引入拓?fù)浼s束,構(gòu)建了一個(gè)新的拓?fù)湎∈杈幋a器用之...
【文章來源】:江蘇大學(xué)江蘇省
【文章頁數(shù)】:83 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
深度學(xué)習(xí)模型圖
分類器可抽象為將輸入 x 映射網(wǎng)絡(luò)定義 y f( x ; θ )的映射函數(shù),經(jīng)學(xué)習(xí)最佳近似。這種模型具有前向傳導(dǎo)的特性,程,最終達(dá)到輸出 。前饋神經(jīng)網(wǎng)絡(luò)的隱層單元組成,隱層計(jì)算單元的計(jì)算首先是對輸應(yīng)用非線性激活函數(shù)做非線性映射得到輸出于非線性激活函數(shù),這種非線性特性使神經(jīng)近似任何計(jì)算函數(shù)[22],并且不會(huì)降解為單使用多個(gè)不同的函數(shù)復(fù)合表示,能夠與一個(gè)地描述函數(shù)的復(fù)合過程。例如,將三個(gè)函數(shù)復(fù)合函數(shù)(3) (2) (1)f ( x ) f ( f ( f ( x)))構(gòu)成神經(jīng).2 為一個(gè)簡單前饋神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖。
基于拓?fù)湎∈杈幋a深度學(xué)習(xí)的視頻語義概念檢測方法研究表達(dá)式如下:2( ) ( ) 211( , ) ( )Ni iiJ x xN W b W數(shù)目, { , }e dW W W 為權(quán)重參數(shù), { , }e db b b 為偏置輸入樣本的重構(gòu)誤差,第二項(xiàng)為權(quán)重衰減項(xiàng), 為權(quán)重將網(wǎng)絡(luò)各處設(shè)置為輸出對等輸入 ( ( ))d ex f fx ,網(wǎng)絡(luò)具有缺陷,研究通常會(huì)進(jìn)一步考慮向自動(dòng)編碼器的目,使自動(dòng)編碼器學(xué)習(xí)近似地復(fù)制重構(gòu)輸出,同時(shí)通過持輸入數(shù)據(jù)的特定特性,從而學(xué)習(xí)獲得數(shù)據(jù)更有意義[26]、壓縮自動(dòng)編碼器等[27]等。
【參考文獻(xiàn)】:
期刊論文
[1]基于卷積-自動(dòng)編碼機(jī)的三維形狀特征學(xué)習(xí)[J]. 謝智歌,王岳青,竇勇,熊岳山. 計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào). 2015(11)
[2]數(shù)據(jù)驅(qū)動(dòng)的圖像智能分析和處理綜述[J]. 汪淼,張方略,胡事民. 計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào). 2015(11)
[3]核可鑒別的特征分塊稀疏表示的視頻語義分析[J]. 詹永照,田華鋒,毛啟容. 計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào). 2014(08)
[4]深度學(xué)習(xí)的昨天、今天和明天[J]. 余凱,賈磊,陳雨強(qiáng),徐偉. 計(jì)算機(jī)研究與發(fā)展. 2013(09)
本文編號(hào):3312097
【文章來源】:江蘇大學(xué)江蘇省
【文章頁數(shù)】:83 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
深度學(xué)習(xí)模型圖
分類器可抽象為將輸入 x 映射網(wǎng)絡(luò)定義 y f( x ; θ )的映射函數(shù),經(jīng)學(xué)習(xí)最佳近似。這種模型具有前向傳導(dǎo)的特性,程,最終達(dá)到輸出 。前饋神經(jīng)網(wǎng)絡(luò)的隱層單元組成,隱層計(jì)算單元的計(jì)算首先是對輸應(yīng)用非線性激活函數(shù)做非線性映射得到輸出于非線性激活函數(shù),這種非線性特性使神經(jīng)近似任何計(jì)算函數(shù)[22],并且不會(huì)降解為單使用多個(gè)不同的函數(shù)復(fù)合表示,能夠與一個(gè)地描述函數(shù)的復(fù)合過程。例如,將三個(gè)函數(shù)復(fù)合函數(shù)(3) (2) (1)f ( x ) f ( f ( f ( x)))構(gòu)成神經(jīng).2 為一個(gè)簡單前饋神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖。
基于拓?fù)湎∈杈幋a深度學(xué)習(xí)的視頻語義概念檢測方法研究表達(dá)式如下:2( ) ( ) 211( , ) ( )Ni iiJ x xN W b W數(shù)目, { , }e dW W W 為權(quán)重參數(shù), { , }e db b b 為偏置輸入樣本的重構(gòu)誤差,第二項(xiàng)為權(quán)重衰減項(xiàng), 為權(quán)重將網(wǎng)絡(luò)各處設(shè)置為輸出對等輸入 ( ( ))d ex f fx ,網(wǎng)絡(luò)具有缺陷,研究通常會(huì)進(jìn)一步考慮向自動(dòng)編碼器的目,使自動(dòng)編碼器學(xué)習(xí)近似地復(fù)制重構(gòu)輸出,同時(shí)通過持輸入數(shù)據(jù)的特定特性,從而學(xué)習(xí)獲得數(shù)據(jù)更有意義[26]、壓縮自動(dòng)編碼器等[27]等。
【參考文獻(xiàn)】:
期刊論文
[1]基于卷積-自動(dòng)編碼機(jī)的三維形狀特征學(xué)習(xí)[J]. 謝智歌,王岳青,竇勇,熊岳山. 計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào). 2015(11)
[2]數(shù)據(jù)驅(qū)動(dòng)的圖像智能分析和處理綜述[J]. 汪淼,張方略,胡事民. 計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào). 2015(11)
[3]核可鑒別的特征分塊稀疏表示的視頻語義分析[J]. 詹永照,田華鋒,毛啟容. 計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào). 2014(08)
[4]深度學(xué)習(xí)的昨天、今天和明天[J]. 余凱,賈磊,陳雨強(qiáng),徐偉. 計(jì)算機(jī)研究與發(fā)展. 2013(09)
本文編號(hào):3312097
本文鏈接:http://sikaile.net/kejilunwen/wltx/3312097.html
最近更新
教材專著