基于深度學(xué)習(xí)的校園視頻檢索算法應(yīng)用研究
發(fā)布時(shí)間:2021-02-16 02:56
隨著多媒體技術(shù)和網(wǎng)絡(luò)技術(shù)的迅速發(fā)展,各種視頻存儲(chǔ)和壓縮技術(shù)的相繼出現(xiàn),視頻信息的獲取、傳播和存儲(chǔ)變得越來越簡單方便,研究視頻序列,能挖掘出更多有價(jià)值的信息。近年來,隨著計(jì)算機(jī)視覺、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等領(lǐng)域技術(shù)的高速發(fā)展,對(duì)視頻中人物進(jìn)行有效快速地檢索成為基于內(nèi)容的視頻檢索領(lǐng)域研究的熱點(diǎn)。深度學(xué)習(xí)是機(jī)器學(xué)習(xí)領(lǐng)域中的新興分支之一,其具有超強(qiáng)的學(xué)習(xí)能力,以及優(yōu)于傳統(tǒng)使用手工提取圖像特征的能力,因而得到了越來越多的研究者的青睞,F(xiàn)如今校園內(nèi)或者教室中都安裝了攝像頭,有大量視頻數(shù)據(jù),可以挖掘其中豐富的信息。所以本文針對(duì)這種場景,通過對(duì)人臉檢測和人臉識(shí)別算法的基礎(chǔ)理論和關(guān)鍵技術(shù)的深入研究,設(shè)計(jì)并實(shí)現(xiàn)了一個(gè)基于深度學(xué)習(xí)的校園視頻檢索系統(tǒng)。主要研究內(nèi)容如下:設(shè)計(jì)了適于視頻檢索的卷積神經(jīng)網(wǎng)絡(luò)人臉檢測算法。在AlexNet卷積神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上,通過加深網(wǎng)絡(luò)的層數(shù),減小卷積層Filter大小等方法設(shè)計(jì)了一個(gè)基于卷積神經(jīng)網(wǎng)絡(luò)的人臉檢測算法,該算法模型在測試集上達(dá)到了98.78%的準(zhǔn)確率。改進(jìn)了傳統(tǒng)的人臉跟蹤算法。為了提高人臉檢測在視頻中的穩(wěn)定性,本文引入了人臉跟蹤算法。但傳統(tǒng)的人臉跟蹤算法,時(shí)間復(fù)雜度較高,為...
【文章來源】:內(nèi)蒙古工業(yè)大學(xué)內(nèi)蒙古自治區(qū)
【文章頁數(shù)】:58 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
LeNet-5網(wǎng)絡(luò)模型框架
最大池化
圖 2-4 全連接和局部連接Fig. 2-4 Full Connection And Local Connection數(shù)網(wǎng)絡(luò)中,激活函數(shù)的存在具有重要的意義。激活函數(shù)的解決線性因素帶來的表達(dá)能力不足的問題。卷積神經(jīng)網(wǎng)Sigmoid,Tanh,ReLU[36]及其改進(jìn)版本 PReLU[37]等。其經(jīng)逐漸被 ReLU 函數(shù)及其改進(jìn)版本取代。激活函數(shù)夠把輸入的連續(xù)實(shí)值控制到 0 和 1 之間。尤其注意,如出就是 0;如果是特別大的正數(shù),輸出就是 1。數(shù)的表達(dá)式,見(2-1): ( ) =
本文編號(hào):3036024
【文章來源】:內(nèi)蒙古工業(yè)大學(xué)內(nèi)蒙古自治區(qū)
【文章頁數(shù)】:58 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
LeNet-5網(wǎng)絡(luò)模型框架
最大池化
圖 2-4 全連接和局部連接Fig. 2-4 Full Connection And Local Connection數(shù)網(wǎng)絡(luò)中,激活函數(shù)的存在具有重要的意義。激活函數(shù)的解決線性因素帶來的表達(dá)能力不足的問題。卷積神經(jīng)網(wǎng)Sigmoid,Tanh,ReLU[36]及其改進(jìn)版本 PReLU[37]等。其經(jīng)逐漸被 ReLU 函數(shù)及其改進(jìn)版本取代。激活函數(shù)夠把輸入的連續(xù)實(shí)值控制到 0 和 1 之間。尤其注意,如出就是 0;如果是特別大的正數(shù),輸出就是 1。數(shù)的表達(dá)式,見(2-1): ( ) =
本文編號(hào):3036024
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3036024.html
最近更新
教材專著