基于深度學習的監(jiān)控視頻中的異常事件檢測和對象識別
發(fā)布時間:2021-09-01 17:49
近年來,國內(nèi)物聯(lián)網(wǎng)概念和深度學習的興起使得人工智能開始滲透到生活的各個領(lǐng)域。而安防產(chǎn)業(yè),作為維護社會穩(wěn)定和人們?nèi)松戆踩闹匾侄?因人工智能的產(chǎn)業(yè)賦能而得到長足的發(fā)展。為了持續(xù)推動安防產(chǎn)業(yè)的發(fā)展,我國提出了平安城市的概念。建設(shè)平安城市的基礎(chǔ)是信息感知,構(gòu)建出全面立體的安防監(jiān)控網(wǎng)絡(luò)是必不可少的手段。因此視頻監(jiān)控技術(shù)得到越來越廣泛的應(yīng)用,大量的監(jiān)控設(shè)備部署在校園、街道和小區(qū)等公共場所,產(chǎn)生了海量的監(jiān)控視頻數(shù)據(jù)。然而傳統(tǒng)的視頻監(jiān)控技術(shù)多數(shù)只提供采集、存儲和回看功能,存在諸多弊端。當下隨著人工智能的發(fā)展,如何智能地分析處理海量視頻數(shù)據(jù),從中提取出有用的信息,并對視頻中的目標進行識別,成為人工智能領(lǐng)域的熱點研究問題。本論文針對異常事件檢測、不同分辨率人臉識別和行人重識別等問題開展研究工作,主要有:(1)監(jiān)控視頻中的異常事件檢測,比如打斗、追逐或人群聚集等事件;(2)監(jiān)控視頻中異常或者可疑行人的身份識別。深度學習在圖像識別,語音識別等領(lǐng)域取得巨大進展,為監(jiān)控視頻的智能處理提供了契機,本文以深度學習為工具,開展的研究工作和主要創(chuàng)新如下:1.對于監(jiān)控視頻中異常事件的檢測問題,提出了一種基于自適應(yīng)自編碼...
【文章來源】:中國科學技術(shù)大學安徽省 211工程院校 985工程院校
【文章頁數(shù)】:118 頁
【學位級別】:博士
【部分圖文】:
圖2.1神經(jīng)網(wǎng)絡(luò)示例??
隱含層中恢復原始輸入。為了有效地恢復原始數(shù)據(jù),并提取出有效的特征表達,??需要針對不同的應(yīng)用場景對代價函數(shù)加入相應(yīng)的正則化項。其中編碼和解碼的??程如下:??V?=?10^2:?+?6i??(2.10)??i?=?wjf(y)?+?b2??中M代表輸入層到隱含層的連接權(quán)值,即編碼器的權(quán)值矩陣;奶代表隱含層??到輸出層的連接權(quán)值,即解碼器的權(quán)值矩陣;/(y)代表激活函數(shù),對隱含層的??出進行非線性激活,使模型具有非線性表達能力,一般使用sigmoid或者Tanh??激活函數(shù)。自編碼器通常使用均方差代價函數(shù),對代價函數(shù)加入不同的正則化限??制能夠生成不同類型的自編碼器。對編碼器加上稀疏性的限制,可以生成稀疏自??碼器,對訓練集的統(tǒng)計特性會有比較好的響應(yīng);對輸入加入噪聲干擾,然后計??算輸出和原始輸入的誤差,可以得到降噪自編碼器,能夠強制模型學習出訓練集??的分布信息,并對噪聲有一定抗干擾能力;對編碼器的梯度加以限制,使得輸入??小幅變化時編碼器權(quán)值基本保持不變,可以得到壓縮自編碼器。??對于分布較為簡單的訓練數(shù)據(jù)集,單層的自編碼器即可學習出有效的特征??
第2章相關(guān)研宄方法??沒有得到進一步發(fā)展。在2012年,卷積神經(jīng)網(wǎng)絡(luò)在ImageNet競賽中取得第一.??的成績,自此卷積神經(jīng)網(wǎng)絡(luò)在圖像識別領(lǐng)域取得了飛速發(fā)展。卷積神經(jīng)網(wǎng)絡(luò)一??包含三種基本操作:卷積,激活和池化。卷積是一種線性數(shù)學運算,圖2.4展??了輸入2D矩陣與卷積核進行卷積操作基本過程;激活操作通常選取非線性激??函數(shù),如sigmoid、tanh或ReLU等函數(shù),以提高模型的非線性表達能力;池??操作是將輸出中特定位置的值替換為該點特定范圍內(nèi)數(shù)值的數(shù)學統(tǒng)計值的過??。卷積操作利用了三個重要的思想來提高卷積神經(jīng)網(wǎng)絡(luò)的表達能力[34]:稀疏??Input???
本文編號:3377417
【文章來源】:中國科學技術(shù)大學安徽省 211工程院校 985工程院校
【文章頁數(shù)】:118 頁
【學位級別】:博士
【部分圖文】:
圖2.1神經(jīng)網(wǎng)絡(luò)示例??
隱含層中恢復原始輸入。為了有效地恢復原始數(shù)據(jù),并提取出有效的特征表達,??需要針對不同的應(yīng)用場景對代價函數(shù)加入相應(yīng)的正則化項。其中編碼和解碼的??程如下:??V?=?10^2:?+?6i??(2.10)??i?=?wjf(y)?+?b2??中M代表輸入層到隱含層的連接權(quán)值,即編碼器的權(quán)值矩陣;奶代表隱含層??到輸出層的連接權(quán)值,即解碼器的權(quán)值矩陣;/(y)代表激活函數(shù),對隱含層的??出進行非線性激活,使模型具有非線性表達能力,一般使用sigmoid或者Tanh??激活函數(shù)。自編碼器通常使用均方差代價函數(shù),對代價函數(shù)加入不同的正則化限??制能夠生成不同類型的自編碼器。對編碼器加上稀疏性的限制,可以生成稀疏自??碼器,對訓練集的統(tǒng)計特性會有比較好的響應(yīng);對輸入加入噪聲干擾,然后計??算輸出和原始輸入的誤差,可以得到降噪自編碼器,能夠強制模型學習出訓練集??的分布信息,并對噪聲有一定抗干擾能力;對編碼器的梯度加以限制,使得輸入??小幅變化時編碼器權(quán)值基本保持不變,可以得到壓縮自編碼器。??對于分布較為簡單的訓練數(shù)據(jù)集,單層的自編碼器即可學習出有效的特征??
第2章相關(guān)研宄方法??沒有得到進一步發(fā)展。在2012年,卷積神經(jīng)網(wǎng)絡(luò)在ImageNet競賽中取得第一.??的成績,自此卷積神經(jīng)網(wǎng)絡(luò)在圖像識別領(lǐng)域取得了飛速發(fā)展。卷積神經(jīng)網(wǎng)絡(luò)一??包含三種基本操作:卷積,激活和池化。卷積是一種線性數(shù)學運算,圖2.4展??了輸入2D矩陣與卷積核進行卷積操作基本過程;激活操作通常選取非線性激??函數(shù),如sigmoid、tanh或ReLU等函數(shù),以提高模型的非線性表達能力;池??操作是將輸出中特定位置的值替換為該點特定范圍內(nèi)數(shù)值的數(shù)學統(tǒng)計值的過??。卷積操作利用了三個重要的思想來提高卷積神經(jīng)網(wǎng)絡(luò)的表達能力[34]:稀疏??Input???
本文編號:3377417
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3377417.html
最近更新
教材專著