網(wǎng)絡視頻中特定圖像內(nèi)容識別技術研究
發(fā)布時間:2021-10-24 09:18
隨著互聯(lián)網(wǎng)快速發(fā)展,以互聯(lián)網(wǎng)作為載體的信息傳播速度越來越快、范圍越來越廣。不良違法分子,利用互聯(lián)網(wǎng)傳播快速的特點,大量的通過網(wǎng)絡社交媒體發(fā)布煽動性言論、圖片或視頻。暴恐視頻或圖像非法傳播已成為當前影響社會穩(wěn)定的毒源之一。如何阻斷不良信息通過互聯(lián)網(wǎng)的傳播,已經(jīng)成為當前研究的熱點。本文研究總結已有的不良信息阻斷方法,提出對用戶側的網(wǎng)絡視頻中的特定圖像內(nèi)容進行檢測。針對特定圖像內(nèi)容檢測,主要研究圖像中包含“持槍并保持射擊姿態(tài)的人”,本文的研究工作如下:分析現(xiàn)有的物體檢測方法并選擇Faster R-CNN作為槍支檢測模型,該模型在常規(guī)的基于卷積神經(jīng)網(wǎng)絡進行物體分類的基礎上,還可以給出被識別物體對應的位置信息,為后續(xù)人與槍支的交疊區(qū)域檢測提供依據(jù)。本文中共識別4種槍支類型,分別為:AK47、M16、92式、95式。收集原始數(shù)據(jù)后,通過旋轉增量技術,將每一類的槍支數(shù)據(jù)集擴展到約3600張。通過對使用不同的特征提取網(wǎng)絡的Faster R-CNN模型訓練后,記錄各個模型識別每一類別槍支的識別精度和記錄各個模型的mAP指標進行對比,確認使用ResNet-50網(wǎng)絡作為特征提取網(wǎng)絡時的檢測結果優(yōu)于使用其它兩...
【文章來源】:北方工業(yè)大學北京市
【文章頁數(shù)】:65 頁
【學位級別】:碩士
【部分圖文】:
圖2-3卷積神經(jīng)網(wǎng)絡的基本原理及訓練過程示意圖??通過不同的卷積層對數(shù)據(jù)進行卷積操作后,特征圖中包含一些有意義的特??
第二章基于快速區(qū)域卷積神經(jīng)網(wǎng)絡的槍支識別方法??激活函數(shù)包括:Logistic-Sigmoid?函數(shù),圖?2-4?(a)、Tanh-Sigmoid?函數(shù),圖?2-4??(b)、ReLU?函數(shù),圖?2-4?(c)、LeakyReLU?函數(shù),圖?2-4?(d)。??_j:??(a)?(b)??.....?1?..1?丨'.i—…1? ̄ ̄i? ̄y??(C)?(d)??圖2-4激活函數(shù)示意圖??(1)?Sigmoid?類函數(shù)??Logistic-Sigmoid函數(shù)和Tanh-Sigmoid函數(shù)作為早期神經(jīng)網(wǎng)絡研究時最早出??現(xiàn)的激活函數(shù)一直被沿用至今,其數(shù)學表達式如下:??/W?=點?(2-4)??tanh(^)?=?^—(2-5)??上述函數(shù)均具有軟飽和性,Logistic-Sigmoid函數(shù)的輸出范圍為(0,?1)、??Tanh-Sigmoid函數(shù)的輸出范圍是(-1,1)。文獻[42]中詳細的討論這兩個函數(shù)飽??和的特點及現(xiàn)象。在手寫體字符識別任務中,網(wǎng)絡的激活函數(shù)選擇Tanh-Sigmoid??函數(shù)的收斂速度更快,原因是Tanh-Sigmoid函數(shù)輸出的均值相比于??Logistic-Sigmoid更接近于0。當使用反向傳播算法訓練神經(jīng)網(wǎng)絡時,其計算的梯??度結果作為損失函數(shù)向后傳播,當CNN中包含多個卷積層時,其梯度值會趨于??0,這種現(xiàn)象稱作梯度消失/彌散現(xiàn)象,這會導致神經(jīng)元的權值無法被更新[42】。所??以這種函數(shù)在更深的卷積神經(jīng)網(wǎng)絡中逐漸的被淘汰。??(2)?ReLU?函數(shù)??ReLU函數(shù)又稱作線性修正單元,其數(shù)學表達式為:??f(x)?=?Max(0,x)?(2-6)??當ReLU
R-CNN)?[17],首次將物體檢測技術通過深度學習實現(xiàn)。該模型將PASCALVOC??2010數(shù)據(jù)集的平均精度值[17]從35.1%提升至53.7%。R-CNN可以看作??是機器視覺領域和深度學習領域的一次成功融合。該模型首先,使用訓練數(shù)據(jù)對??CNN網(wǎng)絡進行調優(yōu)(Fine-tuning);然后,使用選擇性搜索方法(Selective?Search)??[45]在原始圖像的每一幅圖片中標記出1000個?2000個被識別物體的候選框并將??候選框中的圖像內(nèi)容送到CNN模型進行識別,如圖2-5;最后通過分類器對候??選框中的內(nèi)容進行分類。??■?_=:綱?|??EteS*?figMf?(約a)?較侯選區(qū)腳認?分類絡?射溢臬??圖2-5?R-CNN網(wǎng)絡結構示意圖??13??
【參考文獻】:
期刊論文
[1]一種自適應加權HOG特征的人臉識別算法[J]. 胡麗喬,仇潤鶴. 計算機工程與應用. 2017(03)
[2]基于后驗HOG特征的多姿態(tài)行人檢測[J]. 劉威,段成偉,遇冰,柴麗穎,袁淮,趙宏. 電子學報. 2015(02)
[3]BP神經(jīng)網(wǎng)絡在軟件項目風險評估中的應用[J]. 李華,曹曉龍,成江榮. 計算機仿真. 2011(07)
[4]BP神經(jīng)網(wǎng)絡組合預測在城市生活垃圾產(chǎn)量預測中應用[J]. 路玉龍,韓靖,余思婧,張鴻雁. 環(huán)境科學與技術. 2010(05)
[5]基于URL過濾與內(nèi)容過濾的網(wǎng)絡凈化模型[J]. 李石君,李洲,余軍,張科. 計算機技術與發(fā)展. 2006(01)
[6]決策樹算法的研究及優(yōu)化[J]. 王靜紅,王熙照,邵艷華,王伍伶. 微機發(fā)展. 2004(09)
[7]基于分層高斯混合模型的半監(jiān)督學習算法[J]. 孫廣玲,唐降龍. 計算機研究與發(fā)展. 2004(01)
碩士論文
[1]基于深度學習的不良圖片過濾技術研究[D]. 楊源.北方工業(yè)大學 2018
[2]基于CNN的交通標志識別方法研究[D]. 楊振杰.天津工業(yè)大學 2017
[3]基于云計算的智能手機信息過濾系統(tǒng)[D]. 孫巧萍.南京郵電大學 2016
[4]基于內(nèi)容的網(wǎng)絡敏感圖像識別研究[D]. 耿震.北京工業(yè)大學 2016
[5]基于Kinect的自然人機交互系統(tǒng)的設計與實現(xiàn)[D]. 馬風力.浙江大學 2016
[6]基于Kinect的手勢識別技術在人機交互中的應用研究[D]. 陳一新.西南交通大學 2015
[7]基于卷積神經(jīng)網(wǎng)絡的交通標識識別研究與應用[D]. 楊心.大連理工大學 2014
[8]基于HOG特征的人臉識別系統(tǒng)研究[D]. 慕春雷.電子科技大學 2013
本文編號:3455018
【文章來源】:北方工業(yè)大學北京市
【文章頁數(shù)】:65 頁
【學位級別】:碩士
【部分圖文】:
圖2-3卷積神經(jīng)網(wǎng)絡的基本原理及訓練過程示意圖??通過不同的卷積層對數(shù)據(jù)進行卷積操作后,特征圖中包含一些有意義的特??
第二章基于快速區(qū)域卷積神經(jīng)網(wǎng)絡的槍支識別方法??激活函數(shù)包括:Logistic-Sigmoid?函數(shù),圖?2-4?(a)、Tanh-Sigmoid?函數(shù),圖?2-4??(b)、ReLU?函數(shù),圖?2-4?(c)、LeakyReLU?函數(shù),圖?2-4?(d)。??_j:??(a)?(b)??.....?1?..1?丨'.i—…1? ̄ ̄i? ̄y??(C)?(d)??圖2-4激活函數(shù)示意圖??(1)?Sigmoid?類函數(shù)??Logistic-Sigmoid函數(shù)和Tanh-Sigmoid函數(shù)作為早期神經(jīng)網(wǎng)絡研究時最早出??現(xiàn)的激活函數(shù)一直被沿用至今,其數(shù)學表達式如下:??/W?=點?(2-4)??tanh(^)?=?^—(2-5)??上述函數(shù)均具有軟飽和性,Logistic-Sigmoid函數(shù)的輸出范圍為(0,?1)、??Tanh-Sigmoid函數(shù)的輸出范圍是(-1,1)。文獻[42]中詳細的討論這兩個函數(shù)飽??和的特點及現(xiàn)象。在手寫體字符識別任務中,網(wǎng)絡的激活函數(shù)選擇Tanh-Sigmoid??函數(shù)的收斂速度更快,原因是Tanh-Sigmoid函數(shù)輸出的均值相比于??Logistic-Sigmoid更接近于0。當使用反向傳播算法訓練神經(jīng)網(wǎng)絡時,其計算的梯??度結果作為損失函數(shù)向后傳播,當CNN中包含多個卷積層時,其梯度值會趨于??0,這種現(xiàn)象稱作梯度消失/彌散現(xiàn)象,這會導致神經(jīng)元的權值無法被更新[42】。所??以這種函數(shù)在更深的卷積神經(jīng)網(wǎng)絡中逐漸的被淘汰。??(2)?ReLU?函數(shù)??ReLU函數(shù)又稱作線性修正單元,其數(shù)學表達式為:??f(x)?=?Max(0,x)?(2-6)??當ReLU
R-CNN)?[17],首次將物體檢測技術通過深度學習實現(xiàn)。該模型將PASCALVOC??2010數(shù)據(jù)集的平均精度值[17]從35.1%提升至53.7%。R-CNN可以看作??是機器視覺領域和深度學習領域的一次成功融合。該模型首先,使用訓練數(shù)據(jù)對??CNN網(wǎng)絡進行調優(yōu)(Fine-tuning);然后,使用選擇性搜索方法(Selective?Search)??[45]在原始圖像的每一幅圖片中標記出1000個?2000個被識別物體的候選框并將??候選框中的圖像內(nèi)容送到CNN模型進行識別,如圖2-5;最后通過分類器對候??選框中的內(nèi)容進行分類。??■?_=:綱?|??EteS*?figMf?(約a)?較侯選區(qū)腳認?分類絡?射溢臬??圖2-5?R-CNN網(wǎng)絡結構示意圖??13??
【參考文獻】:
期刊論文
[1]一種自適應加權HOG特征的人臉識別算法[J]. 胡麗喬,仇潤鶴. 計算機工程與應用. 2017(03)
[2]基于后驗HOG特征的多姿態(tài)行人檢測[J]. 劉威,段成偉,遇冰,柴麗穎,袁淮,趙宏. 電子學報. 2015(02)
[3]BP神經(jīng)網(wǎng)絡在軟件項目風險評估中的應用[J]. 李華,曹曉龍,成江榮. 計算機仿真. 2011(07)
[4]BP神經(jīng)網(wǎng)絡組合預測在城市生活垃圾產(chǎn)量預測中應用[J]. 路玉龍,韓靖,余思婧,張鴻雁. 環(huán)境科學與技術. 2010(05)
[5]基于URL過濾與內(nèi)容過濾的網(wǎng)絡凈化模型[J]. 李石君,李洲,余軍,張科. 計算機技術與發(fā)展. 2006(01)
[6]決策樹算法的研究及優(yōu)化[J]. 王靜紅,王熙照,邵艷華,王伍伶. 微機發(fā)展. 2004(09)
[7]基于分層高斯混合模型的半監(jiān)督學習算法[J]. 孫廣玲,唐降龍. 計算機研究與發(fā)展. 2004(01)
碩士論文
[1]基于深度學習的不良圖片過濾技術研究[D]. 楊源.北方工業(yè)大學 2018
[2]基于CNN的交通標志識別方法研究[D]. 楊振杰.天津工業(yè)大學 2017
[3]基于云計算的智能手機信息過濾系統(tǒng)[D]. 孫巧萍.南京郵電大學 2016
[4]基于內(nèi)容的網(wǎng)絡敏感圖像識別研究[D]. 耿震.北京工業(yè)大學 2016
[5]基于Kinect的自然人機交互系統(tǒng)的設計與實現(xiàn)[D]. 馬風力.浙江大學 2016
[6]基于Kinect的手勢識別技術在人機交互中的應用研究[D]. 陳一新.西南交通大學 2015
[7]基于卷積神經(jīng)網(wǎng)絡的交通標識識別研究與應用[D]. 楊心.大連理工大學 2014
[8]基于HOG特征的人臉識別系統(tǒng)研究[D]. 慕春雷.電子科技大學 2013
本文編號:3455018
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3455018.html
最近更新
教材專著