天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于深度學(xué)習(xí)的視頻語義分割算法研究

發(fā)布時(shí)間:2021-12-17 21:07
  隨著科技的不斷發(fā)展,計(jì)算機(jī)視覺逐漸成為人工智能領(lǐng)域重要的研究分支。在計(jì)算機(jī)視覺研究中,基于圖像的語義分割問題研究較為普遍。相對圖像而言,視頻中蘊(yùn)含更加重要的時(shí)空關(guān)聯(lián)信息。視頻語義分割旨在處理連續(xù)的視頻序列,利用視頻幀間關(guān)系進(jìn)行精準(zhǔn)分割,在智能監(jiān)控、汽車自動駕駛、移動端設(shè)備開發(fā)領(lǐng)域具有重要的應(yīng)用價(jià)值。該文針對視頻語義分割中存在的分割精度不足、模型尺寸過大問題展開研究。首先,考慮到圖像中小物體分割困難、物體邊緣分割不準(zhǔn)確問題,提出了基于多尺度的視頻語義分割算法。該算法基于全卷積神經(jīng)網(wǎng)絡(luò)模型(fully-convolutional neural network,FCN),以視覺幾何組網(wǎng)絡(luò)(Visual Geometry Group Network,VGG)深度卷積網(wǎng)絡(luò)為基礎(chǔ),采用半監(jiān)督的方式實(shí)現(xiàn)圖像內(nèi)前景和背景的分離,達(dá)到持續(xù)傳遞語義信息的目的。算法的關(guān)鍵是結(jié)合了在線訓(xùn)練與離線訓(xùn)練來提升模型的總體分割精度。在線訓(xùn)練階段,給定視頻序列第一幀的圖像和標(biāo)簽,對其進(jìn)行微調(diào)訓(xùn)練。針對視頻序列的幀間關(guān)系,對網(wǎng)絡(luò)的輸入新加入額外的掩膜通道,模擬幀和幀之間物體運(yùn)動的軌跡信息。針對卷積網(wǎng)絡(luò)下采樣丟失精度的問題... 

【文章來源】:燕山大學(xué)河北省

【文章頁數(shù)】:61 頁

【學(xué)位級別】:碩士

【部分圖文】:

基于深度學(xué)習(xí)的視頻語義分割算法研究


多維卷積操作運(yùn)算圖

特征圖,超參數(shù),步長,卷積


pooling)作為卷積神經(jīng)網(wǎng)絡(luò)的一大特性,在卷積運(yùn)算的過程中起作又叫下采樣(down sampling),其主要作用為增大特征的感受全局信息。池化可減小特征圖的大小,使得計(jì)算量減小,但像像素的精度。即使池化在卷積操作中起著重要的作用,但丟失。所以越來越多的方法被提出,目的就是取代卷積網(wǎng)絡(luò)分割領(lǐng)域,已經(jīng)出現(xiàn)了一種可行的方法:空洞卷積(dilated co代池化操作在卷積網(wǎng)絡(luò)中的作用,在不降低特征感受野的同度,相關(guān)理論我們在后面會介紹。用最多的池化方法為最大池化(max-pooling)和平均池化(mea對前一層得到的特征圖進(jìn)行縮小,由當(dāng)前小區(qū)域內(nèi)的最大值平均池化與最大池化的不同處在于其選取的是小區(qū)域內(nèi)均值者的具體操作如圖 2-2 所示:

示意圖,前向,示意圖,卷積


神經(jīng)網(wǎng)絡(luò)的優(yōu)化訓(xùn)練一個(gè)好的模型需要大量的超參數(shù)和參數(shù),來擬合數(shù)據(jù)集達(dá)到較高的精卷積網(wǎng)絡(luò)的過程中,有幾個(gè)比較重要的操作,例如:前向傳播與反向傳播化器、權(quán)值的歸一化操作等等。1 前向傳播與損失函數(shù)前向傳播(forward propagation)是網(wǎng)絡(luò)經(jīng)過計(jì)算,最終得到一個(gè)預(yù)測的結(jié)果網(wǎng)絡(luò)的支撐骨架。前向傳播的計(jì)算需要三部分信息。第一個(gè)是 input 輸入體圖像中提取的特征向量。第二部分就是神經(jīng)元或者卷積層之間的連接結(jié)中逐層卷積層和池化層構(gòu)成了網(wǎng)絡(luò)的結(jié)構(gòu)。最后,網(wǎng)絡(luò)中的參數(shù)是前向傳的部分,也是整個(gè)卷積網(wǎng)絡(luò)最重要的部分。網(wǎng)絡(luò)的輸入經(jīng)過與層間權(quán)值參池化計(jì)算,不斷得到每一層的輸出,最終得到一個(gè)預(yù)測的 y 值。前向傳播程可以由圖 2-3 簡單的表示。

【參考文獻(xiàn)】:
期刊論文
[1]一種基于多字典學(xué)習(xí)的圖像分割模糊方法[J]. 李亞峰.  電子學(xué)報(bào). 2018(07)
[2]基于彩色圖像分割的飛機(jī)機(jī)頭定位方法[J]. 王平,洪向共,楊華,邱文華,白俊杰.  中國圖象圖形學(xué)報(bào). 2006(11)



本文編號:3540943

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3540943.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶50fd3***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com