面向視頻監(jiān)控場(chǎng)景的目標(biāo)空間結(jié)構(gòu)語(yǔ)義感知
發(fā)布時(shí)間:2021-07-09 01:18
視頻監(jiān)控系統(tǒng)在國(guó)家安全、社會(huì)公共安全等領(lǐng)域中扮演著重要的角色。近些年來(lái),隨著計(jì)算機(jī)技術(shù)和視頻監(jiān)控技術(shù)的發(fā)展,監(jiān)控視頻數(shù)據(jù)呈指數(shù)級(jí)爆炸式增長(zhǎng)。然而,視頻內(nèi)容的無(wú)結(jié)構(gòu)性質(zhì)是阻礙視頻監(jiān)控系統(tǒng)大規(guī)模應(yīng)用的瓶頸問(wèn)題。如何有效地從海量的監(jiān)控視頻數(shù)據(jù)中提取有價(jià)值的信息,并且進(jìn)行準(zhǔn)確地結(jié)構(gòu)化表達(dá)和存儲(chǔ),是目前智能視頻監(jiān)控系統(tǒng)亟待解決的關(guān)鍵問(wèn)題。視頻內(nèi)容結(jié)構(gòu)化的核心問(wèn)題是全方位、細(xì)粒度地識(shí)別和捕捉目標(biāo)各個(gè)成分的信息和它們之間的關(guān)聯(lián),從而輔佐計(jì)算機(jī)完成對(duì)監(jiān)控視頻內(nèi)容的有效理解和組織。針對(duì)這個(gè)核心問(wèn)題,論文深入挖掘監(jiān)控視頻目標(biāo)圖像固有的空間結(jié)構(gòu)信息,并且進(jìn)行結(jié)構(gòu)關(guān)聯(lián),提出了一個(gè)“空間結(jié)構(gòu)語(yǔ)義感知”的研究框架。在這個(gè)研究框架下,論文針對(duì)監(jiān)控視頻的熱點(diǎn)問(wèn)題對(duì)智能視頻監(jiān)控目標(biāo)理解的相關(guān)技術(shù)進(jìn)行了系統(tǒng)性的研究,提出了有效且實(shí)用的算法,并通過(guò)實(shí)驗(yàn)驗(yàn)證了這些算法的有效性。論文的主要工作和貢獻(xiàn)包括以下幾個(gè)方面:1.系統(tǒng)性地研究了視頻監(jiān)控中多目標(biāo)姿態(tài)估計(jì)問(wèn)題,指出要解決監(jiān)控系統(tǒng)中常見(jiàn)的姿態(tài)多樣、人群密集等難點(diǎn)問(wèn)題的核心在于充分捕捉主體目標(biāo)的全局姿態(tài)和局部上下文結(jié)構(gòu)的關(guān)聯(lián),本文從低中高層結(jié)構(gòu)感知和關(guān)聯(lián)出發(fā)提出了任務(wù)特異的多尺...
【文章來(lái)源】:浙江大學(xué)浙江省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:106 頁(yè)
【學(xué)位級(jí)別】:博士
【部分圖文】:
圖1-1結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)(圖像取自DukeMTMC-relD數(shù)據(jù)集⑴)比較,以及非結(jié)構(gòu)化??數(shù)據(jù)的空間結(jié)構(gòu)化表達(dá)??
展了目標(biāo)行人重識(shí)別的研究;(3)為同時(shí)處理真實(shí)監(jiān)控場(chǎng)景下的目標(biāo)發(fā)現(xiàn)、表達(dá)和搜索問(wèn)??題,開(kāi)展了高效的行人搜索的研究。上述三項(xiàng)研究?jī)?nèi)容與智能視頻監(jiān)控的關(guān)鍵問(wèn)題、本論??文解決的科學(xué)問(wèn)題之間的對(duì)應(yīng)關(guān)系如圖1-6所示。在本論文中,監(jiān)控視頻首先通過(guò)目標(biāo)檢測(cè)??的方法對(duì)視頻中的主體目標(biāo)進(jìn)行發(fā)現(xiàn),然后對(duì)主體目標(biāo)建立空間結(jié)構(gòu)語(yǔ)義感知的分析和檢??索模型,通過(guò)公開(kāi)數(shù)據(jù)集對(duì)模型進(jìn)行訓(xùn)練、評(píng)估。多人姿態(tài)估計(jì)的目的是預(yù)測(cè)給定場(chǎng)景中??每一個(gè)目標(biāo)人物的姿態(tài),它在后續(xù)分析監(jiān)控中目標(biāo)的動(dòng)作、狀態(tài),關(guān)聯(lián)目標(biāo)間關(guān)系有著重??要的應(yīng)用;行人重識(shí)別技術(shù)是在對(duì)監(jiān)控中每一個(gè)目標(biāo)主體進(jìn)行建模和特征提取之后,在不??同攝像頭視角下匹配和關(guān)聯(lián)相同身份的人物,它在查找可疑人員、跟蹤特定人物的行動(dòng)軌??跡中扮演著重要的角色;在此基礎(chǔ)上,行人搜索更加貼近于實(shí)際場(chǎng)景,不僅需要考慮目標(biāo)??圖片的匹配問(wèn)題,還需要考慮到行人檢測(cè)對(duì)系統(tǒng)的整體影響,在算法有效性的基礎(chǔ)上同時(shí)??7??
圖2-1不同卷積結(jié)構(gòu)的演變??特征表達(dá)方法。在目標(biāo)圖像分析的過(guò)程中,往往會(huì)遇到目標(biāo)尺度不一致、姿態(tài)多變的現(xiàn)象。??為了加深模型對(duì)于圖像的識(shí)別能力,在原有卷積結(jié)構(gòu)的基礎(chǔ)上(如圖2-1?(a)所示),研究??人員探索了不同卷積結(jié)構(gòu)的變種,以捕捉目標(biāo)圖片的多尺度結(jié)構(gòu)信息。其中,較為著名的??卷積結(jié)構(gòu)包括Inception結(jié)構(gòu)171?(圖2-1?(b))、帶孔卷積結(jié)構(gòu)159】(圖2-1?(c))以及它們的各??種變體[64^1。其中,Inception結(jié)構(gòu)通過(guò)多尺度的卷積核捕捉不同窗口下的特征信息,帶孔??卷積結(jié)構(gòu)使用隔像素卷積的方式,在計(jì)算量不變的情況下獲取更大范圍的特征信息。目前,??越來(lái)越多的任務(wù)需要對(duì)圖像的本身內(nèi)容進(jìn)行更加細(xì)粒度的理解和識(shí)別,多尺度特征往往會(huì)??增強(qiáng)模型的魯棒性和表達(dá)能力。??從“黑盒”到“透明”的趨勢(shì)。為了增加模型的可解釋性,同時(shí)方便在模型訓(xùn)練中發(fā)現(xiàn)??相應(yīng)規(guī)律并對(duì)模型進(jìn)行進(jìn)一步優(yōu)化與調(diào)試,研究人員通過(guò)引入“注意力機(jī)制”,增加模型的??透明度。注意力機(jī)制1671通過(guò)自適應(yīng)地選擇任務(wù)關(guān)注區(qū)域位置的方法來(lái)訓(xùn)練網(wǎng)絡(luò),例如,在??圖像標(biāo)注任務(wù)中
本文編號(hào):3272714
【文章來(lái)源】:浙江大學(xué)浙江省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:106 頁(yè)
【學(xué)位級(jí)別】:博士
【部分圖文】:
圖1-1結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)(圖像取自DukeMTMC-relD數(shù)據(jù)集⑴)比較,以及非結(jié)構(gòu)化??數(shù)據(jù)的空間結(jié)構(gòu)化表達(dá)??
展了目標(biāo)行人重識(shí)別的研究;(3)為同時(shí)處理真實(shí)監(jiān)控場(chǎng)景下的目標(biāo)發(fā)現(xiàn)、表達(dá)和搜索問(wèn)??題,開(kāi)展了高效的行人搜索的研究。上述三項(xiàng)研究?jī)?nèi)容與智能視頻監(jiān)控的關(guān)鍵問(wèn)題、本論??文解決的科學(xué)問(wèn)題之間的對(duì)應(yīng)關(guān)系如圖1-6所示。在本論文中,監(jiān)控視頻首先通過(guò)目標(biāo)檢測(cè)??的方法對(duì)視頻中的主體目標(biāo)進(jìn)行發(fā)現(xiàn),然后對(duì)主體目標(biāo)建立空間結(jié)構(gòu)語(yǔ)義感知的分析和檢??索模型,通過(guò)公開(kāi)數(shù)據(jù)集對(duì)模型進(jìn)行訓(xùn)練、評(píng)估。多人姿態(tài)估計(jì)的目的是預(yù)測(cè)給定場(chǎng)景中??每一個(gè)目標(biāo)人物的姿態(tài),它在后續(xù)分析監(jiān)控中目標(biāo)的動(dòng)作、狀態(tài),關(guān)聯(lián)目標(biāo)間關(guān)系有著重??要的應(yīng)用;行人重識(shí)別技術(shù)是在對(duì)監(jiān)控中每一個(gè)目標(biāo)主體進(jìn)行建模和特征提取之后,在不??同攝像頭視角下匹配和關(guān)聯(lián)相同身份的人物,它在查找可疑人員、跟蹤特定人物的行動(dòng)軌??跡中扮演著重要的角色;在此基礎(chǔ)上,行人搜索更加貼近于實(shí)際場(chǎng)景,不僅需要考慮目標(biāo)??圖片的匹配問(wèn)題,還需要考慮到行人檢測(cè)對(duì)系統(tǒng)的整體影響,在算法有效性的基礎(chǔ)上同時(shí)??7??
圖2-1不同卷積結(jié)構(gòu)的演變??特征表達(dá)方法。在目標(biāo)圖像分析的過(guò)程中,往往會(huì)遇到目標(biāo)尺度不一致、姿態(tài)多變的現(xiàn)象。??為了加深模型對(duì)于圖像的識(shí)別能力,在原有卷積結(jié)構(gòu)的基礎(chǔ)上(如圖2-1?(a)所示),研究??人員探索了不同卷積結(jié)構(gòu)的變種,以捕捉目標(biāo)圖片的多尺度結(jié)構(gòu)信息。其中,較為著名的??卷積結(jié)構(gòu)包括Inception結(jié)構(gòu)171?(圖2-1?(b))、帶孔卷積結(jié)構(gòu)159】(圖2-1?(c))以及它們的各??種變體[64^1。其中,Inception結(jié)構(gòu)通過(guò)多尺度的卷積核捕捉不同窗口下的特征信息,帶孔??卷積結(jié)構(gòu)使用隔像素卷積的方式,在計(jì)算量不變的情況下獲取更大范圍的特征信息。目前,??越來(lái)越多的任務(wù)需要對(duì)圖像的本身內(nèi)容進(jìn)行更加細(xì)粒度的理解和識(shí)別,多尺度特征往往會(huì)??增強(qiáng)模型的魯棒性和表達(dá)能力。??從“黑盒”到“透明”的趨勢(shì)。為了增加模型的可解釋性,同時(shí)方便在模型訓(xùn)練中發(fā)現(xiàn)??相應(yīng)規(guī)律并對(duì)模型進(jìn)行進(jìn)一步優(yōu)化與調(diào)試,研究人員通過(guò)引入“注意力機(jī)制”,增加模型的??透明度。注意力機(jī)制1671通過(guò)自適應(yīng)地選擇任務(wù)關(guān)注區(qū)域位置的方法來(lái)訓(xùn)練網(wǎng)絡(luò),例如,在??圖像標(biāo)注任務(wù)中
本文編號(hào):3272714
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/3272714.html
最近更新
教材專(zhuān)著