天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

協(xié)同目標分割與識別的研究

發(fā)布時間:2025-01-14 00:18
  人類能夠輕松地完成對視野中目標物體的解析,比如將目標分割出來并進行識別;但對于計算機,圖像分割仍是一個具有挑戰(zhàn)性的任務。一個重要原因是,計算機視覺模型在進行圖像分割時往往只基于底層的圖像數(shù)據(jù),而很少涉及到有關于待分割目標的具體知識。事實上,無論對人類還是對計算機,目標分割與目標識別這兩個任務是密切相關的:對目標的認識和有關目標的知識能夠指導分割模型獲得更精確的結果;反之,由于沒有背景干擾,更精確的分割結果也可以提升目標識別的效果。這兩個任務形成了一個“雞生蛋-蛋生雞”的問題。在分析了國內(nèi)外相關研究領域的基礎上,本論文重點研究如何在目標分割任務中引入來自目標識別任務的信息,實現(xiàn)兩個任務的協(xié)同。本文的主要研究內(nèi)容和貢獻在于:1.基于對人類視覺認知機制的模仿,我們提出了一個協(xié)同目標分割與識別任務框架,其中兩個任務相互交流和促進;谶@一框架,我們以變分分割為基礎,以玻爾茲曼機(RBM)為核心實現(xiàn)了一個協(xié)同任務模型,其中目標被表達為兩個方面:形狀和外觀。形狀用于表達目標的整體結構,而外觀用于表達形狀內(nèi)的顏色、紋理等信息。RBM的判別功能和生成功能都被應用到協(xié)同任務中。前者用于提取目標形狀的特征并...

【文章頁數(shù)】:136 頁

【學位級別】:博士

【部分圖文】:

圖1.2人類的視覺認知機制

圖1.2人類的視覺認知機制

浙江大學博士學位論文1緒論圖1.2人類的視覺認知機制。人類能夠?qū)⒛繕藦膹碗s環(huán)境和背景中分離提取出來,依賴的是人類具有目標的一些先驗知識。這些知識來自于更高層的任務,如識別/分類。它們能夠在分割過程中提供對目標的整體認識,并且對分割過程產(chǎn)生經(jīng)驗性的指導和約束。對目標進行識別;2.從....


圖1.4相比形狀信息,深度學習模型在進行識別任務時更加依賴于紋理信息

圖1.4相比形狀信息,深度學習模型在進行識別任務時更加依賴于紋理信息

浙江大學博士學位論文1緒論圖1.4相比形狀信息,深度學習模型在進行識別任務時更加依賴于紋理信息。從左至右:象皮紋理圖像;普通的貓圖像;象皮紋理化的貓圖像。模型會以大概率認為第三幅圖像是大象,而非貓[9]綜合這些要素,在接下來的幾節(jié)里,我們將首先從與協(xié)同任務存在一定相關性相似性的任....


圖1.5Chenetal.[33]使用RBM對形狀進行特征提取和重建

圖1.5Chenetal.[33]使用RBM對形狀進行特征提取和重建

浙江大學博士學位論文1緒論圖1.5Chenetal.[33]使用RBM對形狀進行特征提取和重建。算,都可能需要逐一計算當前結果q和各先驗形狀qi之間的相似度或距離,或者將所有先驗形狀納入到能量函數(shù)中進行考察。從人類視覺認知的角度而言,這一過程是非常不可思議的:人類不會將當前見到的....


圖1.6FCN將全連接層轉(zhuǎn)化為了全卷積層用于語義分割任務[48]

圖1.6FCN將全連接層轉(zhuǎn)化為了全卷積層用于語義分割任務[48]

浙江大學博士學位論文1緒論圖1.6FCN將全連接層轉(zhuǎn)化為了全卷積層用于語義分割任務[48]其中g(i,j)可以使用兩個像素點之間的圖像值關系、位置關系等,往往根據(jù)具體任務進行設計和調(diào)整,如基于鄰域像素點顏色差異的邊界特征[46]g(i,j)=θp+θvexp(θβ||IiIj||....



本文編號:4026122

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/4026122.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶40c70***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com