基于語義分割的行人屬性識別技術的研究與實現(xiàn)
【文章頁數(shù)】:68 頁
【學位級別】:碩士
【部分圖文】:
圖2.2注意力模型網(wǎng)絡拓撲
上部分模型由三個1*1的卷積構成(每一個卷積都帶有batch?normalization??和ReLU層),最后的輸出為1*1*C?(C為屬性的個數(shù))。文中將該輸出稱作屬??性注意力映射w,之后忒,w進行一個空間softmax運算,這步運算使得模型將??資源集中于圖片中最相關的區(qū)....
圖3-1全卷積網(wǎng)絡實現(xiàn)圖??將全連接層變?yōu)槿矸e層一定程度上提升了運算效率
北京郵電大學工學碩士學位論文的創(chuàng)新:(1)將原始網(wǎng)絡中最后幾層全連接層全部變成了卷躍結構,進一步提升了識別準確率。??層??卷積神經(jīng)網(wǎng)絡包括AlexNet、VGG等網(wǎng)絡,這些網(wǎng)絡對于圖的要求,這是因為卷積神經(jīng)網(wǎng)絡在判斷圖片物體類型時,需幾層全連接層,以達到最后一層是一個大小為分類....
圖3-3?deep】abv3+模型框架圖??1)?Atrous?convolution?原理??
%?2x?conv?7??圖3-2?FCN跳躍結構??圖中將C〇nv7使用二進制插值法進行二倍的上采樣,之后與P〇〇14的特征矩??陣進行融合,FCN稱這種結構為16s。同理,FCN將conv7和pool4的特征分別??使用二進制插值法做4倍和2倍的上采樣,將結果與pool3進行....
圖3-2?FCN跳躍結構??圖中將C〇nv7使用二進制插值法進行二倍的上采樣,之后與P〇〇14的特征矩??
基于?Atrous?convolution?的?Atrous?Spatial?Pyramid?Pooling?(ASPP)。在此基礎上,??為了提升運算效率,deeplabv3+米取了?encoder-decoder結構,并且將Xception模??型加入到encoder結構中。....
本文編號:3908241
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3908241.html