基于正交語義特征分解的行人檢索研究
發(fā)布時間:2021-08-28 11:36
隨著社會安全意識的提升和多媒體技術的發(fā)展,監(jiān)控設備被廣泛布設于人們的生產生活中。但是僅依靠人力分析大量的視頻數據無法達到高精度、實時性的安全保障。所以為監(jiān)控視頻設計智能分析算法具有非常重要的研究意義。本文著重研究監(jiān)控視頻智能化的行人檢測方法和行人重識別方法,基于卷積神經網絡,提出端到端的行人檢索融合模型。對于行人重識別問題,身份特征和與身份無關的特征高度耦合,導致模型在訓練過程中被無關信息干擾,影響識別準確率。本文提出行人語義特征模型,并在深度特征圖上使用施密特正交化特征分解技術,將身份特征與身份無關特征分離,對解耦合的身份特征分別使用表征學習策略和度量學習策略訓練。實驗證明在深度網絡中的特征分離有效地提高了行人重識別模型的識別準確率。為實現端到端的行人檢索模型,本文令YOLO-v3目標檢測模型與改進的行人重識別模型共享特征提取網絡。共享的特征提取網絡會導致檢測模型和重識別模型互相干擾,影響檢測和識別的準確率。本文將深度語義特征模型引入共享特征提取網絡,設計任務分離層。實驗證明,任務分離層有效地分離了行人的共性特征和個性特征,解決了互相干擾的矛盾。
【文章來源】:大連海事大學遼寧省 211工程院校
【文章頁數】:72 頁
【學位級別】:碩士
【部分圖文】:
圖1.2本文研究流程??Fig.?1.2?Research?Process??
?大連海事大學專業(yè)學位碩士學位論文???2特征提取網絡??目前主流的目標檢測模型和行人重識別模型都基于卷積神經網絡。卷積神經網絡的??主要功能是提取輸入圖像的深度語義特征,不同的視覺任務模型釆用不同的方法處理該??深度語義特征。本文將目標檢測和行人重識別中使用的神經網絡統(tǒng)一看作特征提取網??絡,將深度語義特征的提取作為圖像的預處理來研究。??2.1輸入圖像預處理??卷積神經網絡可以一次性處理多個輸入圖像,通常稱網絡的輸入為批數據??(minibatch)。批數據是經過預處理后的四維張瑣,大小形式為(TV?x?C?x?//?x?IV)。??其中iV表示網絡一次處理iV張圖像;C表示輸入圖像的通道數,通常輸入圖像是RGB??格式的彩色圖像,所以C?=?3;?//和分別代表輸入圖像的高和寬。??為了實現成批次地處理,通常對iV張輸入圖像進行如下的預處理:??⑴隨機裁剪(random?crop)??i=iii??圖2.1隨機裁剪示意圖??Fig.?2.1?Random?Crop??如圖2.1,按一定的概率隨機從原始圖像中截取一張子圖作為網絡的輸入圖片。隨機??截取使輸入圖像僅保留原始圖像的局部區(qū)域,在模型的訓練過程中,弱化數據的噪聲,??豐富訓練數據的數fi,防止過擬合現象的發(fā)生,增加了模型的穩(wěn)定性。??n??圖2.2隨機水平翻轉示意圖??Fig.?2.2?Random?Horizontal?Flip??-7?-??
?大連海事大學專業(yè)學位碩士學位論文???2特征提取網絡??目前主流的目標檢測模型和行人重識別模型都基于卷積神經網絡。卷積神經網絡的??主要功能是提取輸入圖像的深度語義特征,不同的視覺任務模型釆用不同的方法處理該??深度語義特征。本文將目標檢測和行人重識別中使用的神經網絡統(tǒng)一看作特征提取網??絡,將深度語義特征的提取作為圖像的預處理來研究。??2.1輸入圖像預處理??卷積神經網絡可以一次性處理多個輸入圖像,通常稱網絡的輸入為批數據??(minibatch)。批數據是經過預處理后的四維張瑣,大小形式為(TV?x?C?x?//?x?IV)。??其中iV表示網絡一次處理iV張圖像;C表示輸入圖像的通道數,通常輸入圖像是RGB??格式的彩色圖像,所以C?=?3;?//和分別代表輸入圖像的高和寬。??為了實現成批次地處理,通常對iV張輸入圖像進行如下的預處理:??⑴隨機裁剪(random?crop)??i=iii??圖2.1隨機裁剪示意圖??Fig.?2.1?Random?Crop??如圖2.1,按一定的概率隨機從原始圖像中截取一張子圖作為網絡的輸入圖片。隨機??截取使輸入圖像僅保留原始圖像的局部區(qū)域,在模型的訓練過程中,弱化數據的噪聲,??豐富訓練數據的數fi,防止過擬合現象的發(fā)生,增加了模型的穩(wěn)定性。??n??圖2.2隨機水平翻轉示意圖??Fig.?2.2?Random?Horizontal?Flip??-7?-??
本文編號:3368440
【文章來源】:大連海事大學遼寧省 211工程院校
【文章頁數】:72 頁
【學位級別】:碩士
【部分圖文】:
圖1.2本文研究流程??Fig.?1.2?Research?Process??
?大連海事大學專業(yè)學位碩士學位論文???2特征提取網絡??目前主流的目標檢測模型和行人重識別模型都基于卷積神經網絡。卷積神經網絡的??主要功能是提取輸入圖像的深度語義特征,不同的視覺任務模型釆用不同的方法處理該??深度語義特征。本文將目標檢測和行人重識別中使用的神經網絡統(tǒng)一看作特征提取網??絡,將深度語義特征的提取作為圖像的預處理來研究。??2.1輸入圖像預處理??卷積神經網絡可以一次性處理多個輸入圖像,通常稱網絡的輸入為批數據??(minibatch)。批數據是經過預處理后的四維張瑣,大小形式為(TV?x?C?x?//?x?IV)。??其中iV表示網絡一次處理iV張圖像;C表示輸入圖像的通道數,通常輸入圖像是RGB??格式的彩色圖像,所以C?=?3;?//和分別代表輸入圖像的高和寬。??為了實現成批次地處理,通常對iV張輸入圖像進行如下的預處理:??⑴隨機裁剪(random?crop)??i=iii??圖2.1隨機裁剪示意圖??Fig.?2.1?Random?Crop??如圖2.1,按一定的概率隨機從原始圖像中截取一張子圖作為網絡的輸入圖片。隨機??截取使輸入圖像僅保留原始圖像的局部區(qū)域,在模型的訓練過程中,弱化數據的噪聲,??豐富訓練數據的數fi,防止過擬合現象的發(fā)生,增加了模型的穩(wěn)定性。??n??圖2.2隨機水平翻轉示意圖??Fig.?2.2?Random?Horizontal?Flip??-7?-??
?大連海事大學專業(yè)學位碩士學位論文???2特征提取網絡??目前主流的目標檢測模型和行人重識別模型都基于卷積神經網絡。卷積神經網絡的??主要功能是提取輸入圖像的深度語義特征,不同的視覺任務模型釆用不同的方法處理該??深度語義特征。本文將目標檢測和行人重識別中使用的神經網絡統(tǒng)一看作特征提取網??絡,將深度語義特征的提取作為圖像的預處理來研究。??2.1輸入圖像預處理??卷積神經網絡可以一次性處理多個輸入圖像,通常稱網絡的輸入為批數據??(minibatch)。批數據是經過預處理后的四維張瑣,大小形式為(TV?x?C?x?//?x?IV)。??其中iV表示網絡一次處理iV張圖像;C表示輸入圖像的通道數,通常輸入圖像是RGB??格式的彩色圖像,所以C?=?3;?//和分別代表輸入圖像的高和寬。??為了實現成批次地處理,通常對iV張輸入圖像進行如下的預處理:??⑴隨機裁剪(random?crop)??i=iii??圖2.1隨機裁剪示意圖??Fig.?2.1?Random?Crop??如圖2.1,按一定的概率隨機從原始圖像中截取一張子圖作為網絡的輸入圖片。隨機??截取使輸入圖像僅保留原始圖像的局部區(qū)域,在模型的訓練過程中,弱化數據的噪聲,??豐富訓練數據的數fi,防止過擬合現象的發(fā)生,增加了模型的穩(wěn)定性。??n??圖2.2隨機水平翻轉示意圖??Fig.?2.2?Random?Horizontal?Flip??-7?-??
本文編號:3368440
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3368440.html
最近更新
教材專著