視頻人體行為識別中的特征編碼
本文關(guān)鍵詞:視頻人體行為識別中的特征編碼,由筆耕文化傳播整理發(fā)布。
【摘要】:識別視頻中的人體行為在計算機(jī)視覺領(lǐng)域逐漸引起了廣泛的關(guān)注,它的目標(biāo)是自動識別出未知的視頻或者圖像序列中人的行為。然而,如何有效快速地識別視頻中的行為仍然面臨諸多挑戰(zhàn),例如雜亂的背景,視角的改變,動作執(zhí)行者的外觀多樣性等等。這些挑戰(zhàn)導(dǎo)致了獲取干凈并且有區(qū)分能力的視頻表示異常困難。近年來,局部描述子聚合向量(VLAD)被提出,這是一種簡單同時也很高效的特征編碼方法,能夠獲得區(qū)分性較好的視頻表示。然而,在很多情況下,動態(tài)背景或者攝像機(jī)的移動會給視頻的特征提取帶來很大的噪聲,這種編碼方式會造成兩方面的問題,首先,將異常的視頻描述子也編碼到視頻表示中使得編碼速度以及編碼效果受影響;其次,沒有充分考慮描述子特征與視覺單詞的空間分布信息。本文針對視頻人體行為識別的特征編碼方法進(jìn)行了研究,主要貢獻(xiàn)和創(chuàng)新點如下:1.系統(tǒng)介紹了人體行為識別研究的一般流程,針對流程的每個部分,詳細(xì)介紹了涉及的理論知識。比較了常用的特征編碼方法,分析了各自的優(yōu)缺點。2.提出了一種改進(jìn)局部描述子聚合向量的方法,即不確定的局部描述子聚合向量(UVLAD),該方法針對每個描述子特征,充分考慮了噪聲以及它與視覺單詞的空間分布信息,采用字典里的若干個單詞來對它進(jìn)行編碼,或者丟棄它,提升了視頻特征編碼的性能。3.在KTH,Youtube和HMDB51數(shù)據(jù)集上的實驗,驗證了不確定的局部描述子聚合向量的有效性,同時行為識別準(zhǔn)確率超過了現(xiàn)有的最好的結(jié)果。
【關(guān)鍵詞】:特征編碼 行為識別 局部描述子聚合向量 描述子特征
【學(xué)位授予單位】:上海交通大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2015
【分類號】:TN919.81
【目錄】:
- 摘要3-4
- ABSTRACT4-10
- 主要符號對照表10-11
- 第一章 緒論11-21
- 1.1 研究背景11-13
- 1.2 國內(nèi)外研究現(xiàn)狀13-17
- 1.2.1 視頻預(yù)處理13-14
- 1.2.2 視頻特征的提取14
- 1.2.3 特征空間的字典學(xué)習(xí)和特征編碼14-15
- 1.2.4 分類器的設(shè)計15-17
- 1.3 面臨的困難17-18
- 1.4 本文的研究工作18-21
- 第二章 視頻人體行為識別的特征提取21-31
- 2.1 特征的分類21
- 2.2 全局特征21-23
- 2.2.1 基于輪廓的全局特征23
- 2.3 局部特征23-28
- 2.3.1 時空興趣點的檢測23-26
- 2.3.2 時空興趣點的描述26-28
- 2.4 本章小結(jié)28-31
- 第三章 視頻人體行為識別的特征編碼31-41
- 3.1 特征空間的字典學(xué)習(xí)31-33
- 3.1.1 K-均值聚類31
- 3.1.2 混合高斯模型31-32
- 3.1.3 隨機(jī)字典32-33
- 3.2 特征編碼33-39
- 3.2.1 基于投票的特征編碼33-34
- 3.2.2 基于重構(gòu)的特征編碼34-36
- 3.2.3 基于顯著度的特征編碼36-38
- 3.2.4 其他類特征編碼38-39
- 3.3 本章小結(jié)39-41
- 第四章 基于局部描述子聚合向量的改進(jìn)算法41-51
- 4.1 局部描述子聚合向量的原理41-45
- 4.1.1 原始的局部描述子聚合向量41
- 4.1.2 局部描述子聚合向量的幾種改進(jìn)41-45
- 4.2 不確定的局部描述子聚合向量的原理45-49
- 4.2.1 濾掉異常的描述子特征46
- 4.2.2 不確定的局部描述子聚合向量46-49
- 4.3 本章小結(jié)49-51
- 第五章 實驗結(jié)果與分析51-61
- 5.1 數(shù)據(jù)集51-52
- 5.2 實驗的設(shè)置52-54
- 5.2.1 視頻描述子特征的選擇52-53
- 5.2.2 算法參數(shù)的設(shè)置53
- 5.2.3 行為識別的評價標(biāo)準(zhǔn)53-54
- 5.3 實驗的結(jié)果54-58
- 5.3.1 最近鄰參數(shù)K的影響54
- 5.3.2 參數(shù) β 和 γ 的影響54-55
- 5.3.3 殘差聚合策略的影響55-56
- 5.3.4 VLAD和UVLAD的比較56
- 5.3.5 與當(dāng)前最好結(jié)果的比較56-58
- 5.4 本章小結(jié)58-61
- 第六章 總結(jié)和展望61-63
- 6.1 本文主要工作61-62
- 6.2 未來展望62-63
- 參考文獻(xiàn)63-69
- 致謝69-70
- 攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文目錄70-71
- 攻讀學(xué)位期間參與的項目71-73
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 吳磊,吳俊軍;基于特征編碼的三維可視化圈閱[J];華中科技大學(xué)學(xué)報;2001年12期
2 黃天羽;李鳳霞;戰(zhàn)守義;李祥晨;;一種基于幾何特征編碼的運動搜索[J];系統(tǒng)仿真學(xué)報;2006年10期
3 朱月香;TreeView控件的應(yīng)用[J];兵工自動化;2003年06期
4 皮德常,秦小麟,王寧生;多層分組疊加有限制特征編碼[J];小型微型計算機(jī)系統(tǒng);2001年05期
5 張敏,馬青,馬少平;自組織中文語義映射網(wǎng)絡(luò)的優(yōu)化特征編碼方法[J];中文信息學(xué)報;2003年03期
6 張一楠;高宏;張煒;;基于雙分支特征編碼的子圖查詢處理算法[J];計算機(jī)研究與發(fā)展;2011年S3期
7 張?zhí)毂?吳俊軍,張新訪,鐘毅芳,周濟(jì);并行工程下產(chǎn)品協(xié)調(diào)模型的研究[J];計算機(jī)輔助設(shè)計與圖形學(xué)學(xué)報;2000年10期
8 肖娟;郭美;肖敏;;基于特征編碼的指紋識別方法[J];湘南學(xué)院學(xué)報;2010年02期
9 徐建寧;劉來英;;基于特征編碼的拉深件CAPP信息模型[J];金屬成形工藝;1997年05期
10 方旺盛;舒明磊;;一種基于特征編碼的Word文檔數(shù)字水印算法[J];科技廣場;2006年01期
中國博士學(xué)位論文全文數(shù)據(jù)庫 前2條
1 彭小江;基于視頻的人體行為分析算法研究[D];西南交通大學(xué);2014年
2 高廣謂;基于特征編碼和回歸分析的指關(guān)節(jié)紋識別研究[D];南京理工大學(xué);2014年
中國碩士學(xué)位論文全文數(shù)據(jù)庫 前5條
1 王先中;視頻人體行為識別中的特征編碼[D];上海交通大學(xué);2015年
2 薛東彬;超硬材料工具CAD/CAPP集成系統(tǒng)關(guān)鍵技術(shù)研究[D];鄭州大學(xué);2008年
3 智慧;人類RNA聚合酶Ⅱ啟動子識別研究[D];同濟(jì)大學(xué);2008年
4 賀晨軒;基于多特征編碼的泛素化位點預(yù)測研究[D];東北師范大學(xué);2015年
5 黃磊;LCD微小瑕疵自動分類[D];上海交通大學(xué);2014年
本文關(guān)鍵詞:視頻人體行為識別中的特征編碼,,由筆耕文化傳播整理發(fā)布。
本文編號:396513
本文鏈接:http://sikaile.net/kejilunwen/wltx/396513.html