行為特征融合的視覺注意力檢測技術研究
發(fā)布時間:2023-05-21 19:54
基于視覺的注意力簡稱為視覺注意力(Visual Focus of Attention,VFOA),特指視覺關注方向和焦點,主要融合頭部姿態(tài)以及視線方向信息來對其進行判斷,通常將視線的視點位置判定為視覺注意力焦點位置。隨著人工智能領域的飛速發(fā)展,構建全方位感知的智能時代是近年來人工智能的一個發(fā)展趨勢,而視覺注意力檢測技術則將視覺、推理以及情感等因素融入其中。因此,本文針對VFOA檢測技術的研究不僅具有很深的理論價值,也具有廣闊的應用前景。首先,本文設計了視覺注意力檢測系統(tǒng)的總體方案。并針對低質量圖像中人眼定位不精準的問題,提出基于先驗多任務級聯(lián)卷積神經網絡(Multi-task Cascaded Convolutional Networks,MTCNN)人臉檢測的人眼關鍵點定位方法。選取對頭部姿態(tài)偏轉、光照變化以及遮擋等因素具有較好魯棒性的MTCNN-mxnet進行人臉檢測和5個人臉關鍵點(左右瞳孔、鼻尖和左右嘴角)回歸。根據得到的瞳孔關鍵點先驗知識分割出人眼候選區(qū)域,對該區(qū)域進行灰度值和梯度積分投影,并將投影曲線極值點坐標組合與MTCNN左右瞳孔位置距離最近的兩個點作為粗定位瞳孔坐標,...
【文章頁數(shù)】:78 頁
【學位級別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 研究背景及意義
1.2 國內外研究現(xiàn)狀
1.3 課題來源
1.4 系統(tǒng)總體方案設計及主要研究內容
1.5 章節(jié)安排
1.6 本章小結
第2章 人臉檢測及改進的人眼關鍵點定位
2.1 人臉檢測
2.1.1 人臉檢測方法對比
2.1.2 MTCNN-mxnet人臉檢測算法原理
2.1.3 MTCNN-mxnet人臉檢測算法實現(xiàn)
2.2 基于先驗MTCNN人臉的人眼關鍵點定位
2.2.1 圖像預處理
2.2.2 人眼區(qū)域積分投影
2.2.3 基于先驗MTCNN人臉的人眼關鍵點精定位
2.2.4 基于先驗MTCNN人臉的人眼關鍵點定位實驗結果分析
2.3 本章小結
第3章 行為特征融合的視覺注意力檢測模型
3.1 視覺注意力檢測回歸模型的研究與選定
3.2 基于頭部姿態(tài)的視覺注意力檢測子模型
3.2.1 頭部姿態(tài)估計
3.2.2 基于頭部姿態(tài)估計的貝葉斯VFOA檢測子模型
3.3 基于視線檢測的視覺注意力檢測子模型
3.3.1 改進的三維視線估計方法設計
3.3.2 基于視線估計的貝葉斯VFOA檢測子模型
3.4 視覺注意力檢測預測子模型
3.4.1 圖像相似度衡量
3.4.2 基于高斯協(xié)方差矩陣的貝葉斯預測子模型
3.5 行為特征融合的視覺注意力檢測模型
3.5.1 行為特征融合的視覺注意力檢測模型
3.5.2 子模型權重設置
3.6 行為特征融合的視覺注意力檢測實驗結果及分析
3.6.1 頭部偏轉實驗
3.6.2 距離遠近實驗
3.7 本章小結
第4章 混合增量動態(tài)貝葉斯網絡視覺注意力檢測模型
4.1 貝葉斯網絡增量學習
4.2 行為特征融合的視覺注意力檢測模型動態(tài)增量更新
4.3 混合增量動態(tài)貝葉斯網絡視覺注意力檢測實驗結果及分析
4.3.1 頭部偏轉實驗
4.3.2 距離遠近實驗
4.4 本章小結
第5章 基于視覺注意力檢測的服務機器人控制系統(tǒng)設計
5.1 視覺注意力檢測控制系統(tǒng)設計
5.2 系統(tǒng)軟件開發(fā)與硬件平臺的搭建
5.2.1 系統(tǒng)的硬件結構
5.2.2 系統(tǒng)的軟件配置
5.3 基于視覺注意力檢測的智能服務機器人運動控制實現(xiàn)
5.3.1 基于視覺注意力檢測的智能服務機器人運動控制實驗
5.3.2 實驗結果及分析
5.4 本章小結
第6章 總結與展望
6.1 總結
6.2 展望
參考文獻
致謝
攻讀碩士學位期間從事的科研工作及取得的成果
本文編號:3821349
【文章頁數(shù)】:78 頁
【學位級別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 研究背景及意義
1.2 國內外研究現(xiàn)狀
1.3 課題來源
1.4 系統(tǒng)總體方案設計及主要研究內容
1.5 章節(jié)安排
1.6 本章小結
第2章 人臉檢測及改進的人眼關鍵點定位
2.1 人臉檢測
2.1.1 人臉檢測方法對比
2.1.2 MTCNN-mxnet人臉檢測算法原理
2.1.3 MTCNN-mxnet人臉檢測算法實現(xiàn)
2.2 基于先驗MTCNN人臉的人眼關鍵點定位
2.2.1 圖像預處理
2.2.2 人眼區(qū)域積分投影
2.2.3 基于先驗MTCNN人臉的人眼關鍵點精定位
2.2.4 基于先驗MTCNN人臉的人眼關鍵點定位實驗結果分析
2.3 本章小結
第3章 行為特征融合的視覺注意力檢測模型
3.1 視覺注意力檢測回歸模型的研究與選定
3.2 基于頭部姿態(tài)的視覺注意力檢測子模型
3.2.1 頭部姿態(tài)估計
3.2.2 基于頭部姿態(tài)估計的貝葉斯VFOA檢測子模型
3.3 基于視線檢測的視覺注意力檢測子模型
3.3.1 改進的三維視線估計方法設計
3.3.2 基于視線估計的貝葉斯VFOA檢測子模型
3.4 視覺注意力檢測預測子模型
3.4.1 圖像相似度衡量
3.4.2 基于高斯協(xié)方差矩陣的貝葉斯預測子模型
3.5 行為特征融合的視覺注意力檢測模型
3.5.1 行為特征融合的視覺注意力檢測模型
3.5.2 子模型權重設置
3.6 行為特征融合的視覺注意力檢測實驗結果及分析
3.6.1 頭部偏轉實驗
3.6.2 距離遠近實驗
3.7 本章小結
第4章 混合增量動態(tài)貝葉斯網絡視覺注意力檢測模型
4.1 貝葉斯網絡增量學習
4.2 行為特征融合的視覺注意力檢測模型動態(tài)增量更新
4.3 混合增量動態(tài)貝葉斯網絡視覺注意力檢測實驗結果及分析
4.3.1 頭部偏轉實驗
4.3.2 距離遠近實驗
4.4 本章小結
第5章 基于視覺注意力檢測的服務機器人控制系統(tǒng)設計
5.1 視覺注意力檢測控制系統(tǒng)設計
5.2 系統(tǒng)軟件開發(fā)與硬件平臺的搭建
5.2.1 系統(tǒng)的硬件結構
5.2.2 系統(tǒng)的軟件配置
5.3 基于視覺注意力檢測的智能服務機器人運動控制實現(xiàn)
5.3.1 基于視覺注意力檢測的智能服務機器人運動控制實驗
5.3.2 實驗結果及分析
5.4 本章小結
第6章 總結與展望
6.1 總結
6.2 展望
參考文獻
致謝
攻讀碩士學位期間從事的科研工作及取得的成果
本文編號:3821349
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3821349.html
最近更新
教材專著