基于學(xué)習(xí)的視線估計及應(yīng)用
發(fā)布時間:2023-06-02 19:34
典型的人機(jī)交互通過對人機(jī)界面的直接觸控實現(xiàn)用戶與機(jī)器間的信息傳遞。隨著多媒體技術(shù)和人工智能的不斷發(fā)展,非接觸式人機(jī)交互給用戶帶來全新的感官和心理體驗。作為非接觸式人機(jī)交互的重要分支,視線交互以其重要的科研和應(yīng)用價值逐漸獲得人們的重視。所謂視線交互,即通過視線估計實現(xiàn)通過眼球運動進(jìn)行觸控操作的技術(shù),因此,如何簡便且準(zhǔn)確地實現(xiàn)視線方向的估計至關(guān)重要。傳統(tǒng)的視線估計方法通過獲取瞳孔和角膜中心的位置來確定視線方向,這種方法通常需要高分辨率的相機(jī)、復(fù)雜的外接設(shè)備如紅外光源、各種傳感設(shè)備等,價格昂貴且使用不便。深度學(xué)習(xí)通過大量的圖像訓(xùn)練神經(jīng)網(wǎng)絡(luò),在人工智能時代得到了巨大的發(fā)展并逐步成為當(dāng)前視線估計領(lǐng)域的研究熱點。然而,目前常見的基于學(xué)習(xí)的視線估計方法大多采用回歸的方法估計注視點的具體位置。由于跳躍式眼動的存在,精度低誤差大,估計人眼注視的具體位置相當(dāng)困難,無法滿足觸控操作的要求。此外,不同于傳統(tǒng)的基于模型的估計方法,基于學(xué)習(xí)的視線估計需要海量的數(shù)據(jù)作為驅(qū)動,因此,建立合適的數(shù)據(jù)庫對于相關(guān)研究至關(guān)重要。針對以上問題,考慮到觸控操作的基本任務(wù)特點,本文提出的基于學(xué)習(xí)的視線估計方法將分類作為主要的研究方...
【文章頁數(shù)】:61 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 研究背景及意義
1.2 視線估計技術(shù)國內(nèi)外研究現(xiàn)狀
1.3 研究課題的提出
1.4 論文主要研究內(nèi)容及結(jié)構(gòu)
1.4.1 研究內(nèi)容
1.4.2 論文結(jié)構(gòu)
第二章 基于學(xué)習(xí)的視線估計方法介紹
2.1 引言
2.2 常見人眼特征介紹
2.3 常見回歸模型介紹
2.4 卷積神經(jīng)網(wǎng)絡(luò)
2.4.1 概述
2.4.2 卷積神經(jīng)網(wǎng)絡(luò)主要結(jié)構(gòu)介紹
2.5 視線估計系統(tǒng)架構(gòu)
2.6 本章小結(jié)
第三章 人眼數(shù)據(jù)庫建立
3.1 引言
3.2 人眼數(shù)據(jù)庫比較
3.3 數(shù)據(jù)庫建立
3.3.1 圖像采集
3.3.2 圖像處理
3.3.3 數(shù)據(jù)庫結(jié)構(gòu)
3.4 本章小結(jié)
第四章 基于單眼圖像的視線估計
4.1 引言
4.2 實驗網(wǎng)絡(luò)設(shè)計
4.3 網(wǎng)絡(luò)各層輸出
4.4 網(wǎng)絡(luò)性能分析
4.4.1 網(wǎng)絡(luò)平均分類性能分析
4.4.2 網(wǎng)絡(luò)各類分類性能分析
4.5 本章小結(jié)
第五章 基于雙眼圖像的視線估計
5.1 引言
5.2 訓(xùn)練過程基本設(shè)計
5.3 網(wǎng)絡(luò)性能分析
5.3.1 網(wǎng)絡(luò)平均分類性能
5.3.2 網(wǎng)絡(luò)各類分類性能分析
5.3.3 與MPIIGaze數(shù)據(jù)庫的比較
5.3.4 跨個體性能分析
5.3.5 不同方法比較
5.4 本章小結(jié)
第六章 總結(jié)與展望
6.1 論文主要工作總結(jié)
6.2 未來工作展望
參考文獻(xiàn)
致謝
攻讀碩士學(xué)位期間發(fā)表的學(xué)術(shù)論文
學(xué)位論文評閱及答辯情況表
本文編號:3827903
【文章頁數(shù)】:61 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 研究背景及意義
1.2 視線估計技術(shù)國內(nèi)外研究現(xiàn)狀
1.3 研究課題的提出
1.4 論文主要研究內(nèi)容及結(jié)構(gòu)
1.4.1 研究內(nèi)容
1.4.2 論文結(jié)構(gòu)
第二章 基于學(xué)習(xí)的視線估計方法介紹
2.1 引言
2.2 常見人眼特征介紹
2.3 常見回歸模型介紹
2.4 卷積神經(jīng)網(wǎng)絡(luò)
2.4.1 概述
2.4.2 卷積神經(jīng)網(wǎng)絡(luò)主要結(jié)構(gòu)介紹
2.5 視線估計系統(tǒng)架構(gòu)
2.6 本章小結(jié)
第三章 人眼數(shù)據(jù)庫建立
3.1 引言
3.2 人眼數(shù)據(jù)庫比較
3.3 數(shù)據(jù)庫建立
3.3.1 圖像采集
3.3.2 圖像處理
3.3.3 數(shù)據(jù)庫結(jié)構(gòu)
3.4 本章小結(jié)
第四章 基于單眼圖像的視線估計
4.1 引言
4.2 實驗網(wǎng)絡(luò)設(shè)計
4.3 網(wǎng)絡(luò)各層輸出
4.4 網(wǎng)絡(luò)性能分析
4.4.1 網(wǎng)絡(luò)平均分類性能分析
4.4.2 網(wǎng)絡(luò)各類分類性能分析
4.5 本章小結(jié)
第五章 基于雙眼圖像的視線估計
5.1 引言
5.2 訓(xùn)練過程基本設(shè)計
5.3 網(wǎng)絡(luò)性能分析
5.3.1 網(wǎng)絡(luò)平均分類性能
5.3.2 網(wǎng)絡(luò)各類分類性能分析
5.3.3 與MPIIGaze數(shù)據(jù)庫的比較
5.3.4 跨個體性能分析
5.3.5 不同方法比較
5.4 本章小結(jié)
第六章 總結(jié)與展望
6.1 論文主要工作總結(jié)
6.2 未來工作展望
參考文獻(xiàn)
致謝
攻讀碩士學(xué)位期間發(fā)表的學(xué)術(shù)論文
學(xué)位論文評閱及答辯情況表
本文編號:3827903
本文鏈接:http://sikaile.net/yixuelunwen/swyx/3827903.html
最近更新
教材專著