基于深度學(xué)習(xí)的手機(jī)移動(dòng)端視線跟蹤算法研究
發(fā)布時(shí)間:2021-04-29 01:03
視線跟蹤技術(shù)是計(jì)算機(jī)視覺(jué)領(lǐng)域中的重要課題,伴隨著高性能圖像采集和計(jì)算設(shè)備的出現(xiàn)以及圖像處理分析的相關(guān)算法的不斷涌現(xiàn),視線跟蹤技術(shù)已經(jīng)逐漸走入我們?nèi)粘I钪械母鱾(gè)領(lǐng)域。將視線跟蹤技術(shù)用于人機(jī)交互領(lǐng)域中,不僅可以改變傳統(tǒng)的人機(jī)交互模式,給用戶帶來(lái)全新、高效的使用體驗(yàn),還可以給四肢行動(dòng)存在障礙的用戶帶來(lái)極大的方便。然而,傳統(tǒng)的視線跟蹤技術(shù)往往要依靠眼動(dòng)跟蹤儀等其他的硬件設(shè)備,不僅造價(jià)昂貴,還會(huì)給使用者帶來(lái)一定的不便。本課題以使用iPhone手機(jī)過(guò)程中的人機(jī)交互為例,嘗試將深度學(xué)習(xí)技術(shù)應(yīng)用于視線跟蹤任務(wù)中,使得用戶可以不借助眼動(dòng)跟蹤儀等其他的硬件設(shè)備,僅依靠手機(jī)前置攝像頭拍攝到的用戶操作手機(jī)照片的圖片,利用純軟件的方式預(yù)測(cè)用戶視線在手機(jī)屏幕上的聚焦位置,從而實(shí)現(xiàn)用眼睛代替手指進(jìn)行觸屏操作。首先,本文介紹了卷積神經(jīng)網(wǎng)絡(luò)的基本理論。卷積神經(jīng)網(wǎng)絡(luò)由標(biāo)準(zhǔn)神經(jīng)網(wǎng)絡(luò)演變而來(lái),采用卷積運(yùn)算實(shí)現(xiàn)層間連接,可以顯著降低計(jì)算成本,滿足信號(hào)局部特征提取的要求,在計(jì)算機(jī)視覺(jué)領(lǐng)域獲得了廣泛的應(yīng)用。其次,綜合考慮實(shí)時(shí)性和準(zhǔn)確性因素,采用方向梯度直方圖特征和級(jí)聯(lián)的梯度提升回歸樹(shù)算法進(jìn)行用戶人臉和人眼的分割定位以及眨眼檢測(cè),...
【文章來(lái)源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁(yè)數(shù)】:72 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 課題背景及研究目的與意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 傳統(tǒng)視線跟蹤方法研究現(xiàn)狀
1.2.2 深度學(xué)習(xí)技術(shù)在視線跟蹤中的應(yīng)用研究
1.2.3 未來(lái)的研究方向與趨勢(shì)
1.3 論文研究?jī)?nèi)容及章節(jié)安排
第2章 人臉檢測(cè)和人眼檢測(cè)算法研究
2.1 概述
2.2 人臉檢測(cè)算法設(shè)計(jì)
2.2.1 人臉檢測(cè)算法綜述
2.2.2 基于方向梯度直方圖的人臉檢測(cè)算法
2.3 眨眼檢測(cè)算法設(shè)計(jì)
2.4 本章小結(jié)
第3章 基于多輸入信號(hào)的視線跟蹤算法
3.1 算法概述
3.2 卷積神經(jīng)網(wǎng)絡(luò)基本理論
3.2.1 神經(jīng)網(wǎng)絡(luò)基本結(jié)構(gòu)及學(xué)習(xí)算法
3.2.2 卷積神經(jīng)網(wǎng)絡(luò)理論
3.3 基于回歸的多輸入視線估計(jì)算法
3.3.1 AlexNet卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)
3.3.2 算法設(shè)計(jì)
3.4 基于分類(lèi)的多輸入視線估計(jì)算法
3.4.1 多分類(lèi)問(wèn)題中的分類(lèi)器及損失函數(shù)
3.4.2 算法設(shè)計(jì)
3.5 本章小結(jié)
第4章 基于單輸入信號(hào)的視線跟蹤算法
4.1 算法概述
4.2 深度殘差網(wǎng)絡(luò)
4.2.1 提出背景
4.2.2 殘差模塊及深度殘差網(wǎng)絡(luò)
4.3 批處理標(biāo)準(zhǔn)化
4.3.1 內(nèi)部協(xié)變量轉(zhuǎn)移及解決辦法
4.3.2 卷積神經(jīng)網(wǎng)絡(luò)中的批處理標(biāo)準(zhǔn)化操作
4.4 算法設(shè)計(jì)
4.4.1 網(wǎng)絡(luò)結(jié)構(gòu)的設(shè)計(jì)
4.4.2 損失函數(shù)和優(yōu)化方法的設(shè)計(jì)
4.5 本章小結(jié)
第5章 實(shí)驗(yàn)測(cè)試與分析
5.1 實(shí)驗(yàn)環(huán)境
5.2 深度學(xué)習(xí)模型的訓(xùn)練
5.2.1 模型訓(xùn)練的技巧
5.2.2 深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練過(guò)程
5.3 實(shí)驗(yàn)結(jié)果與分析
5.4 本章小結(jié)
結(jié)論
參考文獻(xiàn)
致謝
本文編號(hào):3166530
【文章來(lái)源】:哈爾濱工業(yè)大學(xué)黑龍江省 211工程院校 985工程院校
【文章頁(yè)數(shù)】:72 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 課題背景及研究目的與意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 傳統(tǒng)視線跟蹤方法研究現(xiàn)狀
1.2.2 深度學(xué)習(xí)技術(shù)在視線跟蹤中的應(yīng)用研究
1.2.3 未來(lái)的研究方向與趨勢(shì)
1.3 論文研究?jī)?nèi)容及章節(jié)安排
第2章 人臉檢測(cè)和人眼檢測(cè)算法研究
2.1 概述
2.2 人臉檢測(cè)算法設(shè)計(jì)
2.2.1 人臉檢測(cè)算法綜述
2.2.2 基于方向梯度直方圖的人臉檢測(cè)算法
2.3 眨眼檢測(cè)算法設(shè)計(jì)
2.4 本章小結(jié)
第3章 基于多輸入信號(hào)的視線跟蹤算法
3.1 算法概述
3.2 卷積神經(jīng)網(wǎng)絡(luò)基本理論
3.2.1 神經(jīng)網(wǎng)絡(luò)基本結(jié)構(gòu)及學(xué)習(xí)算法
3.2.2 卷積神經(jīng)網(wǎng)絡(luò)理論
3.3 基于回歸的多輸入視線估計(jì)算法
3.3.1 AlexNet卷積神經(jīng)網(wǎng)絡(luò)架構(gòu)
3.3.2 算法設(shè)計(jì)
3.4 基于分類(lèi)的多輸入視線估計(jì)算法
3.4.1 多分類(lèi)問(wèn)題中的分類(lèi)器及損失函數(shù)
3.4.2 算法設(shè)計(jì)
3.5 本章小結(jié)
第4章 基于單輸入信號(hào)的視線跟蹤算法
4.1 算法概述
4.2 深度殘差網(wǎng)絡(luò)
4.2.1 提出背景
4.2.2 殘差模塊及深度殘差網(wǎng)絡(luò)
4.3 批處理標(biāo)準(zhǔn)化
4.3.1 內(nèi)部協(xié)變量轉(zhuǎn)移及解決辦法
4.3.2 卷積神經(jīng)網(wǎng)絡(luò)中的批處理標(biāo)準(zhǔn)化操作
4.4 算法設(shè)計(jì)
4.4.1 網(wǎng)絡(luò)結(jié)構(gòu)的設(shè)計(jì)
4.4.2 損失函數(shù)和優(yōu)化方法的設(shè)計(jì)
4.5 本章小結(jié)
第5章 實(shí)驗(yàn)測(cè)試與分析
5.1 實(shí)驗(yàn)環(huán)境
5.2 深度學(xué)習(xí)模型的訓(xùn)練
5.2.1 模型訓(xùn)練的技巧
5.2.2 深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練過(guò)程
5.3 實(shí)驗(yàn)結(jié)果與分析
5.4 本章小結(jié)
結(jié)論
參考文獻(xiàn)
致謝
本文編號(hào):3166530
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3166530.html
最近更新
教材專(zhuān)著