基于HoloLens增強(qiáng)現(xiàn)實(shí)的關(guān)鍵技術(shù)研究與實(shí)現(xiàn)
發(fā)布時(shí)間:2024-04-20 11:21
增強(qiáng)現(xiàn)實(shí)系統(tǒng)關(guān)鍵技術(shù)包括虛擬現(xiàn)實(shí)融合、三維配準(zhǔn)、實(shí)時(shí)交互,其中核心在于目標(biāo)對(duì)象的檢測(cè)定位,即三維配準(zhǔn)。隨著大數(shù)據(jù)、硬件技術(shù)的不斷發(fā)展,大量的實(shí)驗(yàn)證明,相比以人為設(shè)計(jì)并提取特征點(diǎn)的傳統(tǒng)機(jī)器學(xué)習(xí)方法,以卷積神經(jīng)網(wǎng)絡(luò)為核心的深度學(xué)習(xí)技術(shù)大大提高了圖像檢測(cè)的效率和精度,廣泛應(yīng)用于各行各業(yè)。針對(duì)增強(qiáng)現(xiàn)實(shí)系統(tǒng)中關(guān)鍵技術(shù)的精度效率要求以及交互方式要求,本文在以下方面進(jìn)行了研究與實(shí)現(xiàn):(1)為了實(shí)現(xiàn)數(shù)據(jù)的普遍性,從背景、照明,對(duì)象大小、拍攝角度等多方面考慮,針對(duì)常見(jiàn)的實(shí)驗(yàn)室設(shè)備,自制數(shù)據(jù)集并標(biāo)定,同時(shí)利用翻轉(zhuǎn)、縮放、裁剪等數(shù)據(jù)增強(qiáng)方法來(lái)擴(kuò)充數(shù)據(jù)集以獲取更好的訓(xùn)練擬合,利用自身訓(xùn)練的網(wǎng)絡(luò)模型,與Faster R-CNN網(wǎng)絡(luò)進(jìn)行比對(duì),依據(jù)實(shí)驗(yàn)結(jié)果選出更優(yōu)的目標(biāo)檢測(cè)網(wǎng)絡(luò)。(2)在目標(biāo)檢測(cè)模型返回的邊界框的基礎(chǔ)上,設(shè)計(jì)出一種結(jié)合射線(xiàn)碰撞、計(jì)算邊框的方法,對(duì)檢測(cè)目標(biāo)進(jìn)行物理空間定位,為疊加模型提供空間坐標(biāo),并從主觀(guān)和客觀(guān)角度最終評(píng)價(jià)檢測(cè)模型。(3)對(duì)前期制作的3D設(shè)備模型進(jìn)行不同方法的貼圖渲染,設(shè)計(jì)烘焙移植方法來(lái)選出最好結(jié)果以適應(yīng)增強(qiáng)現(xiàn)實(shí)設(shè)備的計(jì)算力。(4)綜合以上三點(diǎn),利用Voice、Gesture、Gaze...
【文章頁(yè)數(shù)】:87 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 課題的研究背景和意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.3 研究?jī)?nèi)容和論文結(jié)構(gòu)
第2章 目標(biāo)檢測(cè)和增強(qiáng)現(xiàn)實(shí)技術(shù)簡(jiǎn)介
2.1 目標(biāo)檢測(cè)技術(shù)
2.1.1 傳統(tǒng)算法
2.1.2 卷積神經(jīng)網(wǎng)絡(luò)
2.1.3 CNN模型
2.2 增強(qiáng)現(xiàn)實(shí)關(guān)鍵技術(shù)
2.2.1 跟蹤注冊(cè)技術(shù)
2.2.2 三維顯示技術(shù)
2.2.3 人機(jī)交互技術(shù)
2.3 本章小結(jié)
第3章 目標(biāo)檢測(cè)模型的研究與實(shí)現(xiàn)
3.1 數(shù)據(jù)建立與處理
3.1.1 數(shù)據(jù)處理及優(yōu)化
3.1.2 數(shù)據(jù)集標(biāo)定
3.2 改進(jìn)的Faster RCNN模型
3.2.1 Faster R-CNN框架
3.2.2 區(qū)域建議網(wǎng)絡(luò)
3.2.3 改進(jìn)后Faster R-CNN網(wǎng)絡(luò)訓(xùn)練
3.3 微軟視覺(jué)服務(wù)模型訓(xùn)練
3.4 實(shí)驗(yàn)結(jié)果與分析
3.4.1 實(shí)驗(yàn)相關(guān)信息說(shuō)明
3.4.2 實(shí)驗(yàn)結(jié)果對(duì)比
3.5 本章小結(jié)
第4章 空間定位與交互技術(shù)研究與實(shí)現(xiàn)
4.1 HoloLens中的SLAM技術(shù)
4.1.1 基于單目視覺(jué)的SLAM
4.1.2 基于RGB-D類(lèi)的SLAM
4.2 目標(biāo)空間定位
4.3 模型的制作與渲染
4.3.1 3DS MAX三維建模
4.3.2 V-Ray渲染器
4.3.3 貼圖烘焙
4.4 交互方式
4.4.1 基于凝視的交互方式
4.4.2 基于手勢(shì)的交互方式
4.4.3 基于語(yǔ)音的交互方式
4.5 實(shí)驗(yàn)結(jié)果與分析
4.5.1 目標(biāo)空間定位實(shí)驗(yàn)
4.5.2 3D模型的渲染烘焙實(shí)驗(yàn)
4.5.3 交互方式實(shí)驗(yàn)
4.6 本章小結(jié)
第5章 AR檢測(cè)定位交互系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
5.1 功能劃分
5.2 模塊設(shè)計(jì)與實(shí)現(xiàn)
5.3 模塊連接與系統(tǒng)集成
5.4 實(shí)驗(yàn)結(jié)果與分析
5.5 本章小結(jié)
總結(jié)與展望
致謝
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表的論文及科研成果
本文編號(hào):3959335
【文章頁(yè)數(shù)】:87 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 課題的研究背景和意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.3 研究?jī)?nèi)容和論文結(jié)構(gòu)
第2章 目標(biāo)檢測(cè)和增強(qiáng)現(xiàn)實(shí)技術(shù)簡(jiǎn)介
2.1 目標(biāo)檢測(cè)技術(shù)
2.1.1 傳統(tǒng)算法
2.1.2 卷積神經(jīng)網(wǎng)絡(luò)
2.1.3 CNN模型
2.2 增強(qiáng)現(xiàn)實(shí)關(guān)鍵技術(shù)
2.2.1 跟蹤注冊(cè)技術(shù)
2.2.2 三維顯示技術(shù)
2.2.3 人機(jī)交互技術(shù)
2.3 本章小結(jié)
第3章 目標(biāo)檢測(cè)模型的研究與實(shí)現(xiàn)
3.1 數(shù)據(jù)建立與處理
3.1.1 數(shù)據(jù)處理及優(yōu)化
3.1.2 數(shù)據(jù)集標(biāo)定
3.2 改進(jìn)的Faster RCNN模型
3.2.1 Faster R-CNN框架
3.2.2 區(qū)域建議網(wǎng)絡(luò)
3.2.3 改進(jìn)后Faster R-CNN網(wǎng)絡(luò)訓(xùn)練
3.3 微軟視覺(jué)服務(wù)模型訓(xùn)練
3.4 實(shí)驗(yàn)結(jié)果與分析
3.4.1 實(shí)驗(yàn)相關(guān)信息說(shuō)明
3.4.2 實(shí)驗(yàn)結(jié)果對(duì)比
3.5 本章小結(jié)
第4章 空間定位與交互技術(shù)研究與實(shí)現(xiàn)
4.1 HoloLens中的SLAM技術(shù)
4.1.1 基于單目視覺(jué)的SLAM
4.1.2 基于RGB-D類(lèi)的SLAM
4.2 目標(biāo)空間定位
4.3 模型的制作與渲染
4.3.1 3DS MAX三維建模
4.3.2 V-Ray渲染器
4.3.3 貼圖烘焙
4.4 交互方式
4.4.1 基于凝視的交互方式
4.4.2 基于手勢(shì)的交互方式
4.4.3 基于語(yǔ)音的交互方式
4.5 實(shí)驗(yàn)結(jié)果與分析
4.5.1 目標(biāo)空間定位實(shí)驗(yàn)
4.5.2 3D模型的渲染烘焙實(shí)驗(yàn)
4.5.3 交互方式實(shí)驗(yàn)
4.6 本章小結(jié)
第5章 AR檢測(cè)定位交互系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
5.1 功能劃分
5.2 模塊設(shè)計(jì)與實(shí)現(xiàn)
5.3 模塊連接與系統(tǒng)集成
5.4 實(shí)驗(yàn)結(jié)果與分析
5.5 本章小結(jié)
總結(jié)與展望
致謝
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表的論文及科研成果
本文編號(hào):3959335
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3959335.html
最近更新
教材專(zhuān)著