基于深度強(qiáng)化學(xué)習(xí)的虛擬裝配路徑規(guī)劃方法研究
發(fā)布時(shí)間:2023-04-02 02:29
虛擬裝配是虛擬制造的重要組成部分,利用虛擬裝配,可以驗(yàn)證裝配設(shè)計(jì)和操作的正確與否,以便及早的發(fā)現(xiàn)裝配中的問(wèn)題,對(duì)模型進(jìn)行修改,并通過(guò)可視化顯示裝配過(guò)程。路徑規(guī)劃是虛擬裝配的一個(gè)重要發(fā)展方向,研究虛擬裝配環(huán)境下的路徑規(guī)劃技術(shù)對(duì)于復(fù)雜環(huán)境的裝配路徑設(shè)計(jì)具有十分重要的意義。裝配路徑規(guī)劃是從產(chǎn)品的裝配起點(diǎn)出發(fā),根據(jù)裝配環(huán)境的特點(diǎn)及待裝配零部件與其它零部件的相對(duì)位置關(guān)系等信息進(jìn)行路徑求解,并最終獲得一條滿足裝配要求的無(wú)碰撞路徑。在計(jì)算機(jī)上搭建虛擬裝配場(chǎng)景,實(shí)現(xiàn)裝配路徑的規(guī)劃,可及時(shí)驗(yàn)證裝配產(chǎn)品零部件的裝配有效性。但是路徑規(guī)劃主要用于機(jī)器人領(lǐng)域,通過(guò)傳感器識(shí)別簡(jiǎn)單環(huán)境,根據(jù)環(huán)境建模對(duì)路徑進(jìn)行規(guī)劃。而虛擬裝配中具有大量復(fù)雜環(huán)境,不容易被建模且包含狹窄空間,傳統(tǒng)路徑規(guī)劃算法無(wú)法保證復(fù)雜環(huán)境下的通行性和規(guī)劃效率,因而不適宜直接運(yùn)用在虛擬裝配的復(fù)雜環(huán)境中。針對(duì)虛擬裝配中自由空間相對(duì)狹窄而造成的復(fù)雜環(huán)境通行性問(wèn)題,提出了通過(guò)跟蹤和反饋的方式學(xué)習(xí)最優(yōu)的動(dòng)作序列決策的深度強(qiáng)化學(xué)習(xí)。本文基于深度強(qiáng)化學(xué)習(xí)實(shí)現(xiàn)了虛擬裝配的路徑規(guī)劃,主要完成了以下幾個(gè)方面的問(wèn)題:(1)介紹了路徑規(guī)劃領(lǐng)域的發(fā)展和研究現(xiàn)狀,通過(guò)分析國(guó)內(nèi)外...
【文章頁(yè)數(shù)】:45 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景與意義
1.2 路徑規(guī)劃研究現(xiàn)狀
1.3 虛擬裝配路徑規(guī)劃算法存在的問(wèn)題
1.4 本文主要工作
1.5 章節(jié)安排
第二章 路徑規(guī)劃和深度強(qiáng)化學(xué)習(xí)方法
2.1 路徑規(guī)劃基本步驟
2.2 強(qiáng)化學(xué)習(xí)
2.2.1 強(qiáng)化學(xué)習(xí)理論基礎(chǔ)
2.2.2 值迭代算法和策略迭代算法
2.3 深度學(xué)習(xí)
2.3.1 深度學(xué)習(xí)的理論基礎(chǔ)
2.3.2 卷積神經(jīng)網(wǎng)絡(luò)
2.4 深度強(qiáng)化學(xué)習(xí)
2.5 探索與利用
2.6 本章小結(jié)
第三章 基于深度Q網(wǎng)絡(luò)的路徑規(guī)劃
3.1 DQN算法模型
3.2 經(jīng)驗(yàn)回放與目標(biāo)網(wǎng)絡(luò)
3.3 路徑規(guī)劃的探索與利用問(wèn)題
3.4 模糊貝葉斯決策算法
3.4.1 貝葉斯決策算法
3.4.2 具有先驗(yàn)知識(shí)的模糊貝葉斯決策算法
3.5 本章小結(jié)
第四章 實(shí)驗(yàn)結(jié)果及分析
4.1 探索與利用的實(shí)驗(yàn)效果
4.1.1 不同的ε取值的實(shí)驗(yàn)結(jié)果
4.1.2 模糊貝葉斯決策算法的實(shí)驗(yàn)結(jié)果
4.2 路徑規(guī)劃的實(shí)驗(yàn)結(jié)果
4.3 本章小結(jié)
第五章 總結(jié)與展望
5.1 總結(jié)
5.2 展望
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表的論文及其它成果
致謝
本文編號(hào):3778348
【文章頁(yè)數(shù)】:45 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景與意義
1.2 路徑規(guī)劃研究現(xiàn)狀
1.3 虛擬裝配路徑規(guī)劃算法存在的問(wèn)題
1.4 本文主要工作
1.5 章節(jié)安排
第二章 路徑規(guī)劃和深度強(qiáng)化學(xué)習(xí)方法
2.1 路徑規(guī)劃基本步驟
2.2 強(qiáng)化學(xué)習(xí)
2.2.1 強(qiáng)化學(xué)習(xí)理論基礎(chǔ)
2.2.2 值迭代算法和策略迭代算法
2.3 深度學(xué)習(xí)
2.3.1 深度學(xué)習(xí)的理論基礎(chǔ)
2.3.2 卷積神經(jīng)網(wǎng)絡(luò)
2.4 深度強(qiáng)化學(xué)習(xí)
2.5 探索與利用
2.6 本章小結(jié)
第三章 基于深度Q網(wǎng)絡(luò)的路徑規(guī)劃
3.1 DQN算法模型
3.2 經(jīng)驗(yàn)回放與目標(biāo)網(wǎng)絡(luò)
3.3 路徑規(guī)劃的探索與利用問(wèn)題
3.4 模糊貝葉斯決策算法
3.4.1 貝葉斯決策算法
3.4.2 具有先驗(yàn)知識(shí)的模糊貝葉斯決策算法
3.5 本章小結(jié)
第四章 實(shí)驗(yàn)結(jié)果及分析
4.1 探索與利用的實(shí)驗(yàn)效果
4.1.1 不同的ε取值的實(shí)驗(yàn)結(jié)果
4.1.2 模糊貝葉斯決策算法的實(shí)驗(yàn)結(jié)果
4.2 路徑規(guī)劃的實(shí)驗(yàn)結(jié)果
4.3 本章小結(jié)
第五章 總結(jié)與展望
5.1 總結(jié)
5.2 展望
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表的論文及其它成果
致謝
本文編號(hào):3778348
本文鏈接:http://sikaile.net/kejilunwen/jiagonggongyi/3778348.html
最近更新
教材專著