基于強化學(xué)習(xí)的空間機械臂控制方法

發(fā)布時間：2023-04-22 11:33

　　針對現(xiàn)有空間機械臂控制方法在實際應(yīng)用中調(diào)試時間長、穩(wěn)定性差的問題,提出一種基于深度強化學(xué)習(xí)的控制算法。構(gòu)建仿真環(huán)境用于產(chǎn)生數(shù)據(jù),通過狀態(tài)變量實現(xiàn)仿真環(huán)境與深度強化學(xué)習(xí)算法的交互,通過獎勵函數(shù)實現(xiàn)對神經(jīng)網(wǎng)絡(luò)參數(shù)的訓(xùn)練,最終實現(xiàn)使用近端策略優(yōu)化算法(Proximal Policy Optimization,PPO)控制空間機械臂將抓手移動至物體下方特定位置的目的。實驗結(jié)果表明,本文提出的控制算法能夠快速收斂,實現(xiàn)控制空間機械臂完成特定目標(biāo),并且有效降低抖動現(xiàn)象,提升控制的穩(wěn)定性。

【文章頁數(shù)】：6 頁

【文章目錄】：
0 引言
1 PPO算法
2 基于PPO的控制算法
    2.1 系統(tǒng)組成
    2.2 訓(xùn)練環(huán)境
    2.3 基于PPO的控制決策算法
3 仿真校驗
4 結(jié)論

本文編號：3797559

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/hangkongsky/3797559.html

上一篇：基于大數(shù)據(jù)的空間目標(biāo)監(jiān)測數(shù)據(jù)管理系統(tǒng)設(shè)計與應(yīng)用
下一篇：我國航天企業(yè)推動衛(wèi)星對地觀測領(lǐng)域發(fā)展

論文發(fā)表

·知網(wǎng)|萬方|維普|龍源|省級|國家級|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于強化學(xué)習(xí)的空間機械臂控制方法