天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 船舶論文 >

無(wú)人艇集群最優(yōu)協(xié)同控制反演

發(fā)布時(shí)間:2021-11-18 10:51
  為實(shí)現(xiàn)通過數(shù)據(jù)驅(qū)動(dòng)學(xué)習(xí)人為操作下的無(wú)人艇集群最優(yōu)協(xié)同控制策略,文中提出了一種線性二次型閉環(huán)微分博弈反演優(yōu)化算法,根據(jù)觀測(cè)到的系統(tǒng)最優(yōu)狀態(tài)和控制輸入軌跡辨識(shí)協(xié)同策略目標(biāo)函數(shù)。首先,根據(jù)觀測(cè)到的含加性白噪聲的最優(yōu)系統(tǒng)狀態(tài)和控制輸入軌跡辨識(shí)最優(yōu)反饋矩陣;然后,通過求解由納什平衡充要條件推出的耦合代數(shù)黎卡提方程的解來辨識(shí)協(xié)同策略目標(biāo)函數(shù)。所提出的反演優(yōu)化算法能夠獲得滿足給定系統(tǒng)狀態(tài)和控制輸入軌跡的最優(yōu)協(xié)同策略目標(biāo)函數(shù);同時(shí),該算法辨識(shí)出的目標(biāo)函數(shù)可以用于實(shí)現(xiàn)針對(duì)特定任務(wù)場(chǎng)景的無(wú)人艇集群最優(yōu)協(xié)同控制,并為集群的對(duì)抗博弈提供新的思路和解決方案。 

【文章來源】:水下無(wú)人系統(tǒng)學(xué)報(bào). 2020,28(06)北大核心

【文章頁(yè)數(shù)】:7 頁(yè)

【部分圖文】:

無(wú)人艇集群最優(yōu)協(xié)同控制反演


閉環(huán)微分博弈框圖Fig.1Blockdiagramofclosed-loopdifferentialgame

場(chǎng)景,反饋矩陣,優(yōu)化模型,反演


2020年12月張振華,等:無(wú)人艇集群最優(yōu)協(xié)同控制反演第6期水下無(wú)人系統(tǒng)學(xué)報(bào)www.yljszz.cn615無(wú)人艇集群最優(yōu)協(xié)同控制反演優(yōu)化算法流程如下。1)建立采集到的納什平衡條件下無(wú)人艇集群運(yùn)動(dòng)狀態(tài)和每個(gè)操作人員對(duì)單艘無(wú)人艇的控制輸入信息模型**[][][],1:[][][],1:iiikkkkMkkkkMxxvuuw(18)式中:[][]ixk和uk分別代表k時(shí)刻采集到的無(wú)人艇集群系統(tǒng)狀態(tài)量和第i艘無(wú)人艇的控制輸入量;[][]ivk和wk代表k時(shí)刻的疊加噪聲。2)辨識(shí)各個(gè)無(wú)人艇的最優(yōu)反饋矩陣*iK。由于在實(shí)際應(yīng)用中很難直接獲取到各艇的最優(yōu)反饋矩陣,所以往往需要通過觀測(cè)信息來辨識(shí)控制律。使用x[k]和[]iuk,通過最小二乘法辨識(shí)納什平衡下各艇的最優(yōu)反饋矩陣*221argmin[][]iiiikxkukMKKK(19)3)建立反演優(yōu)化模型。根據(jù)式(2)、式(7)和式(19),對(duì)無(wú)人艇集群最優(yōu)協(xié)同控制反演優(yōu)化問題建立如下優(yōu)化模型2*T1Tmin()s.t.()()0()()iiiiFiiiiiiiiiijjijjjiiiiijiθKθKPASPASPPQPSPKθRBPθ(20)式中,iijQ和R均為正定矩陣。4)求解優(yōu)化模型。通過求解式(20)即可得到待辨識(shí)的參數(shù)iθ,但該模型屬于雙層優(yōu)化問題,在直接求解過程中需要不斷解內(nèi)層耦合的代數(shù)黎卡提方程,計(jì)算量大。因此,根據(jù)引理1和式(10),利用耦合黎卡提的解將式(20)轉(zhuǎn)化為簡(jiǎn)單的最小二乘優(yōu)化問題,即式(21),以實(shí)現(xiàn)快速求解,增加算法實(shí)時(shí)性。22mins.t.00iiiLiiiθMθIθR(21)

分布圖,相對(duì)誤差,噪聲,條件


分布和統(tǒng)計(jì)直方圖分別如圖3和圖4所示。圖3無(wú)噪聲條件下相對(duì)誤差分布圖Fig.3Diagramofelativeerrordistributionundernoiselesscondition圖4無(wú)噪聲條件下相對(duì)誤差統(tǒng)計(jì)直方圖Fig.4Histogramofrelativeerrorstatisticalundernoiselesscondition如在求解正向微分博弈協(xié)同控制問題時(shí)得到的系統(tǒng)狀態(tài)和控制輸入軌跡上疊加30dB高斯白噪聲,且加入一定先驗(yàn)知識(shí)(已知(1,1),(1,1)iijQR),則所獲得的系統(tǒng)狀態(tài)預(yù)測(cè)相對(duì)誤差分布和統(tǒng)計(jì)直方圖情況分別如圖5和圖6所示。圖530dB噪聲條件下相對(duì)誤差分布圖Fig.5Diagramofrelativeerrordistributionunder30dBnoisecondition圖630dB噪聲條件下相對(duì)誤差統(tǒng)計(jì)直方圖Fig.6Histogramofrelativeerrorstatisticalunder30dBnoisecondition


本文編號(hào):3502766

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/chuanbolw/3502766.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶62c11***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com