基于強化學習的時間觸發(fā)通信調度方法
發(fā)布時間:2022-01-04 08:26
未來航空電子系統(tǒng)中將會更廣泛地選擇基于時間觸發(fā)的通信機制進行信息傳輸,以保證信息交互的確定性。如何合理地進行時間觸發(fā)通信調度設計是時間觸發(fā)應用于航空電子互連系統(tǒng)的關鍵。針對時間觸發(fā)調度的周期性任務,提出了一種基于強化學習的周期調度時刻表生成方法。首先,將流量調度任務轉換為樹搜索問題,使之具有強化學習所需要的馬爾可夫特性;隨后,利用基于神經網絡的強化學習算法對調度表進行探索,不斷縮短延遲時間以優(yōu)化調度表,且在訓練完成后,可以直接使用到消息分布相近的任務中。與使用Yices等可滿足模理論(SMT)形式化求解時間觸發(fā)調度表方法相比,所提方法不會出現(xiàn)無法判定的問題,能夠保證時間觸發(fā)調度設計結果的正確性和優(yōu)化性。對于包含1 000條消息的大型網絡,所提方法的計算速度為SMT方法的數(shù)十倍以上,并且調度生成消息的端到端延遲在SMT方法的1%以下,大大提高了消息傳輸?shù)募皶r性。
【文章來源】:北京航空航天大學學報. 2019,45(09)北大核心EICSCD
【文章頁數(shù)】:8 頁
【文章目錄】:
1流量調度方法
1.1馬爾可夫模型與強化學習
1.2搜索策略
1.3強化學習訓練
2實驗
2.1實驗條件
2.2實驗結果
2.3模型魯棒性測試
2.3.1幀長變化
2.3.2增加消息數(shù)量
3結論
【參考文獻】:
期刊論文
[1]片間綜合化互連時間觸發(fā)通信調度方法[J]. 孔韻雯,李峭,熊華鋼,程子敬. 航空學報. 2018(02)
[2]基于混合遺傳算法的TTE靜態(tài)調度表生成設計[J]. 李炳乾,王勇,譚小虎,劉達. 電子技術應用. 2016(10)
[3]新一代綜合化航空電子系統(tǒng)構架技術研究[J]. 王國慶,谷青范,王淼,張麗花. 航空學報. 2014(06)
本文編號:3568035
【文章來源】:北京航空航天大學學報. 2019,45(09)北大核心EICSCD
【文章頁數(shù)】:8 頁
【文章目錄】:
1流量調度方法
1.1馬爾可夫模型與強化學習
1.2搜索策略
1.3強化學習訓練
2實驗
2.1實驗條件
2.2實驗結果
2.3模型魯棒性測試
2.3.1幀長變化
2.3.2增加消息數(shù)量
3結論
【參考文獻】:
期刊論文
[1]片間綜合化互連時間觸發(fā)通信調度方法[J]. 孔韻雯,李峭,熊華鋼,程子敬. 航空學報. 2018(02)
[2]基于混合遺傳算法的TTE靜態(tài)調度表生成設計[J]. 李炳乾,王勇,譚小虎,劉達. 電子技術應用. 2016(10)
[3]新一代綜合化航空電子系統(tǒng)構架技術研究[J]. 王國慶,谷青范,王淼,張麗花. 航空學報. 2014(06)
本文編號:3568035
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3568035.html
教材專著