進(jìn)港航班排序強(qiáng)化學(xué)習(xí)模型研究
本文選題:智能體 切入點(diǎn):空中交通管制 出處:《工程科學(xué)與技術(shù)》2017年S2期 論文類型:期刊論文
【摘要】:為解決進(jìn)港航班排序中智能化程度不高的現(xiàn)實(shí)問(wèn)題,提出進(jìn)港航班排序強(qiáng)化學(xué)習(xí)模型。首先,確定進(jìn)港航班排序強(qiáng)化學(xué)習(xí)模型的狀態(tài)、動(dòng)作、智能體、環(huán)境、獎(jiǎng)賞函數(shù)、約束條件、Q學(xué)習(xí)等。進(jìn)港航班排序強(qiáng)化模型中的狀態(tài)是各進(jìn)港航班的到達(dá)時(shí)刻,動(dòng)作是對(duì)航班到達(dá)時(shí)間的調(diào)整,智能體對(duì)航班的到達(dá)時(shí)刻進(jìn)行調(diào)整,環(huán)境對(duì)動(dòng)作做出反應(yīng),一個(gè)新的到達(dá)時(shí)間和獎(jiǎng)賞值被傳給智能體,獎(jiǎng)賞函數(shù)考慮了延誤時(shí)間、經(jīng)濟(jì)成本、對(duì)后續(xù)航班的影響。該模型考慮了航班不能提前降落,分配的到達(dá)時(shí)間不早于計(jì)劃的到達(dá)時(shí)間,進(jìn)港航班流量不能超過(guò)機(jī)場(chǎng)的到達(dá)容量值等約束條件。使用雙流機(jī)場(chǎng)進(jìn)港航班數(shù)據(jù)對(duì)該模型進(jìn)行驗(yàn)證。對(duì)比分析先到先服務(wù)和強(qiáng)化學(xué)習(xí)模型的排序、延誤時(shí)間、延誤成本、后續(xù)航班延誤成本和獎(jiǎng)賞值。先到先服務(wù)算法的獎(jiǎng)賞函數(shù)值為3 164,強(qiáng)化學(xué)習(xí)算法的獎(jiǎng)賞函數(shù)值為2 880,強(qiáng)化學(xué)習(xí)模型更優(yōu)。模型中獎(jiǎng)懲函數(shù)的評(píng)價(jià)指標(biāo)、權(quán)重、約束條件可以根據(jù)管制工作實(shí)際情況進(jìn)行設(shè)置,該模型可以為空中交通管制人員進(jìn)行進(jìn)港航班排序提供決策支持。
[Abstract]:In order to solve the problems in real flight sequencing in the intelligent degree is not high, the inbound flights sort of reinforcement learning model. First, determine the inbound flights sort of reinforcement learning model of the state, action, agent, environment, reward function, constraint condition, Q learning. In class ranking model in strengthening port state is the entrance the arrival time of the flight, action is on flight arrival time adjustment agent on the flight arrival time is adjusted in response to environmental action, a new arrival time and the reward value is passed to the agent, the reward function considering the delay time, the economic cost, impact on the subsequent flights of the model. The flight cannot advance landing, distribution of the arrival time is not earlier than the planned arrival time, flight arrival flow cannot exceed the airport arrival capacity value as constraint conditions. The use of Shuangliu Airport inbound flight data To verify the model. A comparative analysis of first come first serve and the reinforcement learning model of sorting, delay time, delay cost, subsequent flight delay cost and reward value. First come first serve algorithm of the reward function value is 3164, a value of 2880 reward reinforcement learning algorithm, reinforcement learning model is better. The weights of evaluation indexes model, reward and punishment function, constraints can be set according to the actual situation of control, the model for air traffic control personnel arrival sequencing and scheduling decision support.
【作者單位】: 四川大學(xué)視覺(jué)合成圖形圖像技術(shù)國(guó)防重點(diǎn)學(xué)科實(shí)驗(yàn)室;
【基金】:國(guó)家空管委科研資助項(xiàng)目(GKG201403004)
【分類號(hào)】:TP181;V355
【參考文獻(xiàn)】
相關(guān)期刊論文 前6條
1 王世豪;楊紅雨;武喜萍;劉洪;;進(jìn)港航班排序優(yōu)化數(shù)學(xué)模型研究[J];四川大學(xué)學(xué)報(bào)(工程科學(xué)版);2015年06期
2 王世東;張?jiān)?張智海;魚(yú)海洋;;繁忙機(jī)場(chǎng)航班降落排序的多目標(biāo)優(yōu)化[J];交通運(yùn)輸系統(tǒng)工程與信息;2012年04期
3 王飛;徐肖豪;張靜;;終端區(qū)飛機(jī)排序的混合人工魚(yú)群算法[J];交通運(yùn)輸工程學(xué)報(bào);2008年03期
4 楊秋輝;游志勝;馮子亮;洪玫;;一種改進(jìn)的基于遺傳算法的多跑道到達(dá)飛機(jī)調(diào)度[J];四川大學(xué)學(xué)報(bào)(工程科學(xué)版);2006年02期
5 徐肖豪;李雄;;航班地面等待模型中的延誤成本分析與仿真[J];南京航空航天大學(xué)學(xué)報(bào);2006年01期
6 徐肖豪,黃寶軍;終端區(qū)飛機(jī)排序的模糊綜合評(píng)判方法研究[J];航空學(xué)報(bào);2001年03期
【共引文獻(xiàn)】
相關(guān)期刊論文 前10條
1 武喜萍;楊紅雨;楊波;;進(jìn)港航班排序強(qiáng)化學(xué)習(xí)模型研究[J];工程科學(xué)與技術(shù);2017年S2期
2 王媛;胡明華;徐冬慧;;機(jī)場(chǎng)場(chǎng)面運(yùn)行延誤特性研究[J];武漢理工大學(xué)學(xué)報(bào)(交通科學(xué)與工程版);2017年03期
3 唐志星;朱新平;夏正洪;;A-SMGCS航空器滑行時(shí)間延遲的滑行路由實(shí)時(shí)更新算法[J];科學(xué)技術(shù)與工程;2017年16期
4 羅小林;;基于進(jìn)離場(chǎng)容量轉(zhuǎn)化的航班延誤優(yōu)化研究[J];西安航空學(xué)院學(xué)報(bào);2017年03期
5 王世豪;楊紅雨;李玉貞;韓松臣;楊波;;基于精英存檔自適應(yīng)微分進(jìn)化算法的多跑道獨(dú)立進(jìn)近排序[J];工程科學(xué)與技術(shù);2017年03期
6 曾奇;;基于補(bǔ)償機(jī)制的航班時(shí)刻優(yōu)化模型[J];江蘇航空;2017年02期
7 王俊義;王興隆;;近距平行跑道航班著陸調(diào)度研究[J];航空計(jì)算技術(shù);2017年01期
8 夏正洪;;民航機(jī)場(chǎng)橋載設(shè)備投資回收期計(jì)算模型[J];中國(guó)科技論文;2016年19期
9 張書琴;姜雨;夏洪山;劉照明;;基于遺傳模擬退火算法的航班進(jìn)離場(chǎng)調(diào)度[J];航空計(jì)算技術(shù);2016年05期
10 張維杰;龍華;胡婷;邵玉斌;;改進(jìn)的遺傳算法在延誤飛機(jī)進(jìn)場(chǎng)排序中的應(yīng)用[J];信息技術(shù);2016年07期
【二級(jí)參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 沈濟(jì)南;梁芳;鄭明輝;;一種新的混合差分粒子群優(yōu)化算法及其應(yīng)用[J];四川大學(xué)學(xué)報(bào)(工程科學(xué)版);2014年06期
2 孫宏;張翔;徐杰;;應(yīng)用模擬退火算法求解飛機(jī)調(diào)度問(wèn)題[J];飛行力學(xué);2006年04期
3 李志榮;張兆寧;;基于蟻群算法的航班著陸排序[J];交通運(yùn)輸工程與信息學(xué)報(bào);2006年02期
4 楊秋輝;游志勝;馮子亮;洪玫;;一種改進(jìn)的基于遺傳算法的多跑道到達(dá)飛機(jī)調(diào)度[J];四川大學(xué)學(xué)報(bào)(工程科學(xué)版);2006年02期
5 徐肖豪;李雄;;航班地面等待模型中的延誤成本分析與仿真[J];南京航空航天大學(xué)學(xué)報(bào);2006年01期
6 李曉磊,路飛,田國(guó)會(huì),錢積新;組合優(yōu)化問(wèn)題的人工魚(yú)群算法應(yīng)用[J];山東大學(xué)學(xué)報(bào)(工學(xué)版);2004年05期
7 徐肖豪,姚源;遺傳算法在終端區(qū)飛機(jī)排序中的應(yīng)用[J];交通運(yùn)輸工程學(xué)報(bào);2004年03期
8 李曉磊,薛云燦,路飛,田國(guó)會(huì);基于人工魚(yú)群算法的參數(shù)估計(jì)方法[J];山東大學(xué)學(xué)報(bào)(工學(xué)版);2004年03期
9 張靜;2002年世界前100家航空公司經(jīng)營(yíng)狀況[J];中國(guó)民用航空;2004年01期
10 高鷹,謝勝利;基于模擬退火的粒子群優(yōu)化算法[J];計(jì)算機(jī)工程與應(yīng)用;2004年01期
【相似文獻(xiàn)】
相關(guān)期刊論文 前6條
1 于重重;吳子s,
本文編號(hào):1614331
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/1614331.html