基于函數(shù)逼近的物流車輛路徑規(guī)劃方法及應(yīng)用研究
發(fā)布時間:2020-07-17 17:42
【摘要】:物流車輛的路徑規(guī)劃問題關(guān)系到車輛運輸成本和物流活動效率的高低,是我國物流產(chǎn)業(yè)轉(zhuǎn)型升級過程中必須解決的重要問題。信息技術(shù)和通信技術(shù)的快速發(fā)展和廣泛應(yīng)用、新型的物流形式如電商生鮮物流等都促進了實時動態(tài)路徑規(guī)劃方法的發(fā)展和應(yīng)用。本文從當(dāng)前物流活動的新形勢出發(fā),以解決隨機多車輛路徑規(guī)劃問題的維數(shù)災(zāi)為目標(biāo),以近似動態(tài)規(guī)劃理論和函數(shù)逼近技術(shù)為工具,針對物流活動中應(yīng)用普遍但求解困難的帶隨機需求和服務(wù)期限的多車輛路徑規(guī)劃問題進行建模和算法研究。主要研究內(nèi)容如下: 首先,將帶隨機需求和服務(wù)期限的多車輛路徑規(guī)劃問題建模為大規(guī)模馬爾可夫決策過程。模型以最大化期望服務(wù)需求為目標(biāo)函數(shù),使用車輛狀態(tài)和客戶狀態(tài)記錄決策所需信息。 其次,在建模的基礎(chǔ)上提出了兩個在線學(xué)習(xí)算法:基于線性函數(shù)逼近的近似策略迭代算法(RLSTD-API)和基于基函數(shù)優(yōu)化的近似值迭代算法(CEO-AVI)。RLSTD-API符合近似動態(tài)規(guī)劃領(lǐng)域中的近似策略迭代框架,其在以k-means聚類方法獲取狀態(tài)重要特征的基礎(chǔ)上使用遞歸最小二乘時間差分進行策略評估。CEO-AVI是針對缺乏先驗知識指導(dǎo)時人工設(shè)計基函數(shù)很難得到最佳近似效果這一問題,通過結(jié)合強化學(xué)習(xí)領(lǐng)域中的離策略學(xué)習(xí)方法和交叉熵優(yōu)化方法提出的基于基函數(shù)優(yōu)化的近似值迭代算法。 最后,通過在標(biāo)準(zhǔn)算例上進行實驗對比和參數(shù)分析,驗證了兩種算法的有效性,并分析了其適用范圍。
【學(xué)位授予單位】:蘇州大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2014
【分類號】:U492.22
本文編號:2759736
【學(xué)位授予單位】:蘇州大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2014
【分類號】:U492.22
【參考文獻】
相關(guān)期刊論文 前3條
1 吳云志;樂毅;王超;張友華;;蟻群算法在物流路徑優(yōu)化中的應(yīng)用及仿真[J];合肥工業(yè)大學(xué)學(xué)報(自然科學(xué)版);2009年02期
2 李豹;程文娟;周雷;唐昊;;Rollout及其并行求解算法在多類商品庫存控制中的應(yīng)用[J];系統(tǒng)仿真學(xué)報;2007年17期
3 于濱;靳鵬歡;楊忠振;;兩階段啟發(fā)式算法求解帶時間窗的多中心車輛路徑問題[J];系統(tǒng)工程理論與實踐;2012年08期
本文編號:2759736
本文鏈接:http://sikaile.net/guanlilunwen/wuliuguanlilunwen/2759736.html
最近更新
教材專著