天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 自動化論文 >

強(qiáng)化學(xué)習(xí)及其在智能倉儲中的應(yīng)用研究

發(fā)布時間:2017-04-11 21:23

  本文關(guān)鍵詞:強(qiáng)化學(xué)習(xí)及其在智能倉儲中的應(yīng)用研究,由筆耕文化傳播整理發(fā)布。


【摘要】:智能倉儲是物流行業(yè)不可或缺的重要環(huán)節(jié),高效靈敏的智能倉儲對提高倉儲的工作效率具有至關(guān)重要的作用。本文主要探討強(qiáng)化學(xué)習(xí)及其在智能倉儲中的應(yīng)用研究。采用強(qiáng)化學(xué)習(xí)機(jī)制的智能體不需要任何先驗知識,智能體不會被告知采取何種行為,而是通過與環(huán)境“試錯”的方式進(jìn)行自主學(xué)習(xí),學(xué)習(xí)最優(yōu)行為策略。為了提高智能倉儲系統(tǒng)的整體效率,本文提出了一種新的組合解決方案。該方案分別采用遺傳算法進(jìn)行機(jī)器人之間的任務(wù)分配,運用強(qiáng)化學(xué)習(xí)進(jìn)行路徑規(guī)劃。強(qiáng)化學(xué)習(xí)對于未知環(huán)境下的路徑規(guī)劃問題具有很強(qiáng)的自主學(xué)習(xí)能力。遺傳算法是一種通過模擬自然界生物進(jìn)化的方式來求解問題的隨機(jī)搜索方法,它使用簡單的編碼技術(shù)和繁殖機(jī)制來表示復(fù)雜的現(xiàn)象。采用遺傳算法進(jìn)行多機(jī)器人之間的任務(wù)分配,能獲得非常好的效果。本文將這兩種算法進(jìn)行組合使用,為智能倉儲的經(jīng)典問題路徑規(guī)劃和任務(wù)分配提供了可行方案。仿真實驗將其與相同領(lǐng)域的先進(jìn)算法進(jìn)行比較,結(jié)果證明,這個組合方法顯著減少了機(jī)器人執(zhí)行任務(wù)的總時間,有效地提高了倉儲系統(tǒng)的運行效率。在多智能體強(qiáng)化學(xué)習(xí)系統(tǒng)中,環(huán)境在所有智能體的聯(lián)合動作下進(jìn)行狀態(tài)的遷移。智能體在選擇動作時,可能會受到其他智能體的影響。在這種情況下,研究環(huán)境的聯(lián)合狀態(tài)和智能體的聯(lián)合動作是非常必要的。多智能體強(qiáng)化學(xué)習(xí)系統(tǒng)具有開放性和動態(tài)性,為了降低系統(tǒng)的計算復(fù)雜度,提高學(xué)習(xí)效率,本文采用基于稀疏交互的CQ-learning算法來求解智能倉儲中多機(jī)器人路徑規(guī)劃問題。同時,在機(jī)器人學(xué)習(xí)過程中,引入遷移學(xué)習(xí)機(jī)制,即利用先前機(jī)器人已經(jīng)學(xué)到的知識來促進(jìn)另一個機(jī)器人的學(xué)習(xí)過程。由于獲得了環(huán)境信息,機(jī)器人學(xué)習(xí)時能有效提高初始階段的學(xué)習(xí)效率,從而加快算法的收斂速度。仿真實驗證明,改進(jìn)的CQ-learning算法在多機(jī)器人路徑規(guī)劃中是有效的。
【關(guān)鍵詞】:強(qiáng)化學(xué)習(xí) 智能倉儲 路徑規(guī)劃 任務(wù)分配 稀疏交互 遷移學(xué)習(xí)
【學(xué)位授予單位】:南京大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP18
【目錄】:
  • 摘要5-7
  • ABSTRACT7-11
  • 第一章 緒論11-17
  • 1.1 研究背景11-12
  • 1.2 智能倉儲研究現(xiàn)狀12-13
  • 1.3 強(qiáng)化學(xué)習(xí)研究現(xiàn)狀13-15
  • 1.4 本文研究的主要內(nèi)容15
  • 1.5 論文組織結(jié)構(gòu)15-17
  • 第二章 強(qiáng)化學(xué)習(xí)17-24
  • 2.1 強(qiáng)化學(xué)習(xí)模型與基本要素17-19
  • 2.2 強(qiáng)化學(xué)習(xí)的數(shù)學(xué)模型19
  • 2.3 典型的強(qiáng)化學(xué)習(xí)算法19-22
  • 2.3.1 TD算法20
  • 2.3.2 Q-learning算法20-21
  • 2.3.3 Sarsa算法21-22
  • 2.4 本章小結(jié)22-24
  • 第三章 智能倉儲中的路徑規(guī)劃和任務(wù)分配24-44
  • 3.1 問題建模24-27
  • 3.2 算法結(jié)構(gòu)27-28
  • 3.3 基于單智能體強(qiáng)化學(xué)習(xí)的路徑規(guī)劃28-31
  • 3.3.1 獎懲函數(shù)29-30
  • 3.3.2 值函數(shù)30-31
  • 3.3.3 動作選擇策略31
  • 3.4 基于遺傳算法的多機(jī)器人任務(wù)分配31-37
  • 3.4.1 編碼33-34
  • 3.4.2 適應(yīng)度函數(shù)設(shè)計34-35
  • 3.4.3 遺傳操作35-37
  • 3.5 仿真實驗與分析37-43
  • 3.5.1 參數(shù)設(shè)置38
  • 3.5.2 實驗結(jié)果與分析38-43
  • 3.6 本章小結(jié)43-44
  • 第四章 基于多智能體強(qiáng)化學(xué)習(xí)的路徑規(guī)劃44-56
  • 4.1 多智能體強(qiáng)化學(xué)習(xí)44-45
  • 4.2 多移動機(jī)器人路徑規(guī)劃45-46
  • 4.3 基于CQ-learning的多機(jī)器人路徑規(guī)劃46-50
  • 4.3.1 稀疏交互46-47
  • 4.3.2 CQ-learning算法47-49
  • 4.3.3 遷移學(xué)習(xí)49-50
  • 4.4 仿真實驗與分析50-55
  • 4.4.1 參數(shù)設(shè)置及評價標(biāo)準(zhǔn)50-51
  • 4.4.2 實驗結(jié)果與分析51-55
  • 4.5 本章小結(jié)55-56
  • 第五章 總結(jié)與展望56-58
  • 5.1 本文主要工作總結(jié)56
  • 5.2 工作展望56-58
  • 參考文獻(xiàn)58-64
  • 致謝64-65
  • 攻讀碩士學(xué)位發(fā)表的論文65-66

【參考文獻(xiàn)】

中國期刊全文數(shù)據(jù)庫 前5條

1 TARN Tzyh-Jong;;Hybrid MDP based integrated hierarchical Q-learning[J];Science China(Information Sciences);2011年11期

2 ;Path Planning Approach in Unknown Environment[J];International Journal of Automation & Computing;2010年03期

3 范波,潘泉,張洪才;一種基于分布式強(qiáng)化學(xué)習(xí)的多智能體協(xié)調(diào)方法[J];計算機(jī)仿真;2005年06期

4 高陽,周志華,何佳洲,陳世福;基于Markov對策的多Agent強(qiáng)化學(xué)習(xí)模型及算法研究[J];計算機(jī)研究與發(fā)展;2000年03期

5 張汝波,周寧,顧國昌,張國印;基于強(qiáng)化學(xué)習(xí)的智能機(jī)器人避碰方法研究[J];機(jī)器人;1999年03期

中國博士學(xué)位論文全文數(shù)據(jù)庫 前1條

1 陳春林;基于強(qiáng)化學(xué)習(xí)的移動機(jī)器人自主學(xué)習(xí)及導(dǎo)航控制[D];中國科學(xué)技術(shù)大學(xué);2006年

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前1條

1 許亞;基于強(qiáng)化學(xué)習(xí)的移動機(jī)器人路徑規(guī)劃研究[D];山東大學(xué);2013年


  本文關(guān)鍵詞:強(qiáng)化學(xué)習(xí)及其在智能倉儲中的應(yīng)用研究,,由筆耕文化傳播整理發(fā)布。



本文編號:300018

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/300018.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶93e39***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com