天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 論文百科 > 資源利用論文 >

基于深度強(qiáng)化學(xué)習(xí)的GWLF模型優(yōu)化研究

發(fā)布時(shí)間:2023-06-02 22:00
  GWLF模型被認(rèn)為是評(píng)價(jià)流域污染的一種有效的流域負(fù)荷模型。該模型通過(guò)輸入氣象數(shù)據(jù),通過(guò)數(shù)學(xué)方式模擬整個(gè)過(guò)程,最終進(jìn)行流域水文預(yù)測(cè)。不同的GWLF模型具有不同的類(lèi)型參數(shù),參數(shù)的數(shù)量、范圍和精度不同,具有數(shù)量大、范圍廣、精度不確定性等特點(diǎn)。通過(guò)優(yōu)化這些參數(shù)能夠有效提高預(yù)測(cè)的效果和效率。然而,控制這些參數(shù)需要事先儲(chǔ)備的相關(guān)專(zhuān)業(yè)知識(shí)和大量的、幾乎詳盡的測(cè)試。GWLF模型參數(shù)優(yōu)化所提出的挑戰(zhàn)促使了本文的研究。本文提出了一種基于深度強(qiáng)化學(xué)習(xí)(Deep Reinforcement Learning)的智能體參數(shù)優(yōu)化模型,用于解決多參數(shù)輸入,并找到參數(shù)值的最佳組合的問(wèn)題。本文使用了在離散動(dòng)作空間中表現(xiàn)優(yōu)異的深度強(qiáng)化學(xué)習(xí)算法DQN作為基礎(chǔ)算法,提出了狀態(tài)空間、動(dòng)作空間和獎(jiǎng)勵(lì)函數(shù)的建模方法,并提出了更加有效的參數(shù)初始化方法,以及在優(yōu)化過(guò)程中自動(dòng)修改調(diào)節(jié)步長(zhǎng)的新策略。該模型基于神經(jīng)網(wǎng)絡(luò)的擬合能力和強(qiáng)化學(xué)習(xí)的決策能力,使用涇河流域的GWLF模型以及真實(shí)的氣象數(shù)據(jù)進(jìn)行的實(shí)驗(yàn)表明,該模型可以在較短的訓(xùn)練時(shí)間內(nèi)找到NSE大于0.8的值,比其他優(yōu)化相同GWLF模型的算法精度更高且耗時(shí)更少。最后,通過(guò)簡(jiǎn)單的實(shí)驗(yàn)驗(yàn)證了該...

【文章頁(yè)數(shù)】:65 頁(yè)

【學(xué)位級(jí)別】:碩士

【文章目錄】:
摘要
ABSTRACT
第1章 緒論
    1.1 課題來(lái)源
    1.2 國(guó)內(nèi)外研究現(xiàn)狀
        1.2.1 GWLF模型調(diào)優(yōu)
        1.2.2 黑盒優(yōu)化問(wèn)題研究
        1.2.3 基于強(qiáng)化學(xué)習(xí)的優(yōu)化研究
    1.3 本文研究目的和主要內(nèi)容
    1.4 文章組織結(jié)構(gòu)
第2章 相關(guān)技術(shù)和方法介紹
    2.1 GWLF模型參數(shù)優(yōu)化
    2.2 深度強(qiáng)化學(xué)習(xí)
        2.2.1 強(qiáng)化學(xué)習(xí)
        2.2.2 Deep Q Network
        2.2.3 DQN的改進(jìn)算法
    2.3 布谷鳥(niǎo)搜索算法
    2.4 本章小結(jié)
第3章 基于DQN的GWLF調(diào)參模型設(shè)計(jì)
    3.1 調(diào)參模型的框架設(shè)計(jì)
    3.2 GWLF環(huán)境模型的設(shè)計(jì)
        3.2.1 狀態(tài)空間和動(dòng)作空間
        3.2.2 獎(jiǎng)勵(lì)函數(shù)
    3.3 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的設(shè)計(jì)
    3.4 參數(shù)調(diào)節(jié)過(guò)程的設(shè)計(jì)
        3.4.1 參數(shù)初始化方法
        3.4.2 步長(zhǎng)調(diào)節(jié)方法
    3.5 本章小結(jié)
第4章 模型的實(shí)現(xiàn)與優(yōu)化
    4.1 GWLF模型參數(shù)優(yōu)化算法的實(shí)現(xiàn)
        4.1.1 基于Gym的環(huán)境模型結(jié)構(gòu)介紹
        4.1.2 調(diào)參算法實(shí)現(xiàn)
    4.2 GWLF模型參數(shù)和數(shù)據(jù)集介紹
    4.3 調(diào)參模型超參數(shù)整定
    4.4 本章小結(jié)
第5章 實(shí)驗(yàn)與結(jié)果分析
    5.1 GO-DQN算法與其他優(yōu)化算法的對(duì)比
    5.2 結(jié)合布谷鳥(niǎo)搜索算法
    5.3 改進(jìn)優(yōu)化后的GO-DQN*算法
    5.4 模型的泛化能力試驗(yàn)
        5.4.1 預(yù)訓(xùn)練模型的使用
        5.4.2 其他GWLF模型
        5.4.3 其他參數(shù)優(yōu)化問(wèn)題
    5.5 本章小結(jié)
第6章 總結(jié)與展望
    6.1 總結(jié)
    6.2 展望
參考文獻(xiàn)
附錄
發(fā)表論文和參加科研情況說(shuō)明
致謝



本文編號(hào):3828101

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/wenshubaike/qiuzhijiqiao/3828101.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)b73e0***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com