基于強(qiáng)化學(xué)習(xí)的超參數(shù)優(yōu)化方法

發(fā)布時(shí)間：2021-05-25 12:32

　　近年來,機(jī)器學(xué)習(xí)算法廣泛應(yīng)用于多個(gè)領(lǐng)域.超參數(shù)的選擇直接影響了算法模型的性能,然而超參數(shù)優(yōu)化過程往往依賴于專業(yè)知識(shí)和長(zhǎng)期經(jīng)驗(yàn)的積累.為了解決上述問題,本文提出了一種基于強(qiáng)化學(xué)習(xí)的自動(dòng)超參數(shù)優(yōu)化方法.該方法將超參數(shù)優(yōu)化問題作為序列決策問題并建模為馬爾科夫決策過程,通過使用一個(gè)強(qiáng)化學(xué)習(xí)智能體（agent）,自動(dòng)為機(jī)器學(xué)習(xí)算法選擇超參數(shù).該智能體以最大化待優(yōu)化模型在驗(yàn)證數(shù)據(jù)集上的準(zhǔn)確率為目標(biāo),將模型在驗(yàn)證數(shù)據(jù)集上的準(zhǔn)確率作為獎(jiǎng)賞值（reward）,通過策略梯度算法訓(xùn)練智能體.為了減小訓(xùn)練過程中的方差,我們?cè)O(shè)計(jì)了數(shù)據(jù)引導(dǎo)池模塊.實(shí)驗(yàn)將隨機(jī)森林和XGBoost算法作為優(yōu)化對(duì)象,在五個(gè)數(shù)據(jù)集上與隨機(jī)搜索、貝葉斯優(yōu)化、TPE、CM-AES和SMAC五種優(yōu)化方法進(jìn)行了對(duì)比.實(shí)驗(yàn)結(jié)果顯示,本文所提出的方法在90%的優(yōu)化任務(wù)上表現(xiàn)出更優(yōu)的性能.同時(shí),我們通過執(zhí)行一系列消融實(shí)驗(yàn)驗(yàn)證了agent結(jié)構(gòu)和數(shù)據(jù)引導(dǎo)池的有效性.

【文章來源】：小型微型計(jì)算機(jī)系統(tǒng). 2020,41(04)北大核心CSCD

【文章頁數(shù)】：6 頁

【文章目錄】：
1 引言
2背景及相關(guān)工作
3 基于強(qiáng)化學(xué)習(xí)的超參數(shù)優(yōu)化方法
    3.1 整體結(jié)構(gòu)
    3.2 詳細(xì)設(shè)計(jì)
        3.2.1 Agent結(jié)構(gòu)設(shè)計(jì)
        3.2.2 Agent訓(xùn)練
        3.2.3 數(shù)據(jù)引導(dǎo)池(Boot Pool)模塊
4 實(shí)驗(yàn)結(jié)果及分析
    4.1 實(shí)驗(yàn)細(xì)節(jié)
    4.2 Agent結(jié)構(gòu)的有效性
    4.3 數(shù)據(jù)引導(dǎo)池模塊對(duì)優(yōu)化結(jié)果的影響
    4.4 對(duì)比BP-Agent方法與其他優(yōu)化方法
    4.5 討論與分析
5 結(jié)束語

本文編號(hào)：3205347

資料下載

論文發(fā)表

支付寶下載

Download by Alipay
微信下載

Download by Wechat
會(huì)員下載

Download by Member

本文鏈接：http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3205347.html

上一篇：面向礦井用風(fēng)點(diǎn)的通風(fēng)網(wǎng)絡(luò)安全分區(qū)方法研究
下一篇：基于模糊神經(jīng)網(wǎng)絡(luò)PID的低壓鑄造液面加壓控制技術(shù)研究

論文發(fā)表

·知網(wǎng)|萬方|維普|龍?jiān)磡省級(jí)|國(guó)家級(jí)|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|

天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于強(qiáng)化學(xué)習(xí)的超參數(shù)優(yōu)化方法