基于強(qiáng)化學(xué)習(xí)的模型選擇和超參數(shù)優(yōu)化
發(fā)布時(shí)間:2021-08-07 15:41
隨著機(jī)器學(xué)習(xí)技術(shù)的不斷發(fā)展,機(jī)器學(xué)習(xí)算法種類的增多以及模型復(fù)雜度提高,造成了實(shí)踐應(yīng)用中的兩大難題:算法模型選擇及模型超參數(shù)優(yōu)化。為了實(shí)現(xiàn)模型選擇和超參數(shù)優(yōu)化的自動(dòng)處理,該文提出了一種基于深度強(qiáng)化學(xué)習(xí)的優(yōu)化方法。利用長(zhǎng)短期記憶(LSTM)網(wǎng)絡(luò)構(gòu)建一個(gè)智能體(Agent),自動(dòng)選擇機(jī)器學(xué)習(xí)算法模型及對(duì)應(yīng)的超參數(shù)組合。該智能體以最大化機(jī)器學(xué)習(xí)模型在驗(yàn)證數(shù)據(jù)集上的準(zhǔn)確率為目標(biāo),利用所選擇的模型在驗(yàn)證數(shù)據(jù)集上的準(zhǔn)確率作為獎(jiǎng)賞值(reward),通過強(qiáng)化學(xué)習(xí)算法不斷學(xué)習(xí)直到找到最優(yōu)的模型以及超參數(shù)組合。為了驗(yàn)證該方法的可行性及性能,在UCI標(biāo)準(zhǔn)數(shù)據(jù)集上將其與傳統(tǒng)優(yōu)化方法中基于樹狀結(jié)構(gòu)Parzen的估計(jì)方法和隨機(jī)搜索方法進(jìn)行比較。多次實(shí)驗(yàn)結(jié)果證明該優(yōu)化方法在穩(wěn)定性、時(shí)間效率、準(zhǔn)確度方面均具有優(yōu)勢(shì)。
【文章來源】:電子科技大學(xué)學(xué)報(bào). 2020,49(02)北大核心EICSCD
【文章頁數(shù)】:7 頁
本文編號(hào):3328070
【文章來源】:電子科技大學(xué)學(xué)報(bào). 2020,49(02)北大核心EICSCD
【文章頁數(shù)】:7 頁
本文編號(hào):3328070
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3328070.html
最近更新
教材專著