基于啟發(fā)式強(qiáng)化學(xué)習(xí)的動(dòng)態(tài)CRE偏置選擇算法
發(fā)布時(shí)間:2023-07-01 13:11
隨著通信用戶數(shù)量的不斷增長(zhǎng),低功率基站逐漸出現(xiàn)負(fù)載不均衡問題,小區(qū)邊緣用戶受到的干擾逐步增加,從而導(dǎo)致整個(gè)小區(qū)的通信質(zhì)量降低。為解決該問題,針對(duì)雙層異構(gòu)網(wǎng)絡(luò)場(chǎng)景,提出一種基于啟發(fā)函數(shù)進(jìn)行小區(qū)范圍擴(kuò)展(CRE)偏置值動(dòng)態(tài)選擇的HSARSA(λ)算法。利用啟發(fā)函數(shù)改進(jìn)強(qiáng)化學(xué)習(xí)中的SARSA(λ)算法,通過該算法尋找出最優(yōu)CRE偏置值,以緩解宏基站高熱點(diǎn)負(fù)載壓力并提高網(wǎng)絡(luò)容量。仿真結(jié)果表明,相比SARSA(λ)和Q-Learning算法,HSARSA(λ)算法的邊緣用戶吞吐量分別提高約7%和12%,系統(tǒng)能效分別提高約11%與13%,系統(tǒng)通信質(zhì)量得到較大提升。
【文章頁(yè)數(shù)】:7 頁(yè)
【文章目錄】:
0 概述
1 系統(tǒng)模型與偏置方法
1.1 系統(tǒng)模型
1.2 CRE偏置方法
2 基于HSARSA(λ)算法的CRE偏置選擇
2.1 強(qiáng)化學(xué)習(xí)與SARSA(λ)算法
2.2 HSARSA(λ)算法
2.2.1 啟發(fā)函數(shù)
2.2.2 更新公式
2.2.3 算法流程
3 實(shí)驗(yàn)結(jié)果與分析
4 結(jié)束語(yǔ)
本文編號(hào):3836310
【文章頁(yè)數(shù)】:7 頁(yè)
【文章目錄】:
0 概述
1 系統(tǒng)模型與偏置方法
1.1 系統(tǒng)模型
1.2 CRE偏置方法
2 基于HSARSA(λ)算法的CRE偏置選擇
2.1 強(qiáng)化學(xué)習(xí)與SARSA(λ)算法
2.2 HSARSA(λ)算法
2.2.1 啟發(fā)函數(shù)
2.2.2 更新公式
2.2.3 算法流程
3 實(shí)驗(yàn)結(jié)果與分析
4 結(jié)束語(yǔ)
本文編號(hào):3836310
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/3836310.html
最近更新
教材專著