基于啟發(fā)式強化學習的動態(tài)CRE偏置選擇算法
發(fā)布時間:2023-07-01 13:11
隨著通信用戶數量的不斷增長,低功率基站逐漸出現負載不均衡問題,小區(qū)邊緣用戶受到的干擾逐步增加,從而導致整個小區(qū)的通信質量降低。為解決該問題,針對雙層異構網絡場景,提出一種基于啟發(fā)函數進行小區(qū)范圍擴展(CRE)偏置值動態(tài)選擇的HSARSA(λ)算法。利用啟發(fā)函數改進強化學習中的SARSA(λ)算法,通過該算法尋找出最優(yōu)CRE偏置值,以緩解宏基站高熱點負載壓力并提高網絡容量。仿真結果表明,相比SARSA(λ)和Q-Learning算法,HSARSA(λ)算法的邊緣用戶吞吐量分別提高約7%和12%,系統(tǒng)能效分別提高約11%與13%,系統(tǒng)通信質量得到較大提升。
【文章頁數】:7 頁
【文章目錄】:
0 概述
1 系統(tǒng)模型與偏置方法
1.1 系統(tǒng)模型
1.2 CRE偏置方法
2 基于HSARSA(λ)算法的CRE偏置選擇
2.1 強化學習與SARSA(λ)算法
2.2 HSARSA(λ)算法
2.2.1 啟發(fā)函數
2.2.2 更新公式
2.2.3 算法流程
3 實驗結果與分析
4 結束語
本文編號:3836310
【文章頁數】:7 頁
【文章目錄】:
0 概述
1 系統(tǒng)模型與偏置方法
1.1 系統(tǒng)模型
1.2 CRE偏置方法
2 基于HSARSA(λ)算法的CRE偏置選擇
2.1 強化學習與SARSA(λ)算法
2.2 HSARSA(λ)算法
2.2.1 啟發(fā)函數
2.2.2 更新公式
2.2.3 算法流程
3 實驗結果與分析
4 結束語
本文編號:3836310
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/3836310.html