基于強(qiáng)化學(xué)習(xí)的定向無(wú)線通信網(wǎng)絡(luò)抗干擾資源調(diào)度算法
發(fā)布時(shí)間:2022-01-06 03:44
為了在無(wú)線網(wǎng)絡(luò)中進(jìn)行高效的鏈路資源調(diào)度、減小網(wǎng)絡(luò)干擾、提高網(wǎng)絡(luò)容量,提出了一種利用回溯天線并考慮干擾環(huán)境的鏈路資源分布式智能調(diào)度算法.首先,結(jié)合通信的路徑損耗模型設(shè)計(jì)卷積核,對(duì)節(jié)點(diǎn)密度矩陣進(jìn)行卷積來(lái)衡量干擾鏈路強(qiáng)度,從而避免對(duì)所有干擾鏈路進(jìn)行信道估計(jì)產(chǎn)生巨大的計(jì)算代價(jià);然后,結(jié)合強(qiáng)化學(xué)習(xí)的思想設(shè)計(jì)了與通信環(huán)境交互的鏈路調(diào)度學(xué)習(xí)模型,每個(gè)鏈路利用神經(jīng)網(wǎng)絡(luò)進(jìn)行獨(dú)立的訓(xùn)練,將訓(xùn)練所得的決策結(jié)果反饋到環(huán)境中進(jìn)行狀態(tài)更新,模型在不斷更新的環(huán)境中迭代來(lái)學(xué)習(xí)最優(yōu)的調(diào)度策略.該方法能分布式的運(yùn)行,可有效衡量無(wú)線網(wǎng)絡(luò)中的鏈路干擾強(qiáng)度,結(jié)合衡量結(jié)果進(jìn)行高效的鏈路資源分布式調(diào)度,從而最大化網(wǎng)絡(luò)容量.仿真結(jié)果驗(yàn)證了該調(diào)度算法無(wú)論是在算法迭代收斂還是網(wǎng)絡(luò)容量性能上都能很好地逼近全局的調(diào)度算法,達(dá)到全局算法最優(yōu)結(jié)果的92%~100%.
【文章來(lái)源】:電波科學(xué)學(xué)報(bào). 2020,35(04)北大核心CSCD
【文章頁(yè)數(shù)】:11 頁(yè)
【部分圖文】:
強(qiáng)化學(xué)習(xí)原理框圖
本文設(shè)計(jì)的網(wǎng)絡(luò)鏈路分布式調(diào)度模型如圖3所示. 該模型將各個(gè)定向傳輸鏈路看成獨(dú)立的算法執(zhí)行體,各個(gè)執(zhí)行體在感知得到的通信干擾環(huán)境下獨(dú)立地進(jìn)行智能決策. 當(dāng)鏈路決策完成后,將決策結(jié)果反饋給自身鏈路來(lái)進(jìn)行環(huán)境更新. 各個(gè)鏈路在下一次迭代中,會(huì)根據(jù)更新的環(huán)境和自身決策帶來(lái)的獎(jiǎng)勵(lì)來(lái)進(jìn)行新一輪的智能決策,整個(gè)網(wǎng)絡(luò)在不斷迭代過(guò)程中學(xué)習(xí)最優(yōu)的鏈路調(diào)度策略.1.2 數(shù)學(xué)模型
在定向傳輸中,假設(shè)采用具有4個(gè)方向的天線定向傳輸模型. 如圖4所示,將發(fā)射節(jié)點(diǎn)周?chē)确譃?個(gè)波束方向,按順時(shí)針?lè)较驅(qū)Σㄊ幪?hào). 通信時(shí)選取對(duì)準(zhǔn)接收節(jié)點(diǎn)的定向波束進(jìn)行數(shù)據(jù)傳輸. 當(dāng)鏈路j在進(jìn)行定向傳輸時(shí),鏈路i的接收節(jié)點(diǎn)Di若在其波束覆蓋范圍內(nèi),則會(huì)受到干擾,且其干擾強(qiáng)度取決于d(Sj,Di).本文的設(shè)計(jì)目標(biāo)是僅利用節(jié)點(diǎn)位置信息,在考慮網(wǎng)絡(luò)定向干擾強(qiáng)度的情況下,通過(guò)決策各鏈路是否激活來(lái)最大化網(wǎng)絡(luò)容量,即
【參考文獻(xiàn)】:
期刊論文
[1]高密度場(chǎng)景下D2D通信干擾協(xié)調(diào)的方法[J]. 李校林,唐虹,李同會(huì),陳永麗. 計(jì)算機(jī)工程與設(shè)計(jì). 2019(02)
本文編號(hào):3571662
【文章來(lái)源】:電波科學(xué)學(xué)報(bào). 2020,35(04)北大核心CSCD
【文章頁(yè)數(shù)】:11 頁(yè)
【部分圖文】:
強(qiáng)化學(xué)習(xí)原理框圖
本文設(shè)計(jì)的網(wǎng)絡(luò)鏈路分布式調(diào)度模型如圖3所示. 該模型將各個(gè)定向傳輸鏈路看成獨(dú)立的算法執(zhí)行體,各個(gè)執(zhí)行體在感知得到的通信干擾環(huán)境下獨(dú)立地進(jìn)行智能決策. 當(dāng)鏈路決策完成后,將決策結(jié)果反饋給自身鏈路來(lái)進(jìn)行環(huán)境更新. 各個(gè)鏈路在下一次迭代中,會(huì)根據(jù)更新的環(huán)境和自身決策帶來(lái)的獎(jiǎng)勵(lì)來(lái)進(jìn)行新一輪的智能決策,整個(gè)網(wǎng)絡(luò)在不斷迭代過(guò)程中學(xué)習(xí)最優(yōu)的鏈路調(diào)度策略.1.2 數(shù)學(xué)模型
在定向傳輸中,假設(shè)采用具有4個(gè)方向的天線定向傳輸模型. 如圖4所示,將發(fā)射節(jié)點(diǎn)周?chē)确譃?個(gè)波束方向,按順時(shí)針?lè)较驅(qū)Σㄊ幪?hào). 通信時(shí)選取對(duì)準(zhǔn)接收節(jié)點(diǎn)的定向波束進(jìn)行數(shù)據(jù)傳輸. 當(dāng)鏈路j在進(jìn)行定向傳輸時(shí),鏈路i的接收節(jié)點(diǎn)Di若在其波束覆蓋范圍內(nèi),則會(huì)受到干擾,且其干擾強(qiáng)度取決于d(Sj,Di).本文的設(shè)計(jì)目標(biāo)是僅利用節(jié)點(diǎn)位置信息,在考慮網(wǎng)絡(luò)定向干擾強(qiáng)度的情況下,通過(guò)決策各鏈路是否激活來(lái)最大化網(wǎng)絡(luò)容量,即
【參考文獻(xiàn)】:
期刊論文
[1]高密度場(chǎng)景下D2D通信干擾協(xié)調(diào)的方法[J]. 李校林,唐虹,李同會(huì),陳永麗. 計(jì)算機(jī)工程與設(shè)計(jì). 2019(02)
本文編號(hào):3571662
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/3571662.html
最近更新
教材專(zhuān)著