一種利用優(yōu)先經(jīng)驗回放深度Q-Learning的頻譜接入算法
發(fā)布時間:2021-03-03 04:59
針對認知無線傳感器網(wǎng)絡(luò)中頻譜接入算法的頻譜利用率不高、重要經(jīng)驗利用率不足、收斂速度慢等問題,提出了一種采用優(yōu)先經(jīng)驗回放雙深度Q-Learning的動態(tài)頻譜接入算法。該算法的次用戶對經(jīng)驗庫進行抽樣時,采用基于優(yōu)先級抽樣的方式,以打破樣本相關(guān)性并充分利用重要的經(jīng)驗樣本,并采用一種非排序批量刪除方式刪除經(jīng)驗庫的無用經(jīng)驗樣本,以降低能量開銷。仿真結(jié)果表明,該算法與采用雙深度Q-Learning的頻譜接入算法相比提高了收斂速度;與傳統(tǒng)隨機頻譜接入算法相比,其阻塞概率降低了6%~10%,吞吐量提高了18%~20%,提高了系統(tǒng)的性能。
【文章來源】:電訊技術(shù). 2020,60(05)北大核心
【文章頁數(shù)】:7 頁
【部分圖文】:
PU信道流量模型及信道質(zhì)量模型
本文采用一種基于累積求和的二叉樹結(jié)構(gòu)作為經(jīng)驗庫的存儲結(jié)構(gòu)。如圖2所示,每一個底層的葉子節(jié)點存儲一個樣本的數(shù)據(jù)和優(yōu)先級,而其余節(jié)點不存儲樣本數(shù)據(jù),只存儲左與右兒子節(jié)點的優(yōu)先級求和結(jié)果。每一個樣本的優(yōu)先級采用數(shù)字區(qū)間表示,樣本的優(yōu)先級越高,則其對應(yīng)的數(shù)字區(qū)間越長。為了避免δ小的經(jīng)驗樣本沒有進行回放就已經(jīng)被刪除,本文采取了貪婪算法進行經(jīng)驗庫的抽樣操作。令Eer為[0,1]的精度為10-4的隨機數(shù),為(0,1)區(qū)間的一個固定常數(shù),若,則在所有樣本中隨機抽取m個經(jīng)驗樣本;若,則首先將總數(shù)字區(qū)間分成m個相等大小的區(qū)間,在每個區(qū)間內(nèi)隨機抽取一個數(shù)字,并在經(jīng)驗庫的累積求和二叉樹中從根節(jié)點開始查找該數(shù)字,回放該數(shù)字對應(yīng)的經(jīng)驗樣本。因此,經(jīng)驗庫中樣本k被回放的概率Per(k)可以通過公式(11)進行計算:
綜上所述,本文提出的PER-DDQN算法將隨機的初始信道狀態(tài)作為Q神經(jīng)網(wǎng)絡(luò)的輸入,根據(jù)輸出的Q值指導(dǎo)SU選擇信道執(zhí)行感知接入,將執(zhí)行的經(jīng)驗數(shù)據(jù)保存在經(jīng)驗庫中;然后,根據(jù)經(jīng)驗庫的一小批量數(shù)據(jù)對神經(jīng)網(wǎng)絡(luò)參數(shù)進行計算與更新,并將感知結(jié)果作為神經(jīng)網(wǎng)絡(luò)下一個時隙的輸入,通過不斷地訓(xùn)練學(xué)習(xí),能夠降低隨機選擇信道的盲目性,極大地提高感知的成功概率,使信道質(zhì)量好并且空閑的信道優(yōu)先被利用,有助于提高頻譜效率。3 仿真與分析
【參考文獻】:
期刊論文
[1]基于深度學(xué)習(xí)的跑道前視紅外圖像輪廓線提取[J]. 袁雷,程岳,牛文生,羅午陽. 電訊技術(shù). 2019(02)
[2]基于頻譜空隙利用率的頻譜感知時間優(yōu)化[J]. 沈一豪,李莉,裴仁超,羅漢文. 上海師范大學(xué)學(xué)報(自然科學(xué)版). 2017(01)
[3]基于網(wǎng)絡(luò)編碼的衰落信道頻譜感知算法[J]. 鄭詩庭,蒙云番,邢杰,萬海斌,覃團發(fā). 電訊技術(shù). 2015(09)
[4]第五代移動通信系統(tǒng)5G標準化展望與關(guān)鍵技術(shù)研究[J]. 周一青,潘振崗,翟國偉,田霖. 數(shù)據(jù)采集與處理. 2015(04)
本文編號:3060653
【文章來源】:電訊技術(shù). 2020,60(05)北大核心
【文章頁數(shù)】:7 頁
【部分圖文】:
PU信道流量模型及信道質(zhì)量模型
本文采用一種基于累積求和的二叉樹結(jié)構(gòu)作為經(jīng)驗庫的存儲結(jié)構(gòu)。如圖2所示,每一個底層的葉子節(jié)點存儲一個樣本的數(shù)據(jù)和優(yōu)先級,而其余節(jié)點不存儲樣本數(shù)據(jù),只存儲左與右兒子節(jié)點的優(yōu)先級求和結(jié)果。每一個樣本的優(yōu)先級采用數(shù)字區(qū)間表示,樣本的優(yōu)先級越高,則其對應(yīng)的數(shù)字區(qū)間越長。為了避免δ小的經(jīng)驗樣本沒有進行回放就已經(jīng)被刪除,本文采取了貪婪算法進行經(jīng)驗庫的抽樣操作。令Eer為[0,1]的精度為10-4的隨機數(shù),為(0,1)區(qū)間的一個固定常數(shù),若,則在所有樣本中隨機抽取m個經(jīng)驗樣本;若,則首先將總數(shù)字區(qū)間分成m個相等大小的區(qū)間,在每個區(qū)間內(nèi)隨機抽取一個數(shù)字,并在經(jīng)驗庫的累積求和二叉樹中從根節(jié)點開始查找該數(shù)字,回放該數(shù)字對應(yīng)的經(jīng)驗樣本。因此,經(jīng)驗庫中樣本k被回放的概率Per(k)可以通過公式(11)進行計算:
綜上所述,本文提出的PER-DDQN算法將隨機的初始信道狀態(tài)作為Q神經(jīng)網(wǎng)絡(luò)的輸入,根據(jù)輸出的Q值指導(dǎo)SU選擇信道執(zhí)行感知接入,將執(zhí)行的經(jīng)驗數(shù)據(jù)保存在經(jīng)驗庫中;然后,根據(jù)經(jīng)驗庫的一小批量數(shù)據(jù)對神經(jīng)網(wǎng)絡(luò)參數(shù)進行計算與更新,并將感知結(jié)果作為神經(jīng)網(wǎng)絡(luò)下一個時隙的輸入,通過不斷地訓(xùn)練學(xué)習(xí),能夠降低隨機選擇信道的盲目性,極大地提高感知的成功概率,使信道質(zhì)量好并且空閑的信道優(yōu)先被利用,有助于提高頻譜效率。3 仿真與分析
【參考文獻】:
期刊論文
[1]基于深度學(xué)習(xí)的跑道前視紅外圖像輪廓線提取[J]. 袁雷,程岳,牛文生,羅午陽. 電訊技術(shù). 2019(02)
[2]基于頻譜空隙利用率的頻譜感知時間優(yōu)化[J]. 沈一豪,李莉,裴仁超,羅漢文. 上海師范大學(xué)學(xué)報(自然科學(xué)版). 2017(01)
[3]基于網(wǎng)絡(luò)編碼的衰落信道頻譜感知算法[J]. 鄭詩庭,蒙云番,邢杰,萬海斌,覃團發(fā). 電訊技術(shù). 2015(09)
[4]第五代移動通信系統(tǒng)5G標準化展望與關(guān)鍵技術(shù)研究[J]. 周一青,潘振崗,翟國偉,田霖. 數(shù)據(jù)采集與處理. 2015(04)
本文編號:3060653
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/3060653.html
最近更新
教材專著