基于深度強(qiáng)化學(xué)習(xí)的動(dòng)態(tài)頻譜分配方法研究
發(fā)布時(shí)間:2020-12-14 03:03
隨著無(wú)線通信技術(shù)的飛速發(fā)展,人們對(duì)頻譜資源的需求日愈增加,頻譜資源的稀缺問(wèn)題也愈發(fā)突出,因此亟需提出新的智能方法來(lái)提高頻譜的利用率。而構(gòu)造認(rèn)知無(wú)線網(wǎng)絡(luò)是一種有效的解決方案,在面對(duì)復(fù)雜環(huán)境的動(dòng)態(tài)性時(shí)認(rèn)知用戶可以相應(yīng)地調(diào)整行為與控制策略,從而更有效地利用頻譜資源,提高網(wǎng)絡(luò)系統(tǒng)的認(rèn)知用頻效率。頻譜資源管理是認(rèn)知無(wú)線網(wǎng)絡(luò)的基本任務(wù)之一,主要涵蓋了功率控制和信道分配兩個(gè)核心問(wèn)題。功率控制指的是網(wǎng)絡(luò)中的認(rèn)知用戶能夠在對(duì)授權(quán)用戶不造成有害干擾的情況下,調(diào)整發(fā)射功率以機(jī)會(huì)式接入授權(quán)頻段,實(shí)現(xiàn)認(rèn)知用戶可以和授權(quán)用戶共享頻譜資源。而信道分配是將某一時(shí)段的空閑信道合理地分配給認(rèn)知用戶,充分利用處于閑置狀態(tài)的頻譜資源。由于認(rèn)知無(wú)線網(wǎng)絡(luò)的廣泛應(yīng)用,網(wǎng)絡(luò)結(jié)構(gòu)越來(lái)越錯(cuò)綜復(fù)雜,要建立相應(yīng)的數(shù)學(xué)模型以模擬出高復(fù)雜度的網(wǎng)絡(luò)環(huán)境變得難以實(shí)現(xiàn)。而強(qiáng)化學(xué)習(xí)中基于無(wú)模型的算法可以有效地解決該問(wèn)題。加之近年來(lái)深度學(xué)習(xí)的興起,強(qiáng)化學(xué)習(xí)與深度學(xué)習(xí)相結(jié)合的深度強(qiáng)化學(xué)習(xí)在處理復(fù)雜問(wèn)題和數(shù)據(jù)運(yùn)算方面都表現(xiàn)出優(yōu)異的能力。因此,本文重點(diǎn)研究了深度強(qiáng)化學(xué)習(xí)的智能算法在認(rèn)知無(wú)線網(wǎng)絡(luò)中頻譜資源管理方面的應(yīng)用,尤其是功率控制和信道分配這兩方面的優(yōu)化問(wèn)題...
【文章來(lái)源】:廣東工業(yè)大學(xué)廣東省
【文章頁(yè)數(shù)】:78 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 課題研究背景及意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.3 本論文主要研究?jī)?nèi)容及創(chuàng)新性
1.3.1 主要研究?jī)?nèi)容
1.3.2 本文創(chuàng)新成果
1.4 論文章節(jié)安排
第二章 認(rèn)知無(wú)線網(wǎng)絡(luò)關(guān)鍵技術(shù)和強(qiáng)化學(xué)習(xí)基礎(chǔ)理論
2.1 認(rèn)知無(wú)線網(wǎng)絡(luò)關(guān)鍵技術(shù)
2.1.1 認(rèn)知無(wú)線網(wǎng)絡(luò)架構(gòu)
2.1.2 頻譜資源管理框架
2.1.3 頻譜資源分配
2.2 強(qiáng)化學(xué)習(xí)基礎(chǔ)理論
2.2.1 數(shù)學(xué)框架
2.2.2 學(xué)習(xí)過(guò)程
2.2.3 深度強(qiáng)化學(xué)習(xí)
2.3 本章小結(jié)
第三章 基于深度強(qiáng)化學(xué)習(xí)的動(dòng)態(tài)功率控制方法研究
3.1 系統(tǒng)模型設(shè)計(jì)
3.2 動(dòng)態(tài)功率控制問(wèn)題描述
3.3 動(dòng)態(tài)功率控制問(wèn)題解決方案
3.3.1 優(yōu)先記憶庫(kù)和競(jìng)爭(zhēng)深度Q網(wǎng)絡(luò)
3.3.2 優(yōu)先記憶庫(kù)結(jié)合競(jìng)爭(zhēng)深度Q網(wǎng)絡(luò)的動(dòng)態(tài)功率控制方法
3.4 仿真實(shí)驗(yàn)結(jié)果及性能對(duì)比
3.5 本章小結(jié)
第四章 基于深度強(qiáng)化學(xué)習(xí)的動(dòng)態(tài)功率控制及信道分配聯(lián)合方法研究
4.1 系統(tǒng)模型設(shè)計(jì)
4.2 動(dòng)態(tài)功率控制及信道分配聯(lián)合問(wèn)題描述
4.3 動(dòng)態(tài)功率控制及信道分配聯(lián)合問(wèn)題解決方案
4.3.1 長(zhǎng)短期記憶循環(huán)神經(jīng)網(wǎng)絡(luò)
4.3.2 長(zhǎng)短期記憶深度Q網(wǎng)絡(luò)的動(dòng)態(tài)功率控制及信道分配聯(lián)合方法
4.4 仿真實(shí)驗(yàn)結(jié)果及性能分析
4.5 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀學(xué)位期間學(xué)術(shù)成果
致謝
本文編號(hào):2915681
【文章來(lái)源】:廣東工業(yè)大學(xué)廣東省
【文章頁(yè)數(shù)】:78 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第一章 緒論
1.1 課題研究背景及意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.3 本論文主要研究?jī)?nèi)容及創(chuàng)新性
1.3.1 主要研究?jī)?nèi)容
1.3.2 本文創(chuàng)新成果
1.4 論文章節(jié)安排
第二章 認(rèn)知無(wú)線網(wǎng)絡(luò)關(guān)鍵技術(shù)和強(qiáng)化學(xué)習(xí)基礎(chǔ)理論
2.1 認(rèn)知無(wú)線網(wǎng)絡(luò)關(guān)鍵技術(shù)
2.1.1 認(rèn)知無(wú)線網(wǎng)絡(luò)架構(gòu)
2.1.2 頻譜資源管理框架
2.1.3 頻譜資源分配
2.2 強(qiáng)化學(xué)習(xí)基礎(chǔ)理論
2.2.1 數(shù)學(xué)框架
2.2.2 學(xué)習(xí)過(guò)程
2.2.3 深度強(qiáng)化學(xué)習(xí)
2.3 本章小結(jié)
第三章 基于深度強(qiáng)化學(xué)習(xí)的動(dòng)態(tài)功率控制方法研究
3.1 系統(tǒng)模型設(shè)計(jì)
3.2 動(dòng)態(tài)功率控制問(wèn)題描述
3.3 動(dòng)態(tài)功率控制問(wèn)題解決方案
3.3.1 優(yōu)先記憶庫(kù)和競(jìng)爭(zhēng)深度Q網(wǎng)絡(luò)
3.3.2 優(yōu)先記憶庫(kù)結(jié)合競(jìng)爭(zhēng)深度Q網(wǎng)絡(luò)的動(dòng)態(tài)功率控制方法
3.4 仿真實(shí)驗(yàn)結(jié)果及性能對(duì)比
3.5 本章小結(jié)
第四章 基于深度強(qiáng)化學(xué)習(xí)的動(dòng)態(tài)功率控制及信道分配聯(lián)合方法研究
4.1 系統(tǒng)模型設(shè)計(jì)
4.2 動(dòng)態(tài)功率控制及信道分配聯(lián)合問(wèn)題描述
4.3 動(dòng)態(tài)功率控制及信道分配聯(lián)合問(wèn)題解決方案
4.3.1 長(zhǎng)短期記憶循環(huán)神經(jīng)網(wǎng)絡(luò)
4.3.2 長(zhǎng)短期記憶深度Q網(wǎng)絡(luò)的動(dòng)態(tài)功率控制及信道分配聯(lián)合方法
4.4 仿真實(shí)驗(yàn)結(jié)果及性能分析
4.5 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀學(xué)位期間學(xué)術(shù)成果
致謝
本文編號(hào):2915681
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2915681.html
最近更新
教材專著