基于強(qiáng)化學(xué)習(xí)的無(wú)人機(jī)基站軌跡優(yōu)化研究
發(fā)布時(shí)間:2023-10-27 18:24
無(wú)人機(jī)(Unmanned Aerial Vehicle,UAV)是由使用者遠(yuǎn)距離操控或嵌入式系統(tǒng)操縱駕駛的飛機(jī)。無(wú)人機(jī)因?yàn)槠潴w積小,靈活性高,部署方便等特點(diǎn)被廣泛的應(yīng)用。無(wú)人機(jī)在無(wú)線通信領(lǐng)域的應(yīng)用主要被分為兩類:一方面,無(wú)人機(jī)被認(rèn)為是接入蜂窩網(wǎng)絡(luò)進(jìn)行通信的新型空中用戶。另一方面,無(wú)人機(jī)被用作新的空中通信平臺(tái),如基站和中繼等,通過(guò)提供數(shù)據(jù)訪問(wèn)來(lái)協(xié)助地面無(wú)線通信。隨著無(wú)人機(jī)制造成本的不斷降低和通信設(shè)備的小型化,在無(wú)人機(jī)上安裝小型基站或中繼設(shè)備使飛行的空中平臺(tái)能夠輔助地面無(wú)線通信變得可行。這些基站適合安裝在具有中等有效載荷的無(wú)人機(jī)上。與傳統(tǒng)的地面通信基站相比,無(wú)人機(jī)作為基站提供通信服務(wù)有很多優(yōu)勢(shì),比如更好的信道條件,更靈活的部署方式等等。無(wú)人機(jī)基站的軌跡優(yōu)化是無(wú)人機(jī)通信系統(tǒng)中的一個(gè)重要問(wèn)題,因?yàn)闊o(wú)人機(jī)的位置直接影響信道環(huán)境以及與地面用戶的相對(duì)距離。在實(shí)際情況中,無(wú)人機(jī)在部署時(shí)很難精確地知道移動(dòng)用戶的確切位置。此外,由于無(wú)人機(jī)所能攜帶的能量有限,無(wú)人機(jī)通信系統(tǒng)的表現(xiàn)通常大打折扣。因此,本文在沒(méi)有地面用戶準(zhǔn)確位置信息的情況下對(duì)無(wú)人機(jī)基站的軌跡優(yōu)化問(wèn)題進(jìn)行研究分析,并在此基礎(chǔ)上提出并解決基于能量效...
【文章頁(yè)數(shù)】:59 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 課題背景
1.2 研究歷史與現(xiàn)狀
1.2.1 無(wú)人機(jī)通信系統(tǒng)信道模型的研究現(xiàn)狀
1.2.2 無(wú)人機(jī)基站部署以及軌跡優(yōu)化問(wèn)題的研究現(xiàn)狀
1.3 本文的研究?jī)?nèi)容及所做的工作
1.4 論文章節(jié)安排
第2章 無(wú)人機(jī)基站通信系統(tǒng)與強(qiáng)化學(xué)習(xí)算法
2.1 引言
2.2 無(wú)人機(jī)基站通信系統(tǒng)介紹
2.2.1 無(wú)人機(jī)基站通信系統(tǒng)的結(jié)構(gòu)
2.2.2 無(wú)人機(jī)基站的空地信道模型
2.3 強(qiáng)化學(xué)習(xí)介紹
2.3.1 強(qiáng)化學(xué)習(xí)模型原理及基本要素
2.3.2 馬爾可夫決策過(guò)程
2.3.3 強(qiáng)化學(xué)習(xí)經(jīng)典方法
2.4 本章小結(jié)
第3章 基于強(qiáng)化學(xué)習(xí)的無(wú)人機(jī)基站軌跡優(yōu)化算法
3.1 引言
3.2 問(wèn)題描述與建模
3.2.1 系統(tǒng)描述
3.2.2 接收信號(hào)強(qiáng)度模型
3.2.3 無(wú)人機(jī)基站軌跡優(yōu)化模型
3.3 基于Q-learning的無(wú)人機(jī)基站軌跡優(yōu)化算法
3.3.1 Q-learning方法原理
3.3.2 收斂性分析
3.3.3 動(dòng)作選擇策略
3.4 仿真與討論
3.5 本章小結(jié)
第4章 基于深度強(qiáng)化學(xué)習(xí)的無(wú)人機(jī)基站軌跡優(yōu)化算法
4.1 引言
4.2 無(wú)人機(jī)能量消耗模型
4.3 基于深度強(qiáng)化學(xué)習(xí)的無(wú)人機(jī)基站軌跡優(yōu)化算法
4.3.1 基于能量效率的無(wú)人機(jī)軌跡優(yōu)化模型
4.3.2 基于DQN的無(wú)人機(jī)軌跡優(yōu)化算法
4.4 仿真與性能評(píng)估
4.5 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表的論文及其它成果
致謝
本文編號(hào):3857037
【文章頁(yè)數(shù)】:59 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 課題背景
1.2 研究歷史與現(xiàn)狀
1.2.1 無(wú)人機(jī)通信系統(tǒng)信道模型的研究現(xiàn)狀
1.2.2 無(wú)人機(jī)基站部署以及軌跡優(yōu)化問(wèn)題的研究現(xiàn)狀
1.3 本文的研究?jī)?nèi)容及所做的工作
1.4 論文章節(jié)安排
第2章 無(wú)人機(jī)基站通信系統(tǒng)與強(qiáng)化學(xué)習(xí)算法
2.1 引言
2.2 無(wú)人機(jī)基站通信系統(tǒng)介紹
2.2.1 無(wú)人機(jī)基站通信系統(tǒng)的結(jié)構(gòu)
2.2.2 無(wú)人機(jī)基站的空地信道模型
2.3 強(qiáng)化學(xué)習(xí)介紹
2.3.1 強(qiáng)化學(xué)習(xí)模型原理及基本要素
2.3.2 馬爾可夫決策過(guò)程
2.3.3 強(qiáng)化學(xué)習(xí)經(jīng)典方法
2.4 本章小結(jié)
第3章 基于強(qiáng)化學(xué)習(xí)的無(wú)人機(jī)基站軌跡優(yōu)化算法
3.1 引言
3.2 問(wèn)題描述與建模
3.2.1 系統(tǒng)描述
3.2.2 接收信號(hào)強(qiáng)度模型
3.2.3 無(wú)人機(jī)基站軌跡優(yōu)化模型
3.3 基于Q-learning的無(wú)人機(jī)基站軌跡優(yōu)化算法
3.3.1 Q-learning方法原理
3.3.2 收斂性分析
3.3.3 動(dòng)作選擇策略
3.4 仿真與討論
3.5 本章小結(jié)
第4章 基于深度強(qiáng)化學(xué)習(xí)的無(wú)人機(jī)基站軌跡優(yōu)化算法
4.1 引言
4.2 無(wú)人機(jī)能量消耗模型
4.3 基于深度強(qiáng)化學(xué)習(xí)的無(wú)人機(jī)基站軌跡優(yōu)化算法
4.3.1 基于能量效率的無(wú)人機(jī)軌跡優(yōu)化模型
4.3.2 基于DQN的無(wú)人機(jī)軌跡優(yōu)化算法
4.4 仿真與性能評(píng)估
4.5 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表的論文及其它成果
致謝
本文編號(hào):3857037
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3857037.html
最近更新
教材專著