基于強化學習的網絡切片動態(tài)資源管理算法研究
發(fā)布時間:2025-01-06 04:32
未來的通信業(yè)務將更加豐富多樣,由于不同業(yè)務有不同的通信需求,而傳統(tǒng)網絡只能滿足單一服務需求,因此網絡切片技術應運而生,該技術允許在一個物理網絡上建立多個邏輯網絡滿足各業(yè)務的通信需求。為了保證網絡切片優(yōu)異的通信質量,高效的資源管理機制是極其重要的。因此,本文的工作重點是在接入網切片場景下,致力于優(yōu)化資源管理的方案,且本文的研究工作總結如下:針對很多文獻中拓撲感知不符合實際的問題,提出了一種基于部分觀察馬爾可夫決策過程(Partial Observation Markov Decision Process,POMDP)的多資源聯(lián)合管理方案。針對物理網絡拓撲設計了一種心跳包檢測機制部分感知當前的拓撲情況;谕耆年犃袪顟B(tài)和部分感知的拓撲狀態(tài)利用POMDP決策出切片內各服務功能鏈的計算和鏈路資源的編排和映射方式;旌蠁l(fā)式值迭代算法因其復雜度較低而用于求解該POMDP模型,并獲得近似最優(yōu)資源管理策略。仿真實驗表明該方案可以在動態(tài)拓撲情況下優(yōu)化決策資源編排和映射而降低時延且最小化修復成本,實現(xiàn)低成本的低時延通信并提升資源利用率。針對終端在接入網切片內移動時造成的高時延問題,基于強化學習方法提出了...
【文章頁數(shù)】:92 頁
【學位級別】:碩士
【部分圖文】:
本文編號:4023798
【文章頁數(shù)】:92 頁
【學位級別】:碩士
【部分圖文】:
圖3.4權重對效用的影響
仿真中有三類切片,且三類切片的SFC總數(shù)目范圍為[10,70],一類切片的SFC占總數(shù)的50%,二類切片的SFC數(shù)目占比30%,三類切片的SFC數(shù)目占比20%。每個SFC的數(shù)據(jù)到達服從非齊次泊松過程,而一類切片的平均數(shù)據(jù)到達率最高,二類切片的平均數(shù)據(jù)到達率....
圖3.5權重對時延的影響
仿真中有三類切片,且三類切片的SFC總數(shù)目范圍為[10,70],一類切片的SFC占總數(shù)的50%,二類切片的SFC數(shù)目占比30%,三類切片的SFC數(shù)目占比20%。每個SFC的數(shù)據(jù)到達服從非齊次泊松過程,而一類切片的平均數(shù)據(jù)到達率最高,二類切片的平均數(shù)據(jù)到達率....
圖3.6權重對修復成本的影響
圖3.6權重對修復成本的影響圖3.7CVI和MHVI算法的效用比較圖3.8CVI和MHVI的時延對比圖3.9CVI和MHVI的修復成本三種資源管理方案的對比結果如圖3.11、3.12和3.13所示。馬爾可夫近似(MarkovAppr....
圖3.7CVI和MHVI算法的效用比較
圖3.6權重對修復成本的影響圖3.7CVI和MHVI算法的效用比較圖3.8CVI和MHVI的時延對比圖3.9CVI和MHVI的修復成本三種資源管理方案的對比結果如圖3.11、3.12和3.13所示。馬爾可夫近似(MarkovAppr....
本文編號:4023798
本文鏈接:http://sikaile.net/guanlilunwen/glzh/4023798.html