基于強(qiáng)化學(xué)習(xí)的頻譜感知策略研究
發(fā)布時(shí)間:2021-10-30 22:09
認(rèn)知無(wú)線電技術(shù)致力于改變頻譜固定分配和接入方式,即次用戶在不對(duì)主用戶產(chǎn)生干擾的情況下,機(jī)會(huì)性地接入無(wú)線頻譜資源,以提高頻譜利用率。其中頻譜感知技術(shù)是認(rèn)知無(wú)線電技術(shù)的基礎(chǔ),也是國(guó)內(nèi)外研究的重點(diǎn)。頻譜感知中,在次用戶接入信道前,為最小化對(duì)主用戶通信的干擾,次用戶需依次選擇信道進(jìn)行感知以找到空閑信道,這會(huì)造成掃描開銷和接入時(shí)延。針對(duì)此問(wèn)題,本文依托團(tuán)隊(duì)科研項(xiàng)目,以協(xié)助次用戶快速且準(zhǔn)確地找到空閑信道為目標(biāo),從信道選擇算法和協(xié)作頻譜感知算法兩個(gè)方面進(jìn)行研究,開展如下工作:(1)概述了強(qiáng)化學(xué)習(xí)模型的原理和應(yīng)用難點(diǎn),重點(diǎn)研究了多臂賭博機(jī)問(wèn)題的模型、動(dòng)作估計(jì)值更新策略以及動(dòng)作選擇策略,為本文的后續(xù)研究奠定了理論基礎(chǔ)。(2)為加快次用戶找到空閑信道以減少掃描開銷和接入時(shí)延,本文設(shè)計(jì)了基于強(qiáng)化學(xué)習(xí)的信道選擇模型,將次用戶信道選擇問(wèn)題建模為強(qiáng)化學(xué)習(xí)中的多臂賭博機(jī)模型。已有的研究假設(shè)主用戶對(duì)信道的占用模式為理想的伯努利過(guò)程,并假設(shè)次用戶對(duì)信道是完美檢測(cè)的。為了使模型更逼近真實(shí)環(huán)境,本文將主用戶占用模式建模為關(guān)聯(lián)性伯努利過(guò)程,且在設(shè)計(jì)模型的信道回報(bào)函數(shù)時(shí)綜合考慮了鄰居的檢測(cè)準(zhǔn)確率。(3)為求解(2)中的信道選擇...
【文章來(lái)源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:74 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖1-2能鎌測(cè)法??
?電子科技火學(xué)碩士學(xué)f立論文???協(xié)作頻譜感知可以減少多徑衰落和陰影效應(yīng)對(duì)檢測(cè)的影響,減少漏檢概率和虛警??概率,來(lái)提高檢測(cè)結(jié)果的可靠性。協(xié)作頻譜感知根據(jù)網(wǎng)絡(luò)場(chǎng)景又分為集中式感知??和分布式感知兩種方式P??1.集中式頻譜感知??集中式感知的模型如圖1-3所示,中心單元也稱融合中心首先從認(rèn)知用廣收??集感知儀息,然后綜合感知僧息進(jìn)行頻譜狀態(tài)決策,最后將決策信息廣播給認(rèn)知??用戶或直接控制認(rèn)知用戶的通信^上述過(guò)程必然引入額外的通儀開銷,集中式的??頻譜感知和分配大多基于優(yōu)化理論。??廠?▲,戶醜??[s?\??sui?A??\?合中心/??My/??圖1-3集屮式頻譜感知??2.分布式頻譜感知??分布式感知[15]的場(chǎng)景如圖1-4所示,網(wǎng)絡(luò)中沒有中心貨點(diǎn),認(rèn)知貨點(diǎn)之間通??過(guò)對(duì)等交互的方式進(jìn)行通信。認(rèn)知無(wú)線電網(wǎng)絡(luò)不需要依賴于中繼站、融合中心等??設(shè)備,降低了組網(wǎng)的成本,額外通信開銷校網(wǎng)絡(luò)中的認(rèn)知節(jié)點(diǎn)具備獨(dú)立組網(wǎng)的??能力,易十?dāng)U充新的節(jié)點(diǎn);且任一節(jié)點(diǎn)失效或鏈路中斷時(shí),不會(huì)影響其他節(jié)點(diǎn)的??通信,因此分布式網(wǎng)絡(luò)相比于集中式網(wǎng)絡(luò),組網(wǎng)方式靈活且抗毀性更好。然而,??由于分布式網(wǎng)絡(luò)不是集中控制的,所以網(wǎng)絡(luò)在需要進(jìn)行資源共享肘,難以達(dá)到全??扃最優(yōu),可能造成資源的浪費(fèi)。??4??
?第一_緒論???/?’?’...?▲'?'??/?\??sA?7盧??圖1-4分布式頻譜感知??文獻(xiàn)[16]考慮了一個(gè)具有高流量用戶和低流員'用戶的認(rèn)知無(wú)線電網(wǎng)絡(luò),弁使用??混合策略納什均衡的概念分析了他們的感知行為,進(jìn)而利用進(jìn)化博弈理論設(shè)計(jì)了??一種分布式博弈,只要低流最用戶在場(chǎng),就會(huì)分擔(dān)感知任務(wù),而高流量用戶可以??免費(fèi)使用其感知到的空閑頻譜,減少了接入時(shí)延,提高了頻譜利用率,但是卻不??適用于高It量用戶的認(rèn)知網(wǎng)絡(luò)。??3.融合決策方式??融合中心進(jìn)行融合決策時(shí)有硬決策和軟決策兩種方式。??_(:1.)硬決策??在硬決策方式中,協(xié)作次用戶將本地決策的一位二進(jìn)制信息0/1通過(guò)控制■道??傳送給融合中心,其中0代表沒有檢測(cè)到生用戶f!號(hào),1代表檢測(cè)到主用戶儒號(hào)。??因?yàn)榭刂疲5乐粋鬏斠晃欢M(jìn)制信息,所以這種方式W以貨約控制帶寬。??對(duì)于硬決策,融合準(zhǔn)則有“或”準(zhǔn)則,“K秩”準(zhǔn)則和“與”準(zhǔn)則[1748]!盎颉??準(zhǔn)則是指如果至少有一個(gè)認(rèn)知節(jié)點(diǎn)檢測(cè)到主用戶存在時(shí),融合中心便在融合決策??時(shí)判決為檢測(cè)信號(hào)存在;“K秩”準(zhǔn)則是指如果N個(gè)認(rèn)知節(jié)點(diǎn)中至少有K個(gè)檢測(cè)到??主用戶信號(hào)存在時(shí),融合中心便判決為倩號(hào)存在!芭c”準(zhǔn)則是指只有所有參與協(xié)??作的認(rèn)知節(jié)點(diǎn)都檢測(cè)到主用戶存在時(shí),融合中心才判決信號(hào)存在。在檢測(cè)概率一??定的情況下,三種準(zhǔn)則的檢測(cè)性能依次上升,而在特定虛警概率的情況下,三種??準(zhǔn)則的檢測(cè)性能依次下降。??文獻(xiàn)[19]指出,網(wǎng)絡(luò)中的所有用戶進(jìn)行協(xié)作頻譜感知并不一定能達(dá)到最優(yōu)性能,??5??
本文編號(hào):3467515
【文章來(lái)源】:電子科技大學(xué)四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:74 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖1-2能鎌測(cè)法??
?電子科技火學(xué)碩士學(xué)f立論文???協(xié)作頻譜感知可以減少多徑衰落和陰影效應(yīng)對(duì)檢測(cè)的影響,減少漏檢概率和虛警??概率,來(lái)提高檢測(cè)結(jié)果的可靠性。協(xié)作頻譜感知根據(jù)網(wǎng)絡(luò)場(chǎng)景又分為集中式感知??和分布式感知兩種方式P??1.集中式頻譜感知??集中式感知的模型如圖1-3所示,中心單元也稱融合中心首先從認(rèn)知用廣收??集感知儀息,然后綜合感知僧息進(jìn)行頻譜狀態(tài)決策,最后將決策信息廣播給認(rèn)知??用戶或直接控制認(rèn)知用戶的通信^上述過(guò)程必然引入額外的通儀開銷,集中式的??頻譜感知和分配大多基于優(yōu)化理論。??廠?▲,戶醜??[s?\??sui?A??\?合中心/??My/??圖1-3集屮式頻譜感知??2.分布式頻譜感知??分布式感知[15]的場(chǎng)景如圖1-4所示,網(wǎng)絡(luò)中沒有中心貨點(diǎn),認(rèn)知貨點(diǎn)之間通??過(guò)對(duì)等交互的方式進(jìn)行通信。認(rèn)知無(wú)線電網(wǎng)絡(luò)不需要依賴于中繼站、融合中心等??設(shè)備,降低了組網(wǎng)的成本,額外通信開銷校網(wǎng)絡(luò)中的認(rèn)知節(jié)點(diǎn)具備獨(dú)立組網(wǎng)的??能力,易十?dāng)U充新的節(jié)點(diǎn);且任一節(jié)點(diǎn)失效或鏈路中斷時(shí),不會(huì)影響其他節(jié)點(diǎn)的??通信,因此分布式網(wǎng)絡(luò)相比于集中式網(wǎng)絡(luò),組網(wǎng)方式靈活且抗毀性更好。然而,??由于分布式網(wǎng)絡(luò)不是集中控制的,所以網(wǎng)絡(luò)在需要進(jìn)行資源共享肘,難以達(dá)到全??扃最優(yōu),可能造成資源的浪費(fèi)。??4??
?第一_緒論???/?’?’...?▲'?'??/?\??sA?7盧??圖1-4分布式頻譜感知??文獻(xiàn)[16]考慮了一個(gè)具有高流量用戶和低流員'用戶的認(rèn)知無(wú)線電網(wǎng)絡(luò),弁使用??混合策略納什均衡的概念分析了他們的感知行為,進(jìn)而利用進(jìn)化博弈理論設(shè)計(jì)了??一種分布式博弈,只要低流最用戶在場(chǎng),就會(huì)分擔(dān)感知任務(wù),而高流量用戶可以??免費(fèi)使用其感知到的空閑頻譜,減少了接入時(shí)延,提高了頻譜利用率,但是卻不??適用于高It量用戶的認(rèn)知網(wǎng)絡(luò)。??3.融合決策方式??融合中心進(jìn)行融合決策時(shí)有硬決策和軟決策兩種方式。??_(:1.)硬決策??在硬決策方式中,協(xié)作次用戶將本地決策的一位二進(jìn)制信息0/1通過(guò)控制■道??傳送給融合中心,其中0代表沒有檢測(cè)到生用戶f!號(hào),1代表檢測(cè)到主用戶儒號(hào)。??因?yàn)榭刂疲5乐粋鬏斠晃欢M(jìn)制信息,所以這種方式W以貨約控制帶寬。??對(duì)于硬決策,融合準(zhǔn)則有“或”準(zhǔn)則,“K秩”準(zhǔn)則和“與”準(zhǔn)則[1748]!盎颉??準(zhǔn)則是指如果至少有一個(gè)認(rèn)知節(jié)點(diǎn)檢測(cè)到主用戶存在時(shí),融合中心便在融合決策??時(shí)判決為檢測(cè)信號(hào)存在;“K秩”準(zhǔn)則是指如果N個(gè)認(rèn)知節(jié)點(diǎn)中至少有K個(gè)檢測(cè)到??主用戶信號(hào)存在時(shí),融合中心便判決為倩號(hào)存在!芭c”準(zhǔn)則是指只有所有參與協(xié)??作的認(rèn)知節(jié)點(diǎn)都檢測(cè)到主用戶存在時(shí),融合中心才判決信號(hào)存在。在檢測(cè)概率一??定的情況下,三種準(zhǔn)則的檢測(cè)性能依次上升,而在特定虛警概率的情況下,三種??準(zhǔn)則的檢測(cè)性能依次下降。??文獻(xiàn)[19]指出,網(wǎng)絡(luò)中的所有用戶進(jìn)行協(xié)作頻譜感知并不一定能達(dá)到最優(yōu)性能,??5??
本文編號(hào):3467515
本文鏈接:http://sikaile.net/kejilunwen/xinxigongchenglunwen/3467515.html
最近更新
教材專著