基于強化學習的頻譜感知策略研究
發(fā)布時間:2021-10-30 22:09
認知無線電技術致力于改變頻譜固定分配和接入方式,即次用戶在不對主用戶產(chǎn)生干擾的情況下,機會性地接入無線頻譜資源,以提高頻譜利用率。其中頻譜感知技術是認知無線電技術的基礎,也是國內(nèi)外研究的重點。頻譜感知中,在次用戶接入信道前,為最小化對主用戶通信的干擾,次用戶需依次選擇信道進行感知以找到空閑信道,這會造成掃描開銷和接入時延。針對此問題,本文依托團隊科研項目,以協(xié)助次用戶快速且準確地找到空閑信道為目標,從信道選擇算法和協(xié)作頻譜感知算法兩個方面進行研究,開展如下工作:(1)概述了強化學習模型的原理和應用難點,重點研究了多臂賭博機問題的模型、動作估計值更新策略以及動作選擇策略,為本文的后續(xù)研究奠定了理論基礎。(2)為加快次用戶找到空閑信道以減少掃描開銷和接入時延,本文設計了基于強化學習的信道選擇模型,將次用戶信道選擇問題建模為強化學習中的多臂賭博機模型。已有的研究假設主用戶對信道的占用模式為理想的伯努利過程,并假設次用戶對信道是完美檢測的。為了使模型更逼近真實環(huán)境,本文將主用戶占用模式建模為關聯(lián)性伯努利過程,且在設計模型的信道回報函數(shù)時綜合考慮了鄰居的檢測準確率。(3)為求解(2)中的信道選擇...
【文章來源】:電子科技大學四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:74 頁
【學位級別】:碩士
【部分圖文】:
圖1-2能鎌測法??
?電子科技火學碩士學f立論文???協(xié)作頻譜感知可以減少多徑衰落和陰影效應對檢測的影響,減少漏檢概率和虛警??概率,來提高檢測結果的可靠性。協(xié)作頻譜感知根據(jù)網(wǎng)絡場景又分為集中式感知??和分布式感知兩種方式P??1.集中式頻譜感知??集中式感知的模型如圖1-3所示,中心單元也稱融合中心首先從認知用廣收??集感知儀息,然后綜合感知僧息進行頻譜狀態(tài)決策,最后將決策信息廣播給認知??用戶或直接控制認知用戶的通信^上述過程必然引入額外的通儀開銷,集中式的??頻譜感知和分配大多基于優(yōu)化理論。??廠?▲,戶醜??[s?\??sui?A??\?合中心/??My/??圖1-3集屮式頻譜感知??2.分布式頻譜感知??分布式感知[15]的場景如圖1-4所示,網(wǎng)絡中沒有中心貨點,認知貨點之間通??過對等交互的方式進行通信。認知無線電網(wǎng)絡不需要依賴于中繼站、融合中心等??設備,降低了組網(wǎng)的成本,額外通信開銷校網(wǎng)絡中的認知節(jié)點具備獨立組網(wǎng)的??能力,易十擴充新的節(jié)點;且任一節(jié)點失效或鏈路中斷時,不會影響其他節(jié)點的??通信,因此分布式網(wǎng)絡相比于集中式網(wǎng)絡,組網(wǎng)方式靈活且抗毀性更好。然而,??由于分布式網(wǎng)絡不是集中控制的,所以網(wǎng)絡在需要進行資源共享肘,難以達到全??扃最優(yōu),可能造成資源的浪費。??4??
?第一_緒論???/?’?’...?▲'?'??/?\??sA?7盧??圖1-4分布式頻譜感知??文獻[16]考慮了一個具有高流量用戶和低流員'用戶的認知無線電網(wǎng)絡,弁使用??混合策略納什均衡的概念分析了他們的感知行為,進而利用進化博弈理論設計了??一種分布式博弈,只要低流最用戶在場,就會分擔感知任務,而高流量用戶可以??免費使用其感知到的空閑頻譜,減少了接入時延,提高了頻譜利用率,但是卻不??適用于高It量用戶的認知網(wǎng)絡。??3.融合決策方式??融合中心進行融合決策時有硬決策和軟決策兩種方式。??_(:1.)硬決策??在硬決策方式中,協(xié)作次用戶將本地決策的一位二進制信息0/1通過控制■道??傳送給融合中心,其中0代表沒有檢測到生用戶f!號,1代表檢測到主用戶儒號。??因為控制#道只傳輸一位二進制信息,所以這種方式W以貨約控制帶寬。??對于硬決策,融合準則有“或”準則,“K秩”準則和“與”準則[1748]!盎颉??準則是指如果至少有一個認知節(jié)點檢測到主用戶存在時,融合中心便在融合決策??時判決為檢測信號存在;“K秩”準則是指如果N個認知節(jié)點中至少有K個檢測到??主用戶信號存在時,融合中心便判決為倩號存在。“與”準則是指只有所有參與協(xié)??作的認知節(jié)點都檢測到主用戶存在時,融合中心才判決信號存在。在檢測概率一??定的情況下,三種準則的檢測性能依次上升,而在特定虛警概率的情況下,三種??準則的檢測性能依次下降。??文獻[19]指出,網(wǎng)絡中的所有用戶進行協(xié)作頻譜感知并不一定能達到最優(yōu)性能,??5??
本文編號:3467515
【文章來源】:電子科技大學四川省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:74 頁
【學位級別】:碩士
【部分圖文】:
圖1-2能鎌測法??
?電子科技火學碩士學f立論文???協(xié)作頻譜感知可以減少多徑衰落和陰影效應對檢測的影響,減少漏檢概率和虛警??概率,來提高檢測結果的可靠性。協(xié)作頻譜感知根據(jù)網(wǎng)絡場景又分為集中式感知??和分布式感知兩種方式P??1.集中式頻譜感知??集中式感知的模型如圖1-3所示,中心單元也稱融合中心首先從認知用廣收??集感知儀息,然后綜合感知僧息進行頻譜狀態(tài)決策,最后將決策信息廣播給認知??用戶或直接控制認知用戶的通信^上述過程必然引入額外的通儀開銷,集中式的??頻譜感知和分配大多基于優(yōu)化理論。??廠?▲,戶醜??[s?\??sui?A??\?合中心/??My/??圖1-3集屮式頻譜感知??2.分布式頻譜感知??分布式感知[15]的場景如圖1-4所示,網(wǎng)絡中沒有中心貨點,認知貨點之間通??過對等交互的方式進行通信。認知無線電網(wǎng)絡不需要依賴于中繼站、融合中心等??設備,降低了組網(wǎng)的成本,額外通信開銷校網(wǎng)絡中的認知節(jié)點具備獨立組網(wǎng)的??能力,易十擴充新的節(jié)點;且任一節(jié)點失效或鏈路中斷時,不會影響其他節(jié)點的??通信,因此分布式網(wǎng)絡相比于集中式網(wǎng)絡,組網(wǎng)方式靈活且抗毀性更好。然而,??由于分布式網(wǎng)絡不是集中控制的,所以網(wǎng)絡在需要進行資源共享肘,難以達到全??扃最優(yōu),可能造成資源的浪費。??4??
?第一_緒論???/?’?’...?▲'?'??/?\??sA?7盧??圖1-4分布式頻譜感知??文獻[16]考慮了一個具有高流量用戶和低流員'用戶的認知無線電網(wǎng)絡,弁使用??混合策略納什均衡的概念分析了他們的感知行為,進而利用進化博弈理論設計了??一種分布式博弈,只要低流最用戶在場,就會分擔感知任務,而高流量用戶可以??免費使用其感知到的空閑頻譜,減少了接入時延,提高了頻譜利用率,但是卻不??適用于高It量用戶的認知網(wǎng)絡。??3.融合決策方式??融合中心進行融合決策時有硬決策和軟決策兩種方式。??_(:1.)硬決策??在硬決策方式中,協(xié)作次用戶將本地決策的一位二進制信息0/1通過控制■道??傳送給融合中心,其中0代表沒有檢測到生用戶f!號,1代表檢測到主用戶儒號。??因為控制#道只傳輸一位二進制信息,所以這種方式W以貨約控制帶寬。??對于硬決策,融合準則有“或”準則,“K秩”準則和“與”準則[1748]!盎颉??準則是指如果至少有一個認知節(jié)點檢測到主用戶存在時,融合中心便在融合決策??時判決為檢測信號存在;“K秩”準則是指如果N個認知節(jié)點中至少有K個檢測到??主用戶信號存在時,融合中心便判決為倩號存在。“與”準則是指只有所有參與協(xié)??作的認知節(jié)點都檢測到主用戶存在時,融合中心才判決信號存在。在檢測概率一??定的情況下,三種準則的檢測性能依次上升,而在特定虛警概率的情況下,三種??準則的檢測性能依次下降。??文獻[19]指出,網(wǎng)絡中的所有用戶進行協(xié)作頻譜感知并不一定能達到最優(yōu)性能,??5??
本文編號:3467515
本文鏈接:http://www.sikaile.net/kejilunwen/xinxigongchenglunwen/3467515.html
最近更新
教材專著