日益增長(zhǎng)的無線通信應(yīng)用需求對(duì)于無線網(wǎng)絡(luò)性能的要求越來越高,借助個(gè)體用戶頻譜感知、動(dòng)態(tài)接入等認(rèn)知組網(wǎng)行為中產(chǎn)生的數(shù)據(jù),加以融合機(jī)器學(xué)習(xí)等智能化技術(shù),將成為提高無線網(wǎng)絡(luò)性能的主要發(fā)展方向。本文圍繞認(rèn)知無線網(wǎng)絡(luò)中媒體接入控制(MAC,Medium Access Control)協(xié)議和資源分配策略展開研究,采用基于機(jī)器學(xué)習(xí)方法使認(rèn)知用戶能夠自主地解決以下三個(gè)問題:如何在不同的網(wǎng)絡(luò)場(chǎng)景中選擇合適的MAC協(xié)議,如何在基于CSMA/CA接入方式的網(wǎng)絡(luò)中選擇最優(yōu)無線信道資源,如何在基于TDMA接入方式的網(wǎng)絡(luò)中選擇最優(yōu)時(shí)隙資源,從而提高網(wǎng)絡(luò)吞吐量性能。本文的主要研究工作和成果如下:針對(duì)在集中式認(rèn)知無線網(wǎng)絡(luò)場(chǎng)景下單一類型MAC協(xié)議應(yīng)用受限,無法適應(yīng)網(wǎng)絡(luò)動(dòng)態(tài)變化的問題,論文提出了一種基于分類學(xué)習(xí)的MAC協(xié)議選擇模型。該模型采用監(jiān)督學(xué)習(xí)方式,將整個(gè)協(xié)議選擇過程分為學(xué)習(xí)階段和決策階段,這兩個(gè)階段迭代進(jìn)行,可以自主選擇不同的MAC協(xié)議以適應(yīng)不同的網(wǎng)絡(luò)場(chǎng)景。首先,本文選擇競(jìng)爭(zhēng)機(jī)制類有代表性的載波監(jiān)聽多址接入/沖突避免(CSMA/CA,Carrier Sense Multiple Access with Collision Avoidance)協(xié)議和非競(jìng)爭(zhēng)機(jī)制類有代表性的時(shí)分多址接入(TDMA,Time Division Multiple Access)協(xié)議作為分類模型備選協(xié)議,分析了不同接入方式的MAC協(xié)議所適用的網(wǎng)絡(luò)環(huán)境。其次,利用模糊集理論定義了協(xié)議選擇的評(píng)判標(biāo)準(zhǔn),提出了以MAC協(xié)議隸屬度作為認(rèn)知用戶是否需要改變當(dāng)前MAC協(xié)議的依據(jù)。在學(xué)習(xí)階段,首先,收集網(wǎng)絡(luò)環(huán)境參數(shù)和認(rèn)知用戶參數(shù)用于構(gòu)建參數(shù)特征數(shù)據(jù)集合,并且收集執(zhí)行當(dāng)前MAC協(xié)議對(duì)應(yīng)的統(tǒng)計(jì)量結(jié)果用于構(gòu)建統(tǒng)計(jì)量特征數(shù)據(jù)集合。其次,利用多粒度知識(shí)增量獲取算法合并特征數(shù)據(jù)集合,得到用于分類學(xué)習(xí)的特征數(shù)據(jù)集合。然后,利用測(cè)試集比較不同分類學(xué)習(xí)算法對(duì)MAC協(xié)議選擇模型的匹配程度,選擇合適的分類算法用于構(gòu)建分類器。在決策階段,首先,研究了不同樣本特征項(xiàng)對(duì)于模型分類準(zhǔn)確性的貢獻(xiàn)率,并以貢獻(xiàn)率高的特征項(xiàng)作為模型分類選擇的性能評(píng)判指標(biāo)。其次,將需要決策的樣本經(jīng)過分類器,得到目標(biāo)分類結(jié)果,從而選擇出最適合當(dāng)前網(wǎng)絡(luò)場(chǎng)景的MAC協(xié)議。仿真結(jié)果證明,論文提出的MAC協(xié)議選擇模型能有效地對(duì)不同網(wǎng)絡(luò)特征樣本進(jìn)行分類,幫助認(rèn)知用戶選擇最適合當(dāng)前網(wǎng)絡(luò)的MAC協(xié)議。針對(duì)基于CSMA/CA接入方式的認(rèn)知無線網(wǎng)絡(luò)信道選擇問題,并綜合考慮多認(rèn)知用戶競(jìng)爭(zhēng)接入的影響,提出了一種基于非合作博弈的在線決策信道選擇算法。該算法的決策過程采用半監(jiān)督學(xué)習(xí)方式,可以在減少控制與協(xié)商消息交互的前提下,使得認(rèn)知用戶能夠?qū)崟r(shí)、自主地選擇出最優(yōu)信道進(jìn)行接入。首先,將認(rèn)知用戶的信道選擇問題建模為非合作博弈方式下用戶吞吐量最大化問題。其次,分析了信道異構(gòu)性,以及多個(gè)認(rèn)知用戶競(jìng)爭(zhēng)接入同一信道時(shí)由于碰撞所產(chǎn)生的影響,推導(dǎo)了用戶可達(dá)傳輸速率和吞吐量的閉合表達(dá)式。然后,分析得到了具有納什均衡特性的認(rèn)知用戶的效用函數(shù),基于全局最優(yōu)理論,得到了最優(yōu)信道選擇的總和效用函數(shù)表達(dá)式。接著,設(shè)計(jì)雙向更新算法使認(rèn)知用戶能夠在任意方向上迭代更新信道選擇策略以實(shí)現(xiàn)收益的最大化。最后,分析連續(xù)博弈階段的最佳響應(yīng)閉合表達(dá)式,證明了算法能夠收斂到唯一的納什均衡解。仿真結(jié)果表明,論文提出的基于在線決策的信道選擇算法與傳統(tǒng)方案相比能夠顯著提高吞吐量;此外,通過擴(kuò)展實(shí)驗(yàn)場(chǎng)景,驗(yàn)證了所提算法能夠應(yīng)用于多接口多信道網(wǎng)絡(luò)。為了解決基于非合作博弈的在線決策信道選擇算法復(fù)雜度高的問題,論文進(jìn)一步提出了一種基于強(qiáng)化學(xué)習(xí)的離線學(xué)習(xí)信道選擇算法。該算法的學(xué)習(xí)過程采用半監(jiān)督學(xué)習(xí)方式,可以幫助認(rèn)知用戶以“試錯(cuò)”的方式自主漸進(jìn)式地選擇出最優(yōu)信道進(jìn)行接入。首先,將認(rèn)知用戶的信道選擇問題建模為強(qiáng)化學(xué)習(xí)方式下信道選擇行為對(duì)應(yīng)的“動(dòng)作-價(jià)值”效用函數(shù)最大化問題。其次,分析貪婪策略下的信道選擇行為,利用貝爾曼最優(yōu)期望方程解作為每一輪迭代學(xué)習(xí)的評(píng)估標(biāo)準(zhǔn)。然后,將認(rèn)知用戶“探索-利用”的信道選擇過程建模為二維馬爾科夫鏈,計(jì)算得到每一輪迭代中信道選擇行為對(duì)應(yīng)的動(dòng)作-價(jià)值效用函數(shù)。接著,分析了算法計(jì)算復(fù)雜度以及認(rèn)知用戶存儲(chǔ)開銷,證明了通過對(duì)“動(dòng)作-價(jià)值”效用函數(shù)執(zhí)行迭代更新,所提離線學(xué)習(xí)策略能夠收斂到近似貝爾曼最優(yōu)期望解的信道選擇結(jié)果。仿真結(jié)果表明,論文提出的基于離線學(xué)習(xí)的信道選擇算法能夠顯著提高吞吐量性能;與上一章中基于在線決策的實(shí)時(shí)算法相比,以更低的資源消耗達(dá)到了滿足用戶需求的信道選擇結(jié)果。針對(duì)基于TDMA接入方式的認(rèn)知無線網(wǎng)絡(luò)中動(dòng)態(tài)時(shí)隙選擇問題,論文提出了一種基于強(qiáng)化學(xué)習(xí)的拓?fù)渫该鲿r(shí)隙選擇算法。該算法的學(xué)習(xí)過程采用無監(jiān)督學(xué)習(xí)方式,學(xué)習(xí)過程分為沖突避免學(xué)習(xí)階段和冗余時(shí)隙利用學(xué)習(xí)階段,不需要引入控制節(jié)點(diǎn),認(rèn)知用戶僅需要對(duì)自身的時(shí)隙選擇行為進(jìn)行學(xué)習(xí),因此適合于分布式部署。從認(rèn)知用戶在拓?fù)渫该鲿r(shí)隙選擇過程中亟待解決的如何減少時(shí)隙沖突和如何提高時(shí)隙利用率等問題出發(fā)。首先,從最大化認(rèn)知用戶平均吞吐量的角度對(duì)拓?fù)渫该鲿r(shí)隙選擇問題進(jìn)行建模,將任意兩個(gè)認(rèn)知用戶發(fā)生碰撞的最大可能次數(shù)和子幀時(shí)隙數(shù)作為優(yōu)化目標(biāo)。然后,推導(dǎo)了進(jìn)行參數(shù)優(yōu)化后用戶吞吐量的閉合表達(dá)式。在沖突避免學(xué)習(xí)階段,首先,將認(rèn)知用戶與干擾用戶產(chǎn)生的沖突問題建模為時(shí)序差分學(xué)習(xí)模型。其次,為最小化相鄰時(shí)刻的時(shí)隙選擇反饋期望值之間的量化誤差,設(shè)計(jì)前向線性時(shí)序差分學(xué)習(xí)算法更新時(shí)隙選擇向量,直至收斂到近似最優(yōu)的反饋期望結(jié)果。在冗余時(shí)隙利用學(xué)習(xí)階段,首先,將上一階段得到的時(shí)隙選擇行為對(duì)應(yīng)的動(dòng)作-價(jià)值函數(shù)與對(duì)應(yīng)的時(shí)隙狀態(tài)一起構(gòu)成固定的狀態(tài)值函數(shù)對(duì)。其次,將認(rèn)知用戶對(duì)冗余時(shí)隙利用問題建模為逐幀執(zhí)行先驗(yàn)經(jīng)驗(yàn)重放過程,收集連續(xù)時(shí)刻的固定函數(shù)對(duì)構(gòu)建經(jīng)驗(yàn)重放集合。接著,認(rèn)知用戶在經(jīng)驗(yàn)重放集合中進(jìn)行隨機(jī)抽樣,選擇狀態(tài)值函數(shù)對(duì)。最后,認(rèn)知用戶對(duì)當(dāng)前時(shí)隙選擇真實(shí)值與重放集合固定值之間的均方誤差進(jìn)行優(yōu)化,并采用隨機(jī)梯度下降方法對(duì)冗余時(shí)隙利用向量進(jìn)行更新,直至收斂到最小二乘結(jié)果。仿真結(jié)果表明,相比于已有拓?fù)渫该鲿r(shí)隙選擇方案,論文提出的基于強(qiáng)化學(xué)習(xí)的拓?fù)渫该鲿r(shí)隙選擇算法能顯著提高吞吐量性能;同時(shí)參數(shù)優(yōu)化的結(jié)果能夠進(jìn)一步改善吞吐量。
【學(xué)位單位】:國(guó)防科技大學(xué)
【學(xué)位級(jí)別】:博士
【學(xué)位年份】:2018
【中圖分類】:TN925;TP181
【文章目錄】:摘要
Abstract
英文縮略語(yǔ)表
常用數(shù)學(xué)符號(hào)表
第一章 緒論
1.1 研究背景和意義
1.2 智能學(xué)習(xí)技術(shù)概述
1.2.1 支持向量機(jī)
1.2.2 博弈論
1.2.3 強(qiáng)化學(xué)習(xí)
1.3 國(guó)內(nèi)外研究現(xiàn)狀
1.3.1 組網(wǎng)接入方式
1.3.2 資源分配策略
1.4 研究思路和組織結(jié)構(gòu)
1.4.1 研究思路
1.4.2 組織結(jié)構(gòu)
1.5 論文的主要貢獻(xiàn)
第二章 基于分類學(xué)習(xí)的MAC協(xié)議選擇方法
2.1 引言
2.2 系統(tǒng)模型和問題表述
2.3 基于分類學(xué)習(xí)的MAC協(xié)議選擇方法
2.3.1 MAC協(xié)議差異性分析
2.3.2 MAC協(xié)議分類學(xué)習(xí)算法描述
2.3.3 樣本特征貢獻(xiàn)率分析
2.4 仿真性能與分析
2.4.1 分類器性能比較
2.4.2 認(rèn)知用戶數(shù)量的影響
2.4.3 MAC協(xié)議分類模型有效性驗(yàn)證
2.4.4 分類結(jié)果在負(fù)載—吞吐量性能曲線上的有效性驗(yàn)證
2.5 本章小結(jié)
第三章 基于在線決策的信道選擇方法
3.1 引言
3.2 系統(tǒng)模型和問題表述
3.3 基于在線決策的信道選擇方法
3.3.1 多址接入策略分析
3.3.2 信道選擇策略描述
3.3.3 復(fù)雜度分析
3.4 仿真性能與分析
3.4.1 不同信道數(shù)下網(wǎng)絡(luò)吞吐量性能比較
3.4.2 不同信道數(shù)量下算法收斂性能比較
3.4.3 算法公平性度量
3.4.4 多接口多信道條件下吞吐量性能比較
3.5 本章小結(jié)
第四章 基于離線學(xué)習(xí)的信道選擇方法
4.1 引言
4.2 系統(tǒng)模型和問題表述
4.3 基于離線學(xué)習(xí)的信道選擇方法
4.3.1 信道選擇策略描述
4.3.2 復(fù)雜度及收斂性分析
4.4 仿真性能與分析
4.4.1 不同信道數(shù)下網(wǎng)絡(luò)吞吐量性能比較
4.4.2 不同信道數(shù)下的算法收斂性能比較
4.4.3 兩種信道選擇學(xué)習(xí)策略能量消耗比較
4.4.4 不同學(xué)習(xí)速率對(duì)吞吐量性能的影響
4.4.5 不同折扣因子對(duì)吞吐量性能的影響
4.5 本章小結(jié)
第五章 基于強(qiáng)化學(xué)習(xí)的拓?fù)渫该鲿r(shí)隙選擇方法
5.1 引言
5.2 系統(tǒng)模型和問題表述
5.3 基于強(qiáng)化學(xué)習(xí)的拓?fù)渫该鲿r(shí)隙選擇方法
5.3.1 基本概念
5.3.2 時(shí)隙選擇策略描述
5.4 仿真性能與分析
5.4.1 不同算法下平均認(rèn)知用戶吞吐量性能比較
5.4.2 動(dòng)態(tài)場(chǎng)景下系統(tǒng)吞吐量性能
5.4.3 不同學(xué)習(xí)階段算法收斂性能比較
5.4.4 參數(shù)優(yōu)化對(duì)吞吐量性能的影響
5.5 本章小結(jié)
第六章 結(jié)論與展望
6.1 主要研究成果和創(chuàng)新點(diǎn)
6.2 后續(xù)工作展望
參考文獻(xiàn)
致謝
作者在學(xué)期間取得的學(xué)術(shù)成果
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 沈華琳;葉德明;;岸臺(tái)半自動(dòng)化信道分配設(shè)計(jì)[J];珠江水運(yùn);2016年19期
2 牟恒;;蜂窩網(wǎng)絡(luò)中信道分配模型的優(yōu)化設(shè)計(jì)與實(shí)現(xiàn)[J];環(huán)球市場(chǎng)信息導(dǎo)報(bào);2016年48期
3 戴明;;淺析“買碼”話務(wù)擁塞中業(yè)務(wù)信道分配成功率的優(yōu)化[J];信息通信;2008年05期
4 朱錦景;;第三代移動(dòng)通信系統(tǒng)中的信道分配技術(shù)[J];電腦知識(shí)與技術(shù);2008年07期
5 王愛民,朱建啟,苑森淼;CDMA網(wǎng)絡(luò)中混合信道分配的容量分析[J];吉林大學(xué)學(xué)報(bào)(理學(xué)版);2004年02期
6 李旭,宋俊德,劉峰,馬莉,宋梅;信道分配策略的研究與比較[J];電訊技術(shù);2000年01期
7 馬力;;移動(dòng)通信網(wǎng)小區(qū)選擇無干擾信道組的一種算法[J];移動(dòng)通信;1989年01期
8 祝平;劉超洋;;移動(dòng)通信網(wǎng)微機(jī)信道管理技術(shù)研究[J];移動(dòng)通信;1989年03期
9 廖龍龍;;無線Mesh網(wǎng)絡(luò)中的信道分配研究[J];電腦知識(shí)與技術(shù);2017年27期
10 蔡鳳麗;劉新永;;基于Multi-Radio Multi-Channel傳感器網(wǎng)絡(luò)無沖突信道分配算法的研究[J];吉林工程技術(shù)師范學(xué)院學(xué)報(bào);2014年05期
相關(guān)博士學(xué)位論文 前10條
1 喬木;基于機(jī)器學(xué)習(xí)的認(rèn)知無線網(wǎng)絡(luò)接入與資源分配技術(shù)研究[D];國(guó)防科技大學(xué);2018年
2 張維維;無線Mesh網(wǎng)絡(luò)路由與信道分配優(yōu)化研究[D];吉林大學(xué);2018年
3 蔣綱;數(shù)據(jù)包在無線網(wǎng)絡(luò)中調(diào)度策略的研究[D];華中科技大學(xué);2004年
4 李元杰;MIMO通信系統(tǒng)信道估計(jì)與跟蹤的研究[D];東南大學(xué);2006年
5 喻華文;MIMO-OFDM寬帶通信系統(tǒng)基于子群的信道估計(jì)和分配算法研究[D];華南理工大學(xué);2007年
6 楊峰;OFDM系統(tǒng)中信道估計(jì)及相關(guān)技術(shù)的研究[D];上海交通大學(xué);2006年
7 廖明霞;空間網(wǎng)絡(luò)低軌星座信道分配策略研究[D];北京郵電大學(xué);2016年
8 黃鑫;多射頻多信道無線Mesh網(wǎng)絡(luò)的資源管理關(guān)鍵技術(shù)研究[D];華南理工大學(xué);2011年
9 賴曉晨;體域網(wǎng)的信道分配協(xié)議及姿態(tài)識(shí)別研究[D];大連理工大學(xué);2016年
10 袁福;協(xié)作認(rèn)知中繼網(wǎng)絡(luò)中的資源管理及中斷概率研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2013年
相關(guān)碩士學(xué)位論文 前10條
1 童健心;無線網(wǎng)狀網(wǎng)中信道分配的研究與實(shí)現(xiàn)[D];華南理工大學(xué);2019年
2 張金;復(fù)雜網(wǎng)絡(luò)環(huán)境下多個(gè)獨(dú)立AP信道分配策略研究[D];重慶郵電大學(xué);2018年
3 張龍祥;客艙無線網(wǎng)絡(luò)布局及性能分析[D];電子科技大學(xué);2019年
4 王曉波;配電網(wǎng)中無線信道分配策略研究[D];華北電力大學(xué);2019年
5 李同會(huì);D2D通信中的資源分配方法研究[D];重慶郵電大學(xué);2018年
6 成雙果;以用戶為中心面向服務(wù)的頻譜切換與信道選擇機(jī)制研究[D];重慶郵電大學(xué);2018年
7 李玉潔;多射頻多信道無線mesh網(wǎng)信道分配與路由算法研究[D];重慶郵電大學(xué);2019年
8 朱正根;多接口多信道無線mesh網(wǎng)絡(luò)信道分配算法研究[D];廈門大學(xué);2018年
9 馮雷;無線傳感器網(wǎng)絡(luò)中抗同頻干擾方法的研究[D];武漢理工大學(xué);2018年
10 馬晨迪;認(rèn)知毫微微網(wǎng)絡(luò)中用戶資源分配研究[D];北京郵電大學(xué);2019年
本文編號(hào):
2873115