基于強化學(xué)習(xí)的時間觸發(fā)通信調(diào)度方法
發(fā)布時間:2022-01-04 08:26
未來航空電子系統(tǒng)中將會更廣泛地選擇基于時間觸發(fā)的通信機制進(jìn)行信息傳輸,以保證信息交互的確定性。如何合理地進(jìn)行時間觸發(fā)通信調(diào)度設(shè)計是時間觸發(fā)應(yīng)用于航空電子互連系統(tǒng)的關(guān)鍵。針對時間觸發(fā)調(diào)度的周期性任務(wù),提出了一種基于強化學(xué)習(xí)的周期調(diào)度時刻表生成方法。首先,將流量調(diào)度任務(wù)轉(zhuǎn)換為樹搜索問題,使之具有強化學(xué)習(xí)所需要的馬爾可夫特性;隨后,利用基于神經(jīng)網(wǎng)絡(luò)的強化學(xué)習(xí)算法對調(diào)度表進(jìn)行探索,不斷縮短延遲時間以優(yōu)化調(diào)度表,且在訓(xùn)練完成后,可以直接使用到消息分布相近的任務(wù)中。與使用Yices等可滿足模理論(SMT)形式化求解時間觸發(fā)調(diào)度表方法相比,所提方法不會出現(xiàn)無法判定的問題,能夠保證時間觸發(fā)調(diào)度設(shè)計結(jié)果的正確性和優(yōu)化性。對于包含1 000條消息的大型網(wǎng)絡(luò),所提方法的計算速度為SMT方法的數(shù)十倍以上,并且調(diào)度生成消息的端到端延遲在SMT方法的1%以下,大大提高了消息傳輸?shù)募皶r性。
【文章來源】:北京航空航天大學(xué)學(xué)報. 2019,45(09)北大核心EICSCD
【文章頁數(shù)】:8 頁
【文章目錄】:
1流量調(diào)度方法
1.1馬爾可夫模型與強化學(xué)習(xí)
1.2搜索策略
1.3強化學(xué)習(xí)訓(xùn)練
2實驗
2.1實驗條件
2.2實驗結(jié)果
2.3模型魯棒性測試
2.3.1幀長變化
2.3.2增加消息數(shù)量
3結(jié)論
【參考文獻(xiàn)】:
期刊論文
[1]片間綜合化互連時間觸發(fā)通信調(diào)度方法[J]. 孔韻雯,李峭,熊華鋼,程子敬. 航空學(xué)報. 2018(02)
[2]基于混合遺傳算法的TTE靜態(tài)調(diào)度表生成設(shè)計[J]. 李炳乾,王勇,譚小虎,劉達(dá). 電子技術(shù)應(yīng)用. 2016(10)
[3]新一代綜合化航空電子系統(tǒng)構(gòu)架技術(shù)研究[J]. 王國慶,谷青范,王淼,張麗花. 航空學(xué)報. 2014(06)
本文編號:3568035
【文章來源】:北京航空航天大學(xué)學(xué)報. 2019,45(09)北大核心EICSCD
【文章頁數(shù)】:8 頁
【文章目錄】:
1流量調(diào)度方法
1.1馬爾可夫模型與強化學(xué)習(xí)
1.2搜索策略
1.3強化學(xué)習(xí)訓(xùn)練
2實驗
2.1實驗條件
2.2實驗結(jié)果
2.3模型魯棒性測試
2.3.1幀長變化
2.3.2增加消息數(shù)量
3結(jié)論
【參考文獻(xiàn)】:
期刊論文
[1]片間綜合化互連時間觸發(fā)通信調(diào)度方法[J]. 孔韻雯,李峭,熊華鋼,程子敬. 航空學(xué)報. 2018(02)
[2]基于混合遺傳算法的TTE靜態(tài)調(diào)度表生成設(shè)計[J]. 李炳乾,王勇,譚小虎,劉達(dá). 電子技術(shù)應(yīng)用. 2016(10)
[3]新一代綜合化航空電子系統(tǒng)構(gòu)架技術(shù)研究[J]. 王國慶,谷青范,王淼,張麗花. 航空學(xué)報. 2014(06)
本文編號:3568035
本文鏈接:http://www.sikaile.net/kejilunwen/sousuoyinqinglunwen/3568035.html
最近更新
教材專著