天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 路橋論文 >

基于Q學(xué)習(xí)的多路口交通信號協(xié)調(diào)控制研究

發(fā)布時間:2020-09-02 13:32
   交通量的持續(xù)高速增長使得城市交通壓力愈來愈大,交通擁堵問題愈顯突出。現(xiàn)有的交通控制技術(shù)難以有效提高城市路網(wǎng)的交通效率,研究具有學(xué)習(xí)能力的交通信號自適應(yīng)控制技術(shù)是解決這一問題的有效途徑。針對現(xiàn)有交通控制系統(tǒng)存在的問題,本文采用基于Q學(xué)習(xí)及模糊技術(shù)相結(jié)合的交通控制模型及其優(yōu)化方法,構(gòu)建了單路口的交通優(yōu)化控制模型,并在此基礎(chǔ)上構(gòu)建了基于相位差的多路口協(xié)調(diào)控制模型,能夠有效減少車輛延遲,提高路網(wǎng)的整體通行效率。主要研究工作如下:(1)針對現(xiàn)有Q學(xué)習(xí)在交通控制應(yīng)用中狀態(tài)空間過于復(fù)雜,實時性差等問題,在Q學(xué)習(xí)中引入基于經(jīng)驗的狀態(tài)劃分,對狀態(tài)空間進行優(yōu)化;并通過建立交通參數(shù)融合函數(shù)的方式在保持多參數(shù)評價交通狀態(tài)的前提下降低狀態(tài)空間更新的復(fù)雜度;通過為逐個相位進行綠燈配時的手段,進一步降低狀態(tài)空間的復(fù)雜度,提高系統(tǒng)控制的實時性。(2)針對復(fù)雜交通環(huán)境難以建模、現(xiàn)有基于Q學(xué)習(xí)的自適應(yīng)控制方法未充分利用多種交通流參數(shù),對交通流的變化難以給出準確、合理的反饋,本文采用模糊技術(shù)來實現(xiàn)以交通繁忙度、車輛排隊長度等因素為主的交通流變化反饋機制,并結(jié)合改進的Q學(xué)習(xí)構(gòu)建了一種路口交通信號自適應(yīng)控制系統(tǒng)及方法。仿真測試實驗表明,該方法及系統(tǒng)有效地提高了對交通流變化反饋的準確性。(3)針對龐大、復(fù)雜的交通路網(wǎng)難以整體協(xié)調(diào)控制的問題,在上述研究工作的基礎(chǔ)上上,構(gòu)建基于相位差的多路口協(xié)調(diào)控制模型,通過Q學(xué)習(xí)對相鄰路口之間的相位差進行優(yōu)化;為確保相位差協(xié)調(diào)的有效性,在協(xié)調(diào)控制過程中增加決策機制。仿真實驗表明,該協(xié)調(diào)模型及方法,能夠降低多路口協(xié)調(diào)控制的復(fù)雜度,提高多路口協(xié)調(diào)控制的實時性,從而有效提高整個區(qū)域路網(wǎng)的交通效率。
【學(xué)位單位】:南京郵電大學(xué)
【學(xué)位級別】:碩士
【學(xué)位年份】:2018
【中圖分類】:U491.54
【部分圖文】:

基本過程,過程強化


慮使用基于無模型的技術(shù)(如模糊技術(shù),強化學(xué)習(xí)等的 Q 學(xué)習(xí)改進研究本流程種用來解決馬爾可夫決策過程中最優(yōu)化問題的方法。時獎勵和延遲獎勵的能力。在每一步中,Agent 通過 a,隨著狀態(tài)從 s 轉(zhuǎn)移到 s′,Agent 能夠收到一個獎懲路徑,從而使得整個過程強化值的和最大,也就是從包括兩個實體 和 。兩個實體 下, 采取動作 進而得到反饋 并進入狀態(tài)動作

流程圖,交通控制,流程,學(xué)位論文


究生學(xué)位論文 第三章 基于 Q 學(xué)習(xí)及模糊技Q( , ) ← R( , ) +γ ( +1獲得最大的報酬,一個狀態(tài)的 ( )的此式 3.3 可轉(zhuǎn)換成如下所示。Q( , ) ← R( , ) +γ ∈ ( 態(tài)參數(shù),采用狀態(tài)--動作查表的形式對開始

交通狀態(tài),隸屬度函數(shù),綠燈,配時


法準確描述的交通狀態(tài)進行劃分,從而成一個個的類別,這的本領(lǐng)。本文基于模糊事物的本質(zhì)對交通狀態(tài)進行了概括和,人們可以將交通狀態(tài)描述為“非常好”、“很好”、“良好”、綠燈相位的配時時長也可以模糊化為“短”、“很短”、“一般綠燈相位配時時長作為輸入變量設(shè)置模糊語言集合,其中交、“好”、“較好”、“略好”、“一般”、“略差”、“較差”、“差”、 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, };綠燈相位的配時時短”、“短”、“較短”、“略短”、“一般”、“略長”、“較長”、“的記為{ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, }。針規(guī)定:如果相位綠燈配時時間過短,則車輛無法安全的通過則司機可能產(chǎn)生不耐煩心理,甚至?xí)小奥放钡那闆r發(fā)生決定綠燈配時方案的選擇依據(jù)稱為 Q 值。Q 值越大則,選擇變量 Q 值的模糊語言定義為{“負高”“負中”,“負低”,“零”記為{NB, NM, NS, ZO, PS, PM, PB}。交通狀態(tài),相位綠燈時 3.3,3.4,3.5 所示。

【參考文獻】

相關(guān)期刊論文 前10條

1 盧守峰;張術(shù);劉喜敏;;平均排隊長度差最小的單交叉口在線Q學(xué)習(xí)模型[J];公路交通科技;2014年11期

2 胡亞琦;胡翔宇;朱強化;李洪中;;基于模糊控制算法的城市交通區(qū)域協(xié)調(diào)控制[J];計算機工程與應(yīng)用;2015年07期

3 黃衛(wèi)華;龍海燕;方康玲;;具有加權(quán)因子的PID型模糊控制器分析及設(shè)計[J];計算機應(yīng)用研究;2013年07期

4 胡霆;王景成;趙廣磊;苗浩軒;董振江;張震瑋;何軍;付強;;城市交通干線綠波帶全局優(yōu)化方法[J];計算機與應(yīng)用化學(xué);2012年10期

5 楊文臣;張輪;何兆成;楊曦臨;董德存;;Matlab與VC++混合編程及其在交通信號兩級模糊控制中的應(yīng)用[J];公路交通科技;2012年09期

6 齊馳;侯忠生;賈琰;;基于排隊長度均衡的交叉口信號配時優(yōu)化策略[J];控制與決策;2012年08期

7 劉小明;王力;;基于綜合綠波帶最寬的交叉口信號協(xié)調(diào)控制優(yōu)化方法[J];吉林大學(xué)學(xué)報(工學(xué)版);2013年01期

8 劉智勇;宋正東;;城市區(qū)域交通信號的混沌模糊Q學(xué)習(xí)控制[J];計算機工程與應(yīng)用;2012年04期

9 馬祥興;;自尋優(yōu)模糊PID控制器的控制參數(shù)和規(guī)則[J];微計算機信息;2010年34期

10 秦敏;;道路交通瓶頸路口的紅波協(xié)調(diào)控制策略[J];貴州師范學(xué)院學(xué)報;2010年06期

相關(guān)博士學(xué)位論文 前1條

1 文孟飛;城市智能交通系統(tǒng)交通流協(xié)同優(yōu)化與誘導(dǎo)關(guān)鍵技術(shù)研究[D];中南大學(xué);2013年



本文編號:2810663

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/daoluqiaoliang/2810663.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶782e8***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com