基于Sarsa學習算法的路徑誘導算法研究
本文關鍵詞:基于Sarsa學習算法的路徑誘導算法研究,由筆耕文化傳播整理發(fā)布。
【摘要】:近幾十年來,隨著我國城市機動化和城鎮(zhèn)化的加快,城市遭遇了許多交通問題,如交通擁堵、交通安全、交通污染等。在城市地區(qū),交通擁堵是最為普遍的交通問題,許多學者對解決城市交通擁堵問題作出了努力并提出了多種解決方案。其中,智能交通系統(tǒng)(ITS)是一種有效的解決交通問題的系統(tǒng)。作為智能交通系統(tǒng)的重要研究方面,中心式動態(tài)路徑誘導系統(tǒng)是目前公認的提高交通效率、緩解交通擁堵的最佳途徑。由于交通系統(tǒng)復雜多變、影響因素眾多、路網(wǎng)規(guī)模龐大,基于精密交通流數(shù)學模型的路徑誘導的實施困難極大,對于數(shù)學模型要求較低的智能技術是目前行之有效的方法。為此,本文利用人工智能手段中的強化學習策略來建立中心式動態(tài)路徑誘導策略。首先,我們設計基于Sarsa學習的在線的動態(tài)路徑誘導模式來優(yōu)化路網(wǎng)的整體使用效率。其次,從整個交通系統(tǒng)的角度出發(fā),并考慮到交通系統(tǒng)的中各個局部交通環(huán)境的區(qū)別提出了基于全局和局部聯(lián)合控制策略作為Sarsa學習的行為選擇函數(shù)。最后,為了解決大規(guī)模路網(wǎng)中Sarsa學習尋優(yōu)困難的問題,采用基于進化的聚類技術劃分原始交通網(wǎng)來建立多層次網(wǎng)絡,使得基于多層網(wǎng)絡的動態(tài)路徑誘導算法可以很快的收斂。本文在研究路徑誘導算法的基礎上,將中心式路徑誘導系統(tǒng)、強化學習、全局和局部聯(lián)合控制策略以及多目標遺傳算法聚類生成多層網(wǎng)的研究特色融合在路徑誘導算法中,尤其是應用了強化學習中的適合在動態(tài)系統(tǒng)中在線學習的Sarsa學習算法。實驗結果顯示,本文提出的基于Sarsa學習的路徑誘導算法不但可以減少交通系統(tǒng)中車輛的平均行駛時間,還能減少系統(tǒng)中的擁堵現(xiàn)象,提高了交通系統(tǒng)的效率。并且,本文在該算法的基礎上,分別從強化學習的行為選擇函數(shù)和“狀態(tài) 行為”搜索空間的角度進行了改進,實驗結果顯示,這些算法進一步的提高了交通系統(tǒng)的效率。
【關鍵詞】:路徑誘導系統(tǒng) 強化學習 Sarsa學習 遺傳算法 多層網(wǎng)方法
【學位授予單位】:沈陽理工大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:U495;TP18
【目錄】:
- 摘要7-8
- Abstract8-13
- 第1章 緒論13-19
- 1.1 研究的背景和意義13-14
- 1.2 國內外研究現(xiàn)狀14-17
- 1.3 研究的目標和內容17-18
- 1.4 本文組織結構18-19
- 第2章 相關研究工作19-27
- 2.1 引言19
- 2.2 強化學習19-24
- 2.2.1 基于強化學習的智能控制方法20-21
- 2.2.2 強化學習的MDP模型21
- 2.2.3 強化學習的最優(yōu)策略21-22
- 2.2.4 行為選擇策略22-23
- 2.2.5 TD算法23
- 2.2.6 Sarsa學習算法23-24
- 2.3 中心式路徑誘導系統(tǒng)24-25
- 2.4 本章小結25-27
- 第3章 基于Sarsa學習的路徑誘導算法27-35
- 3.1 引言27
- 3.2 傳統(tǒng)路徑誘導算法27-29
- 3.2.1 Dijkstra算法28
- 3.2.2 A*算法28-29
- 3.3 基于Sarsa學習路徑誘導系統(tǒng)的強化學習模型29-31
- 3.3.1 路徑誘導算法的強化學習模型29
- 3.3.2 Q值表29-30
- 3.3.3 基于Q值的動態(tài)規(guī)劃算法30-31
- 3.4 基于Sarsa學習的路徑誘導算法31-34
- 3.5 本章小結34-35
- 第4章 基于全局和局部聯(lián)合控制策略的動態(tài)路徑誘導算法35-44
- 4.1 引言35-36
- 4.2 基于全局和局部聯(lián)合控制策略的波茲曼概率分布36-38
- 4.2.1 改進的波茲曼概率分布36-37
- 4.2.2 全局控制策略37
- 4.2.3 局部控制策略37-38
- 4.3 基于全局和局部聯(lián)合控制策略的動態(tài)路徑誘導算法38-40
- 4.4 全局和局部控制參數(shù)分析40-43
- 4.5 本章小結43-44
- 第5章 基于多層網(wǎng)絡的Sarsa學習路徑誘導算法44-56
- 5.1 引言44-45
- 5.2 多層網(wǎng)45-48
- 5.3 遺傳算法聚類48-49
- 5.3.1 遺傳算法48-49
- 5.3.2 基于遺傳算法的聚類分析49
- 5.4 基于遺傳算法的多層網(wǎng)方法49-51
- 5.5 基于多層網(wǎng)的路徑誘導算法51-55
- 5.6 本章小結55-56
- 第6章 仿真與實驗結果分析56-69
- 6.1 SUMO仿真器56-58
- 6.1.1 SUMO仿真器介紹56-57
- 6.1.2 SUMO仿真器界面57-58
- 6.2 路徑誘導算法算法仿真實驗58-68
- 6.2.1 仿真設置58-59
- 6.2.2 基于Sarsa學習的路徑誘導算法59-64
- 6.2.3 基于全局和局部聯(lián)合控制策略的動態(tài)路徑誘導算法64-67
- 6.2.4 基于多層網(wǎng)絡的Sarsa學習路徑誘導算法67-68
- 6.3 本章小結68-69
- 結論69-71
- 參考文獻71-77
- 攻讀碩士學位期間發(fā)表的論文和獲得的科研成果77-78
- 致謝78-79
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 蘇海濱;王繼東;侯朝楨;;道路網(wǎng)絡分層的快速路徑誘導算法[J];火力與指揮控制;2008年07期
2 陸陽;胡堅明;張佐;王順智;高逸涵;;面向北京市路網(wǎng)特點的新型路徑誘導算法及實現(xiàn)[J];交通信息與安全;2009年02期
3 文孟飛;彭軍;劉偉榮;李沖;張曉勇;;一種增量式多目標優(yōu)化的智能交通路徑誘導方法[J];湖南大學學報(自然科學版);2013年05期
4 朱權;安實;謝秉磊;;雙目標路徑誘導下的交通信息定價策略[J];交通運輸工程學報;2007年01期
5 金照;徐建閩;;數(shù)據(jù)融合技術在路徑誘導中的應用研究[J];交通與計算機;2008年04期
6 何鵬;潘君;薛倩;;基于遺傳算法的駕駛員動態(tài)路徑誘導研究[J];現(xiàn)代電子技術;2009年15期
7 潘海珠;杜曉昕;王波;;交通路徑誘導系統(tǒng)中最優(yōu)路徑選取研究與仿真[J];計算機仿真;2012年07期
8 李志純,黃海軍;多目標路徑誘導下平衡市場滲透率的確定[J];系統(tǒng)工程理論與實踐;2004年09期
9 杜長海;黃席樾;楊祖元;唐明霞;楊芳勛;;改進的蟻群算法在動態(tài)路徑誘導中的應用研究[J];計算機工程與應用;2008年27期
10 董永峰;劉艷柳;張娜;顧軍華;;基于改進蟻群算法的動態(tài)多路徑誘導系統(tǒng)研究[J];河北工業(yè)大學學報;2010年03期
中國重要會議論文全文數(shù)據(jù)庫 前8條
1 秦進;侯桂榮;;基于車輛的混合式路徑誘導系統(tǒng)分析[A];2007第三屆中國智能交通年會論文集[C];2007年
2 秦進;史峰;侯桂榮;;基于車輛的混合式路徑誘導系統(tǒng)[A];第二十七屆中國控制會議論文集[C];2008年
3 毛永明;張東偉;;智能交通動態(tài)路徑誘導算法研究[A];第十屆沈陽科學學術年會論文集(信息科學與工程技術分冊)[C];2013年
4 倪玲霖;秦進;;基于車輛的混合式路徑誘導系統(tǒng)框架研究[A];2011年中國智能自動化學術會議論文集(第一分冊)[C];2011年
5 楊立才;賈磊;孔慶杰;;基于人工免疫系統(tǒng)的動態(tài)路徑誘導算法研究[A];可持續(xù)發(fā)展的中國交通——2005全國博士生學術論壇(交通運輸工程學科)論文集(下冊)[C];2005年
6 梅振宇;項貽強;陳峻;王煒;;非完全動態(tài)信息下基于風險估計的路徑誘導方法[A];2007第三屆中國智能交通年會論文集[C];2007年
7 王冠生;鄭江華;瓦哈甫·哈力克;李榮立;;基于Haptic技術的盲人輔助路徑誘導服務研制[A];地理學核心問題與主線——中國地理學會2011年學術年會暨中國科學院新疆生態(tài)與地理研究所建所五十年慶典論文摘要集[C];2011年
8 王英杰;程琳;王煒;;交通網(wǎng)絡不確定性分析及路徑誘導信息提供[A];2007第三屆中國智能交通年會論文集[C];2007年
中國重要報紙全文數(shù)據(jù)庫 前1條
1 李卉;智能交通產(chǎn)業(yè)風光無限[N];中國機電日報;2002年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 張鍇;基于自適應量子人工魚群算法的動態(tài)路徑誘導研究[D];東北大學;2014年
2 王藝凱;基于路徑誘導折線蟻群算法的路徑優(yōu)化研究[D];遼寧大學;2016年
3 王星喬;基于Sarsa學習算法的路徑誘導算法研究[D];沈陽理工大學;2016年
4 范東凱;城市動態(tài)路徑誘導算法研究[D];長安大學;2006年
5 孫霞;基于改進遺傳算法的城市交通路徑誘導系統(tǒng)的研究[D];重慶大學;2007年
6 梁晶;哈爾濱市交通路徑誘導系統(tǒng)研究[D];哈爾濱工程大學;2011年
7 趙丹;城市交通路徑誘導算法研究[D];長安大學;2009年
8 趙俊軍;基于演化博弈與人工免疫的路徑誘導算法研究[D];昆明理工大學;2013年
9 韓星;災變條件下公路網(wǎng)動態(tài)路徑誘導決策模型與算法設計[D];北京交通大學;2010年
10 郝新剛;車輛導航系統(tǒng)路徑誘導算法研究[D];山東科技大學;2011年
本文關鍵詞:基于Sarsa學習算法的路徑誘導算法研究,由筆耕文化傳播整理發(fā)布。
,本文編號:361306
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/361306.html