基于深度強化學(xué)習(xí)的GWLF模型優(yōu)化研究
發(fā)布時間:2023-06-02 22:00
GWLF模型被認(rèn)為是評價流域污染的一種有效的流域負荷模型。該模型通過輸入氣象數(shù)據(jù),通過數(shù)學(xué)方式模擬整個過程,最終進行流域水文預(yù)測。不同的GWLF模型具有不同的類型參數(shù),參數(shù)的數(shù)量、范圍和精度不同,具有數(shù)量大、范圍廣、精度不確定性等特點。通過優(yōu)化這些參數(shù)能夠有效提高預(yù)測的效果和效率。然而,控制這些參數(shù)需要事先儲備的相關(guān)專業(yè)知識和大量的、幾乎詳盡的測試。GWLF模型參數(shù)優(yōu)化所提出的挑戰(zhàn)促使了本文的研究。本文提出了一種基于深度強化學(xué)習(xí)(Deep Reinforcement Learning)的智能體參數(shù)優(yōu)化模型,用于解決多參數(shù)輸入,并找到參數(shù)值的最佳組合的問題。本文使用了在離散動作空間中表現(xiàn)優(yōu)異的深度強化學(xué)習(xí)算法DQN作為基礎(chǔ)算法,提出了狀態(tài)空間、動作空間和獎勵函數(shù)的建模方法,并提出了更加有效的參數(shù)初始化方法,以及在優(yōu)化過程中自動修改調(diào)節(jié)步長的新策略。該模型基于神經(jīng)網(wǎng)絡(luò)的擬合能力和強化學(xué)習(xí)的決策能力,使用涇河流域的GWLF模型以及真實的氣象數(shù)據(jù)進行的實驗表明,該模型可以在較短的訓(xùn)練時間內(nèi)找到NSE大于0.8的值,比其他優(yōu)化相同GWLF模型的算法精度更高且耗時更少。最后,通過簡單的實驗驗證了該...
【文章頁數(shù)】:65 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 課題來源
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 GWLF模型調(diào)優(yōu)
1.2.2 黑盒優(yōu)化問題研究
1.2.3 基于強化學(xué)習(xí)的優(yōu)化研究
1.3 本文研究目的和主要內(nèi)容
1.4 文章組織結(jié)構(gòu)
第2章 相關(guān)技術(shù)和方法介紹
2.1 GWLF模型參數(shù)優(yōu)化
2.2 深度強化學(xué)習(xí)
2.2.1 強化學(xué)習(xí)
2.2.2 Deep Q Network
2.2.3 DQN的改進算法
2.3 布谷鳥搜索算法
2.4 本章小結(jié)
第3章 基于DQN的GWLF調(diào)參模型設(shè)計
3.1 調(diào)參模型的框架設(shè)計
3.2 GWLF環(huán)境模型的設(shè)計
3.2.1 狀態(tài)空間和動作空間
3.2.2 獎勵函數(shù)
3.3 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的設(shè)計
3.4 參數(shù)調(diào)節(jié)過程的設(shè)計
3.4.1 參數(shù)初始化方法
3.4.2 步長調(diào)節(jié)方法
3.5 本章小結(jié)
第4章 模型的實現(xiàn)與優(yōu)化
4.1 GWLF模型參數(shù)優(yōu)化算法的實現(xiàn)
4.1.1 基于Gym的環(huán)境模型結(jié)構(gòu)介紹
4.1.2 調(diào)參算法實現(xiàn)
4.2 GWLF模型參數(shù)和數(shù)據(jù)集介紹
4.3 調(diào)參模型超參數(shù)整定
4.4 本章小結(jié)
第5章 實驗與結(jié)果分析
5.1 GO-DQN算法與其他優(yōu)化算法的對比
5.2 結(jié)合布谷鳥搜索算法
5.3 改進優(yōu)化后的GO-DQN*算法
5.4 模型的泛化能力試驗
5.4.1 預(yù)訓(xùn)練模型的使用
5.4.2 其他GWLF模型
5.4.3 其他參數(shù)優(yōu)化問題
5.5 本章小結(jié)
第6章 總結(jié)與展望
6.1 總結(jié)
6.2 展望
參考文獻
附錄
發(fā)表論文和參加科研情況說明
致謝
本文編號:3828101
【文章頁數(shù)】:65 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
ABSTRACT
第1章 緒論
1.1 課題來源
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 GWLF模型調(diào)優(yōu)
1.2.2 黑盒優(yōu)化問題研究
1.2.3 基于強化學(xué)習(xí)的優(yōu)化研究
1.3 本文研究目的和主要內(nèi)容
1.4 文章組織結(jié)構(gòu)
第2章 相關(guān)技術(shù)和方法介紹
2.1 GWLF模型參數(shù)優(yōu)化
2.2 深度強化學(xué)習(xí)
2.2.1 強化學(xué)習(xí)
2.2.2 Deep Q Network
2.2.3 DQN的改進算法
2.3 布谷鳥搜索算法
2.4 本章小結(jié)
第3章 基于DQN的GWLF調(diào)參模型設(shè)計
3.1 調(diào)參模型的框架設(shè)計
3.2 GWLF環(huán)境模型的設(shè)計
3.2.1 狀態(tài)空間和動作空間
3.2.2 獎勵函數(shù)
3.3 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的設(shè)計
3.4 參數(shù)調(diào)節(jié)過程的設(shè)計
3.4.1 參數(shù)初始化方法
3.4.2 步長調(diào)節(jié)方法
3.5 本章小結(jié)
第4章 模型的實現(xiàn)與優(yōu)化
4.1 GWLF模型參數(shù)優(yōu)化算法的實現(xiàn)
4.1.1 基于Gym的環(huán)境模型結(jié)構(gòu)介紹
4.1.2 調(diào)參算法實現(xiàn)
4.2 GWLF模型參數(shù)和數(shù)據(jù)集介紹
4.3 調(diào)參模型超參數(shù)整定
4.4 本章小結(jié)
第5章 實驗與結(jié)果分析
5.1 GO-DQN算法與其他優(yōu)化算法的對比
5.2 結(jié)合布谷鳥搜索算法
5.3 改進優(yōu)化后的GO-DQN*算法
5.4 模型的泛化能力試驗
5.4.1 預(yù)訓(xùn)練模型的使用
5.4.2 其他GWLF模型
5.4.3 其他參數(shù)優(yōu)化問題
5.5 本章小結(jié)
第6章 總結(jié)與展望
6.1 總結(jié)
6.2 展望
參考文獻
附錄
發(fā)表論文和參加科研情況說明
致謝
本文編號:3828101
本文鏈接:http://www.sikaile.net/wenshubaike/qiuzhijiqiao/3828101.html
最近更新
教材專著