基于卷積LSTM和隨機(jī)森林的短時(shí)降雨量預(yù)測(cè)
發(fā)布時(shí)間:2020-06-14 22:57
【摘要】:在各種天氣事件中,降雨對(duì)人類的生活起著至關(guān)重要的作用。及時(shí)準(zhǔn)確地對(duì)惡劣天氣進(jìn)行預(yù)估,可以減少自然災(zāi)害的發(fā)生。同時(shí),提前預(yù)報(bào)降雨信息,可以減少降雨對(duì)人們生活的影響。然而,降雨預(yù)測(cè)是一個(gè)十分困難的任務(wù),傳統(tǒng)的基于光流法和Z-I關(guān)系的降雨量預(yù)估方案很容易受到探測(cè)條件的影響,而且對(duì)于不同的區(qū)域,需要設(shè)計(jì)不同的預(yù)估方案,通用性不高。因此,設(shè)計(jì)一個(gè)準(zhǔn)確度高且通用性強(qiáng)的降雨預(yù)測(cè)方案具有十分重要的意義。本文在研究了現(xiàn)有的降雨預(yù)測(cè)方法之后,提出了一種基于卷積長短時(shí)記憶網(wǎng)絡(luò)(卷積LSTM)和隨機(jī)森林的短時(shí)降雨量預(yù)測(cè)方法,通過歷史不同區(qū)域多個(gè)時(shí)刻多個(gè)高度的多普勒雷達(dá)圖預(yù)測(cè)未來1-2個(gè)小時(shí)的降雨量。本文使用卷積LSTM模型進(jìn)行雷達(dá)圖外推可以提高預(yù)測(cè)的準(zhǔn)確度,使用隨機(jī)森林算法進(jìn)行集成學(xué)習(xí)可以提高模型的泛化能力,通用性更強(qiáng)。主要的研究工作如下:首先,本文的任務(wù)是預(yù)測(cè)未來1-2個(gè)小時(shí)的降雨量,但多普勒雷達(dá)探測(cè)到的是歷史時(shí)間序列的雷達(dá)圖,無法直接用于預(yù)測(cè)未來時(shí)間段的降雨量,因此本文使用基于編碼-解碼的卷積LSTM網(wǎng)絡(luò)預(yù)測(cè)未來1-2個(gè)小時(shí)的雷達(dá)圖,卷積LSTM在傳統(tǒng)LSTM網(wǎng)絡(luò)的基礎(chǔ)上將每一個(gè)全連接操作改為卷積操作,保留了雷達(dá)圖像的時(shí)空特性,大大地提高了外推結(jié)果的準(zhǔn)確性;其次,經(jīng)過卷積LSTM外推得到的雷達(dá)圖具有40萬維的特征,包含很多冗余特征,且特征維度太高,造成內(nèi)存爆炸,無法進(jìn)行計(jì)算。因此,本文提出了一種分層級(jí)特征提取方法,首先使用主成分分析方法(PCA)對(duì)每張雷達(dá)圖分別降維,其次將各個(gè)時(shí)刻各個(gè)高度降維后的雷達(dá)圖進(jìn)行拼接得到最終結(jié)果,這樣設(shè)計(jì)不僅能夠解決PCA對(duì)高維雷達(dá)圖進(jìn)行特征提取時(shí)內(nèi)存爆炸的問題,而且可以保留雷達(dá)圖總的時(shí)序信息及高度信息;最后,在降雨量預(yù)測(cè)階段,為了提高模型的泛化能力,本文利用隨機(jī)森林的特性,將經(jīng)過雷達(dá)圖外推和PCA降維后的特征作為輸入特征,每次隨機(jī)選取部分特征構(gòu)造決策樹,并通過多棵決策樹進(jìn)行集成學(xué)習(xí),并使用學(xué)習(xí)后的模型預(yù)測(cè)未來1-2個(gè)小時(shí)的降雨量。本文將提出的模型與Z-I關(guān)系,支持向量回歸,xgboost等算法進(jìn)行對(duì)比,實(shí)驗(yàn)表明:(1)使用卷積LSTM模型進(jìn)行雷達(dá)圖外推能夠給降雨量預(yù)測(cè)任務(wù)帶來比較大的性能提升;(2)在命中率,漏報(bào)率,臨界成功指數(shù),均方根誤差等指標(biāo)上,本文提出的模型都獲得了最好的效果,特別是在強(qiáng)降雨階段,效果提升更加明顯,部分指標(biāo)提升比例在20%以上。
【學(xué)位授予單位】:廣東工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2019
【分類號(hào)】:TP18;TN957.52;P457.6
【圖文】:
圖 2-1 單個(gè)樣本的所有雷達(dá)圖信息Fig. 2-1All radar maps for a sample更清晰地了解樣本數(shù)據(jù),按高度和時(shí)間分別畫出其變化趨勢(shì)。圖 2-2 表示1 個(gè)時(shí)刻 4 個(gè)高度下的雷達(dá)圖,高度從左到右分別是 0.5km,1.5km,2.5通過這張圖,可以發(fā)現(xiàn),第一個(gè)高度的雷達(dá)圖與其它高度相比明顯不同,區(qū)域,這部分是因?yàn)槿笔е祵?dǎo)致的。雷達(dá)是通過一個(gè)圓錐體向上散射的,離雷達(dá)太近,沒辦法覆蓋到101 101平方公里的區(qū)域,所以圓弧外部分的采集到,并因此造成缺失值。圖 2-2 單個(gè)樣本第 1 個(gè)時(shí)刻 4 個(gè)高度的雷達(dá)圖信息
表示某個(gè)
【學(xué)位授予單位】:廣東工業(yè)大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2019
【分類號(hào)】:TP18;TN957.52;P457.6
【圖文】:
圖 2-1 單個(gè)樣本的所有雷達(dá)圖信息Fig. 2-1All radar maps for a sample更清晰地了解樣本數(shù)據(jù),按高度和時(shí)間分別畫出其變化趨勢(shì)。圖 2-2 表示1 個(gè)時(shí)刻 4 個(gè)高度下的雷達(dá)圖,高度從左到右分別是 0.5km,1.5km,2.5通過這張圖,可以發(fā)現(xiàn),第一個(gè)高度的雷達(dá)圖與其它高度相比明顯不同,區(qū)域,這部分是因?yàn)槿笔е祵?dǎo)致的。雷達(dá)是通過一個(gè)圓錐體向上散射的,離雷達(dá)太近,沒辦法覆蓋到101 101平方公里的區(qū)域,所以圓弧外部分的采集到,并因此造成缺失值。圖 2-2 單個(gè)樣本第 1 個(gè)時(shí)刻 4 個(gè)高度的雷達(dá)圖信息
表示某個(gè)
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 劉文博;梁盛楠;秦喜文;董小剛;王純杰;;基于迭代隨機(jī)森林算法的糖尿病預(yù)測(cè)[J];長春工業(yè)大學(xué)學(xué)報(bào);2019年06期
2 沈智勇;蘇
本文編號(hào):2713483
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/2713483.html
最近更新
教材專著