天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于機器學(xué)習(xí)的多氣象相態(tài)反演方法研究

發(fā)布時間:2021-03-31 03:40
  氣象與人類衣食住行密不可分,觀測氣象相態(tài)有利于促進國民發(fā)展。目前氣象要素預(yù)報算法的主要手段是數(shù)值預(yù)報。其實質(zhì)就是通過利用高性能電腦對大氣運動的偏微分方程進行計算,根據(jù)某一區(qū)域的氣候背景和天氣演變規(guī)律,推算該區(qū)域幾個小時后,幾天后,甚至是幾周后的環(huán)流形勢,并進行一個定性或者定量的預(yù)報。然而氣象要素預(yù)報現(xiàn)階段也存在一定問題。本論文以機器學(xué)習(xí)作為主要算法,力求在多氣象相態(tài)判別問題上有所突破。首先根據(jù)所獲得的氣象數(shù)據(jù)分析其特點,了解氣象學(xué)知識,結(jié)合專業(yè)人員知識經(jīng)驗,選取所需要的氣象要素數(shù)據(jù)并處理為有效數(shù)據(jù)集。然后設(shè)計適用于多氣象相態(tài)分類模型,判別未來某一時間段內(nèi)某氣象要素的預(yù)測結(jié)果。主要工作如下:1.收集整理了一套適用于機器學(xué)習(xí)訓(xùn)練的氣象相態(tài)數(shù)據(jù)集。首先收集中國區(qū)域范圍1996年至2015年的地面填圖氣象要素數(shù)據(jù)和溫度對數(shù)壓力數(shù)據(jù),并進行匹配,接著剔除異常缺失數(shù)據(jù)以及兩份數(shù)據(jù)集不匹配部分。最后與氣象專業(yè)人員溝通后舍棄對分類判別結(jié)果不起作用的氣象要素,降低數(shù)據(jù)維度,最終得到38種氣象要素作為數(shù)據(jù)源。2.提出了新的氣象相態(tài)分類模型,此模型結(jié)合了支持向量機算法、粒子群優(yōu)化算法以及梯度均衡機制。支持向... 

【文章來源】:湖南師范大學(xué)湖南省 211工程院校

【文章頁數(shù)】:53 頁

【學(xué)位級別】:碩士

【部分圖文】:

基于機器學(xué)習(xí)的多氣象相態(tài)反演方法研究


SVM算法思路圖

決策樹,算法,思路


碩士學(xué)位論文82.2.2決策樹算法理論基礎(chǔ)決策樹算法[18]在20世紀60年代被提出并一直運用、發(fā)展至今,是近階段經(jīng)常被使用的一種數(shù)據(jù)挖掘算法。該算法是一種逼近離散函數(shù)值的典型分類方法,通過加入一系列的規(guī)則對數(shù)據(jù)進行分類。該算法主要包含有選擇特征、生成決策樹以及剪枝三個模塊?傆[決策樹算法的諸多典型算法,ID3算法以及在ID3算法的基礎(chǔ)上完善、改進的C4.5及CART算法較為常見。圖2-2為決策樹算法思路圖中,其步驟為:1.將樣本數(shù)據(jù)中所有的特征屬性看成一個一個的節(jié)點2.對所有特征屬性計算它們的基尼系數(shù),取基尼系數(shù)值最小的屬性為決策樹的根節(jié)點屬性,將數(shù)據(jù)劃分為不同的子節(jié)點3.遞歸所有特征屬性,在選取第一個屬性的基礎(chǔ)上,重新選取一個新的屬性繼續(xù)劃分,直到把所有特征屬性都劃分完決策樹算法構(gòu)建的停止條件:1.當子節(jié)點中只有一種類型的時候停止構(gòu)建決策樹。2.當前節(jié)點樣本數(shù)量少于所需最小樣本數(shù),或大于最大葉節(jié)點數(shù)。圖2-2決策樹算法思路圖2.2.3邏輯回歸算法理論基礎(chǔ)邏輯回歸算法[19]是一種經(jīng)典的二分類算法。該算法原理是線性回歸,優(yōu)點在于能較好的尋找“危險因素”,F(xiàn)階段在大數(shù)據(jù)運用、醫(yī)療救治等方面應(yīng)用相對廣泛。該算法在原理上利用已知量推測未知量。如二進制零或者一,對或者錯,有或者無等,預(yù)測一個0-1之間的數(shù)值,來推論與數(shù)值相對應(yīng)的預(yù)測結(jié)果。邏輯回歸的算法步驟如下:(1)選擇預(yù)測函數(shù)。選擇的預(yù)測函數(shù)是具備預(yù)測結(jié)果的分類函數(shù)。(2)構(gòu)造損失函數(shù)。構(gòu)造的該函數(shù)綜合選擇預(yù)測函數(shù)與訓(xùn)練類別的“損失”。(3)損失函數(shù)數(shù)值越小,表明該算法預(yù)測的結(jié)果越精準。邏輯回歸算法有很多優(yōu)點,如簡單、高效、可解釋性高,不同特征權(quán)重可直接明了查看對結(jié)果影響;訓(xùn)練速度快;占用內(nèi)存小等。但是也存在

流程圖,算法,流程圖,樣本


基于機器學(xué)習(xí)的多氣象相態(tài)反演方法研究9率不是很高;很難處理數(shù)據(jù)不平衡問題,對正負樣本的區(qū)分能力不強。2.3處理樣本不平衡方法樣本不平衡是指樣本中給定數(shù)據(jù)集的數(shù)據(jù)多少存在差異,且差異樣本存在較大的比例。樣本的不平衡會導(dǎo)致在提取樣本規(guī)律以及在確定模型的準確率上出現(xiàn)一定程度的誤差。對于多氣象相態(tài)分類器來說,簡單樣本的數(shù)量非常大,他們產(chǎn)生的累計貢獻在模型更新中占主導(dǎo)作用,而這部分樣本本身就能被模型很好地分類,所以這部分的參數(shù)更新并不會改善模型的判斷能力,這會導(dǎo)致整個訓(xùn)練變得低效。近年來不少研究者針對樣本不均衡問題進行深入了研究,目前比較典型的有在線困難樣本挖掘(OHEM)、基于對抗生成網(wǎng)絡(luò)的方式來生成困難樣本、FocalLoss、梯度均衡機制(GHM)。2.3.1在線困難樣本挖掘算法(OHEM)在線困難樣本挖掘算法[20](OHEM)是較好的處理樣本不平衡的算法之一。該算法于2016年,在三大世界頂級計算機視覺會議之一的國際計算機視覺與模式識別會議上發(fā)表,近幾年得到了較好的發(fā)展。該算法的核心原理就是自動篩選困難樣本(即不平衡樣本)。在算法實際操作中,將原來的一個ROINetwork擴充為兩個。這兩個共享參數(shù)。前一個ROINetwork計算損失,只具備向前操作;后面一個ROINetwork輸入樣本回傳梯度,前后向操作均可。該算法在目標檢測框架中被大量使用,如FastRCNN。在線挖掘算法流程圖如圖2-3所示。該算法的優(yōu)點:1針對數(shù)據(jù)類別不平衡問題的解決更加簡潔、高效。2數(shù)據(jù)類別越大,算法的優(yōu)越性越突出。該算法的缺點:對簡單樣本的判別能力不高。圖2-3在線困難挖掘算法流程圖


本文編號:3110714

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/shoufeilunwen/benkebiyelunwen/3110714.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶1fd40***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com