天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 理工論文 > 氣象學(xué)論文 >

基于Spark的Canopy-FCM在氣象中的應(yīng)用

發(fā)布時間:2024-04-10 00:44
  隨著氣象事業(yè)現(xiàn)代化水平的不斷提高,氣象部門積累了海量的氣象數(shù)據(jù),如何從海量的氣象數(shù)據(jù)中挖掘出有用的知識,是提高氣象服務(wù)能力的關(guān)鍵所在。針對傳統(tǒng)聚類算法無法有效處理海量數(shù)據(jù)的問題,提出了一種基于Spark框架的Canopy-FCM(Canopy-fuzzy C-means)并行化聚類算法。該算法將Canopy算法與FCM算法相結(jié)合,避免了FCM算法對初始聚類中心敏感的問題,并結(jié)合Spark分布式框架內(nèi)存計算的優(yōu)勢,大大降低了海量氣象數(shù)據(jù)的處理時間。通過采用天津市208個區(qū)域自動氣象站4~10月逐月降水觀測數(shù)據(jù),評估了天津市不同區(qū)域的降水情況。實驗結(jié)果表明,提出的方法不僅可以快速有效地從氣象數(shù)據(jù)中挖掘出有用的信息,同時與基于Hadoop框架下的算法相比,有更高的運行速率和加速比,也為相關(guān)部門有效地做出水旱災(zāi)害監(jiān)測預(yù)警與風(fēng)險防范決策提供了一種全新的思路和方法。

【文章頁數(shù)】:5 頁

【部分圖文】:

圖1Spark架構(gòu)

圖1Spark架構(gòu)

Spark在分布式環(huán)境下采用主從結(jié)構(gòu)模型,包括Driver和Worker節(jié)點,程序運行之前將數(shù)據(jù)存儲在HadoopDistributedFileSystem(HDFS)中,接著Driver會運行應(yīng)用中的方法創(chuàng)建SparkContext以及RDD,DAGScheduler對象....


圖2基于Spark的Canopy-FCM算法流程

圖2基于Spark的Canopy-FCM算法流程

基于Spark的Canopy-FCM算法流程如圖2所示。(1)配置好Spark運行環(huán)境并初始化各參數(shù)。通過hadoopfs-put命令將數(shù)據(jù)上傳到HDFS上,調(diào)用SparkContext的sc.textFile()方法將數(shù)據(jù)轉(zhuǎn)換為Spark-RDD,通過map操作轉(zhuǎn)換為向量緩....


圖3天津降水區(qū)劃圖

圖3天津降水區(qū)劃圖

實驗結(jié)果如圖3所示,由圖3可以看出天津208個區(qū)域自動氣象站降水分布可分為4個區(qū)域,1區(qū)主要集中在中部和北部區(qū)域,共有96個站;2區(qū)集中在東部區(qū)域,共有29個站;3區(qū)集中在東南部,共有31個站;4區(qū)主要集中在西南部,共有52個站。圖4是實驗得到的天津市4個分區(qū)降水量年平均分布圖,....


圖4天津市4個分區(qū)降水量年平均分布

圖4天津市4個分區(qū)降水量年平均分布

圖4是實驗得到的天津市4個分區(qū)降水量年平均分布圖,由圖4可以看出,4個分區(qū)的降水主要集中在6~9月,7月降水量最為顯著,其次是8月、6月、9月,這一趨勢與中國氣象局氣象數(shù)據(jù)中心發(fā)布的天津氣候類型圖(1981-2010)一致。4個分區(qū)的具體分析如下:1區(qū)主要位于天津中部和北部區(qū)域,....



本文編號:3949883

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/projectlw/qxxlw/3949883.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶2def5***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com