分布式數(shù)據(jù)流決策樹VFDT分類算法研究
發(fā)布時間:2017-11-01 15:36
本文關(guān)鍵詞:分布式數(shù)據(jù)流決策樹VFDT分類算法研究
更多相關(guān)文章: 數(shù)據(jù)流 數(shù)據(jù)挖掘 決策樹 Storm SAMOA
【摘要】:隨著大數(shù)據(jù)時代的到來,網(wǎng)絡(luò)上充斥著大量高速變化的數(shù)據(jù)流,然而傳統(tǒng)數(shù)據(jù)挖掘技術(shù)不能很好地直接應(yīng)用到數(shù)據(jù)流上。研究基于決策樹的數(shù)據(jù)流分類挖掘算法,其研究思路是首先描述一般決策樹;然后重點闡述數(shù)據(jù)流決策樹VFDT的算法的實現(xiàn),采用Twitter Storm分布式流式計算框架的并行計算和Yahoo SAMOA機(jī)器學(xué)習(xí)平臺,對VFDT算法進(jìn)行并行化設(shè)計;最后通過實驗驗證并行化的VHT決策樹算法具有良好的運行效率與性能。
【作者單位】: 華南師范大學(xué)物理與電信工程學(xué)院;華南理工大學(xué)經(jīng)濟(jì)與貿(mào)易學(xué)院;
【關(guān)鍵詞】: 數(shù)據(jù)流 數(shù)據(jù)挖掘 決策樹 Storm SAMOA
【基金】:廣東省公益研究與能力建設(shè)專項資金項目(No.2016A020223012,No.2015A020217011) 廣東省交通科技計劃項目(No.2015-02-064) 廣東外語外貿(mào)大學(xué)南國商學(xué)院2016年教改重大項目 廣州大學(xué)華軟軟件學(xué)院重大科研培育項目(20000104與教研項目KY201412)
【分類號】:TP311.13
【正文快照】: 1數(shù)據(jù)流及其典型處理平臺概述隨著互聯(lián)網(wǎng)應(yīng)用的發(fā)展,產(chǎn)生大量的流數(shù)據(jù)(下文采用通用的說法“數(shù)據(jù)流”),與傳統(tǒng)的靜止數(shù)據(jù)不同。數(shù)據(jù)流是海量的、高速的、實時的。其蘊(yùn)涵著大量信息,可以用來作為智能決策的依據(jù)。預(yù)測和分類是基本數(shù)據(jù)分析兩種形式[1],可以用于提取描述重要數(shù)據(jù),
本文編號:1127483
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/1127483.html
最近更新
教材專著