天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于云平臺(tái)下的數(shù)據(jù)挖掘研究

發(fā)布時(shí)間:2017-10-13 15:17

  本文關(guān)鍵詞:基于云平臺(tái)下的數(shù)據(jù)挖掘研究


  更多相關(guān)文章: 云計(jì)算 數(shù)據(jù)挖掘 MapReduce HDFS 集群 K-Means


【摘要】:生活在信息大爆炸的時(shí)代,社會(huì)網(wǎng)絡(luò)產(chǎn)生數(shù)字圖像、視頻、網(wǎng)絡(luò)博客,網(wǎng)絡(luò)社區(qū)等形形色色的數(shù)據(jù)。但是隨著數(shù)據(jù)的數(shù)據(jù)源種類越來(lái)越多樣化,數(shù)據(jù)的爆炸式增長(zhǎng),傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)已經(jīng)不能滿足我們的要求,需要建立一種新的有效機(jī)制來(lái)實(shí)現(xiàn)海量數(shù)據(jù)的分析處理。而云計(jì)算平臺(tái)下的數(shù)據(jù)挖掘的出現(xiàn)是由于其能提供大規(guī)模的存儲(chǔ)空間,便于海量數(shù)據(jù)的存儲(chǔ),同時(shí)具有很高的可擴(kuò)展性,編程人員能夠在它們的服務(wù)之上構(gòu)建無(wú)縫可擴(kuò)展的應(yīng)用。因此,如果能夠優(yōu)化傳統(tǒng)的數(shù)據(jù)挖掘算法將其部署到云計(jì)算平臺(tái)之上,便可解決海量數(shù)據(jù)處理難的問(wèn)題。但是,將傳統(tǒng)經(jīng)典算法部署到云計(jì)算平臺(tái)架構(gòu)之上,也會(huì)遇到很多問(wèn)題。(1)處理大數(shù)據(jù)中的算法重復(fù)迭代是不可避免的難題;(2)數(shù)據(jù)循環(huán)遍歷產(chǎn)生的通信成本負(fù)荷重;(3)傳統(tǒng)算法分析處理海量數(shù)據(jù)的時(shí)間慢,產(chǎn)生的I/O成本和網(wǎng)絡(luò)成本大。針對(duì)傳統(tǒng)數(shù)據(jù)挖掘技術(shù)在云計(jì)算平臺(tái)上遇到的問(wèn)題,本文首先從云計(jì)算平臺(tái)和數(shù)據(jù)挖掘的基本原理[35]出發(fā),分析云計(jì)算中的相關(guān)技術(shù)、討論并行編程模型MapReduce的編程原理、分布式系統(tǒng)HDFS的存儲(chǔ)方式以及基于云計(jì)算的Hadoop平臺(tái)的數(shù)據(jù)挖掘架構(gòu),提出使用云計(jì)算下的數(shù)據(jù)挖掘處理機(jī)制來(lái)解決處理大規(guī)模數(shù)據(jù)難的問(wèn)題,并獲得較高的性能;其次針對(duì)大數(shù)據(jù)的數(shù)據(jù)類型多樣化和數(shù)據(jù)量的倍增,提出對(duì)基于云計(jì)算平臺(tái)下的傳統(tǒng)數(shù)據(jù)挖掘算法K-Means算法進(jìn)行優(yōu)化的方案,消除迭代算法的依賴性和減少計(jì)算成本;最后將優(yōu)化后的K-Means算法移植到Hadoop平臺(tái)進(jìn)行試驗(yàn),通過(guò)Hadoop集群下的MapReduce的編程計(jì)算模式調(diào)用優(yōu)化后的K-Means算法,驗(yàn)證優(yōu)化后的算法的有效性和可靠性。
【關(guān)鍵詞】:云計(jì)算 數(shù)據(jù)挖掘 MapReduce HDFS 集群 K-Means
【學(xué)位授予單位】:華東交通大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP393.09;TP311.13
【目錄】:
  • 摘要3-4
  • ABSTRACT4-7
  • 第一章 緒論7-10
  • 1.1 前言7-8
  • 1.2 國(guó)內(nèi)外研究現(xiàn)狀8-9
  • 1.3 本文研究?jī)?nèi)容與創(chuàng)新9
  • 1.4 本文組織結(jié)構(gòu)9-10
  • 第二章 云計(jì)算和海量數(shù)據(jù)挖掘技術(shù)的概述10-17
  • 2.1 云計(jì)算10-12
  • 2.1.1 云計(jì)算的概念10
  • 2.1.2 云計(jì)算的基本原理10
  • 2.1.3 云計(jì)算的體系架構(gòu)10-11
  • 2.1.4 云計(jì)算的關(guān)鍵技術(shù)11-12
  • 2.2 數(shù)據(jù)挖掘12-16
  • 2.2.1 數(shù)據(jù)挖掘的現(xiàn)狀及前景12-13
  • 2.2.2 數(shù)據(jù)挖掘的經(jīng)典算法13-15
  • 2.2.3 數(shù)據(jù)挖掘的應(yīng)用15-16
  • 2.3 本章小結(jié)16-17
  • 第三章 基于云計(jì)算的數(shù)據(jù)挖掘算法17-25
  • 3.1 云計(jì)算支持下的數(shù)據(jù)挖掘算法的來(lái)源17
  • 3.2 MapReduce為基礎(chǔ)的傳統(tǒng)K-Means算法17-21
  • 3.3 HADOOP MapRuduce編程模型21-24
  • 3.3.1 MapRuduce編程模型原理21
  • 3.3.2 MapReduce執(zhí)行過(guò)程21-22
  • 3.3.3 Hadoop MapRduce模式22-24
  • 3.4 本章小結(jié)24-25
  • 第四章 基于云計(jì)算的Hadoop平臺(tái)下的數(shù)據(jù)挖掘的優(yōu)化25-36
  • 4.1 Hadoop的背景及處理海量數(shù)據(jù)的優(yōu)勢(shì)25-26
  • 4.2 分布式文件系統(tǒng)HDFS26-27
  • 4.3 并行計(jì)算模型MapRuduce27-28
  • 4.4 基于HADOOP平臺(tái)下的挖掘算法的優(yōu)化28-35
  • 4.4.1 系統(tǒng)架構(gòu)介紹28-29
  • 4.4.2 系統(tǒng)設(shè)計(jì)原則29-30
  • 4.4.3 基于K-Means算法在云計(jì)算平臺(tái)上的優(yōu)化設(shè)計(jì)30-35
  • 4.4.3.1 Map函數(shù)的設(shè)計(jì)31-33
  • 4.4.3.2 Combine函數(shù)的設(shè)計(jì)33
  • 4.4.3.3 Reduce函數(shù)的設(shè)計(jì)33-34
  • 4.4.3.4 基于K-Means算法的優(yōu)化設(shè)計(jì)34-35
  • 4.5 傳統(tǒng)的K-Means算法與優(yōu)化后的K-Means算法的對(duì)比分析35
  • 4.6 本章小結(jié)35-36
  • 第五章 實(shí)驗(yàn)結(jié)果評(píng)測(cè)及分析36-43
  • 5.1 測(cè)試環(huán)境36-39
  • 5.1.1 JDK配置36-37
  • 5.1.2 SSH配置37
  • 5.1.3 Hadoop的安裝和配置37-39
  • 5.2 試驗(yàn)分析39-42
  • 5.2.1 試驗(yàn)數(shù)據(jù)39-41
  • 5.2.2 實(shí)驗(yàn)結(jié)果41-42
  • 5.3 本章小結(jié)42-43
  • 第六章 總結(jié)與展望43-44
  • 6.1 本文總結(jié)43
  • 6.2 工作展望43-44
  • 參考文獻(xiàn)44-46
  • 個(gè)人簡(jiǎn)歷 在讀期間發(fā)表的學(xué)術(shù)論文46-47
  • 致謝47

【相似文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條

1 香麗蕓;淺談數(shù)據(jù)挖掘及其應(yīng)用[J];昌吉師專學(xué)報(bào);2001年02期

2 鄭雪燕,張杰明,岳洋;數(shù)據(jù)挖掘語(yǔ)言[J];計(jì)算機(jī)時(shí)代;2001年11期

3 劉明晶;數(shù)據(jù)挖掘[J];華南金融電腦;2001年04期

4 張偉;劉勇國(guó);彭軍;廖曉峰;吳中福;;數(shù)據(jù)挖掘發(fā)展研究[J];計(jì)算機(jī)科學(xué);2001年07期

5 鐘曉;馬少平;張鈸;俞瑞釗;;數(shù)據(jù)挖掘綜述[J];模式識(shí)別與人工智能;2001年01期

6 朱建平,張潤(rùn)楚;數(shù)據(jù)挖掘的發(fā)展及其特點(diǎn)[J];統(tǒng)計(jì)與決策;2002年07期

7 傅嵐;在數(shù)據(jù)海洋中打撈信息數(shù)據(jù)挖掘[J];科技廣場(chǎng);2002年11期

8 李峻;數(shù)據(jù)挖掘,企業(yè)洞察先機(jī)的“慧眼”[J];中國(guó)計(jì)算機(jī)用戶;2002年48期

9 羅可,蔡碧野,卜勝賢,謝中科;數(shù)據(jù)挖掘及其發(fā)展研究[J];計(jì)算機(jī)工程與應(yīng)用;2002年14期

10 ;2002數(shù)據(jù)挖掘研討班[J];計(jì)算機(jī)工程;2002年06期

中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前10條

1 史東輝;蔡慶生;張春陽(yáng);;一種新的數(shù)據(jù)挖掘多策略方法研究[A];第十七屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2000年

2 張弦;;數(shù)據(jù)挖掘在農(nóng)業(yè)中的應(yīng)用[A];紀(jì)念中國(guó)農(nóng)業(yè)工程學(xué)會(huì)成立30周年暨中國(guó)農(nóng)業(yè)工程學(xué)會(huì)2009年學(xué)術(shù)年會(huì)(CSAE 2009)論文集[C];2009年

3 魏順平;;教育數(shù)據(jù)挖掘:現(xiàn)狀與趨勢(shì)[A];信息化、工業(yè)化融合與服務(wù)創(chuàng)新——第十三屆計(jì)算機(jī)模擬與信息技術(shù)學(xué)術(shù)會(huì)議論文集[C];2011年

4 關(guān)清平;沉培輝;;概率網(wǎng)絡(luò)在數(shù)據(jù)挖掘上的應(yīng)用[A];科技、工程與經(jīng)濟(jì)社會(huì)協(xié)調(diào)發(fā)展——中國(guó)科協(xié)第五屆青年學(xué)術(shù)年會(huì)論文集[C];2004年

5 丁瑾;;基于Web數(shù)據(jù)挖掘的綜述[A];山西省科學(xué)技術(shù)情報(bào)學(xué)會(huì)學(xué)術(shù)年會(huì)論文集[C];2004年

6 聶茹;田森平;;Web數(shù)據(jù)挖掘及其在電子商務(wù)中的應(yīng)用[A];中南六。▍^(qū))自動(dòng)化學(xué)會(huì)第24屆學(xué)術(shù)年會(huì)會(huì)議論文集[C];2006年

7 李菊;王軍;;數(shù)據(jù)挖掘在客戶關(guān)系管理的應(yīng)用[A];計(jì)算機(jī)技術(shù)與應(yīng)用進(jìn)展·2007——全國(guó)第18屆計(jì)算機(jī)技術(shù)與應(yīng)用(CACIS)學(xué)術(shù)會(huì)議論文集[C];2007年

8 肖陽(yáng);李啟賢;;數(shù)據(jù)挖掘在中國(guó)鋼鐵行業(yè)中的應(yīng)用[A];中國(guó)計(jì)量協(xié)會(huì)冶金分會(huì)2012年會(huì)暨能源計(jì)量與節(jié)能降耗經(jīng)驗(yàn)交流會(huì)論文集[C];2012年

9 楊磊;王貴成;汪勇;張占勝;;SQL Server 2005在數(shù)據(jù)挖掘中的應(yīng)用[A];2009年中國(guó)智能自動(dòng)化會(huì)議論文集(第二分冊(cè))[C];2009年

10 謝中;邱玉輝;;面向商務(wù)網(wǎng)站有效性的數(shù)據(jù)挖掘方法[A];第十八屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2001年

中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前10條

1 本報(bào)記者褚寧;數(shù)據(jù)挖掘如“挖金”[N];解放日?qǐng)?bào);2002年

2 周蓉蓉;數(shù)據(jù)挖掘需要點(diǎn)想像力[N];計(jì)算機(jī)世界;2004年

3 □中國(guó)電信股份有限公司北京研究院 張舒博 □北京郵電大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院 牛琨;走出數(shù)據(jù)挖掘的誤區(qū)[N];人民郵電;2006年

4 《網(wǎng)絡(luò)世界》記者 王瑩;數(shù)據(jù)挖掘保險(xiǎn)業(yè)的新藍(lán)海[N];網(wǎng)絡(luò)世界;2012年

5 劉俊麗;基于地理化的網(wǎng)絡(luò)數(shù)據(jù)挖掘與分析提升投資有效性[N];人民郵電;2014年

6 本報(bào)記者 連曉東;數(shù)據(jù)挖掘:金融信息化新熱點(diǎn)[N];中國(guó)電子報(bào);2002年

7 本報(bào)記者 鳳小華 朱仁康;“數(shù)字挖掘軟件”引領(lǐng)中國(guó)信息化新浪潮[N];中國(guó)電子報(bào);2003年

8 本報(bào)記者 史延廷;“成功企業(yè)數(shù)據(jù)挖掘暨數(shù)量化管理論壇”在京舉辦[N];中國(guó)旅游報(bào);2002年

9 朱小寧;數(shù)據(jù)挖掘:信息化戰(zhàn)爭(zhēng)的基礎(chǔ)工程[N];解放軍報(bào);2005年

10 本報(bào)記者 王小平;從“大集中”走向數(shù)據(jù)挖掘[N];金融時(shí)報(bào);2002年

中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條

1 于自強(qiáng);海量流數(shù)據(jù)挖掘相關(guān)問(wèn)題研究[D];山東大學(xué);2015年

2 張馨;全基因組SNP芯片應(yīng)用于CNV和L0H分析的軟件比對(duì)與數(shù)據(jù)挖掘[D];復(fù)旦大學(xué);2011年

3 彭計(jì)紅;基于數(shù)據(jù)挖掘的癡呆中醫(yī)證的研究[D];南京中醫(yī)藥大學(xué);2015年

4 李秋虹;基于MapReduce的大規(guī)模數(shù)據(jù)挖掘技術(shù)研究[D];復(fù)旦大學(xué);2013年

5 鄔文帥;基于多目標(biāo)決策的數(shù)據(jù)挖掘方法評(píng)估與應(yīng)用[D];電子科技大學(xué);2015年

6 謝邦彥;整合數(shù)據(jù)挖掘與TRIZ理論的質(zhì)量管理方法研究[D];首都經(jīng)濟(jì)貿(mào)易大學(xué);2010年

7 何偉全;云南高校學(xué)生意外傷害因素關(guān)聯(lián)規(guī)則挖掘及風(fēng)險(xiǎn)管控體系研究[D];昆明理工大學(xué);2015年

8 段功豪;基于多結(jié)構(gòu)數(shù)據(jù)挖掘的滑坡災(zāi)害預(yù)測(cè)模型研究[D];中國(guó)地質(zhì)大學(xué);2016年

9 白曉明;基于數(shù)據(jù)挖掘的復(fù)合材料宏—細(xì)觀力學(xué)模型研究[D];哈爾濱工業(yè)大學(xué);2016年

10 藍(lán)永豪(LAM Wing Ho);基于數(shù)據(jù)挖掘技術(shù)分析當(dāng)代中醫(yī)名家痤瘡驗(yàn)方經(jīng)驗(yàn)研究[D];南京中醫(yī)藥大學(xué);2016年

中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條

1 林仁紅;基于數(shù)據(jù)挖掘的機(jī)遇識(shí)別與評(píng)價(jià)研究[D];首都經(jīng)濟(jì)貿(mào)易大學(xué);2007年

2 張彥俊;游戲運(yùn)營(yíng)中的數(shù)據(jù)挖掘[D];復(fù)旦大學(xué);2011年

3 王杰鋒;物聯(lián)網(wǎng)能耗數(shù)據(jù)智能分析及其應(yīng)用平臺(tái)設(shè)計(jì)[D];江南大學(xué);2015年

4 劉學(xué)建;數(shù)據(jù)挖掘在電子商務(wù)推薦系統(tǒng)中的應(yīng)用研究[D];昆明理工大學(xué);2015年

5 戴陽(yáng)陽(yáng);基于數(shù)據(jù)挖掘的金融時(shí)間序列預(yù)測(cè)研究與應(yīng)用[D];江南大學(xué);2015年

6 石思優(yōu);基于主題模型的醫(yī)療數(shù)據(jù)挖掘研究[D];廣東技術(shù)師范學(xué)院;2015年

7 陳丹;移動(dòng)互聯(lián)網(wǎng)信令挖掘?qū)崿F(xiàn)智慧營(yíng)銷的設(shè)計(jì)與實(shí)現(xiàn)應(yīng)用研究[D];華南理工大學(xué);2015年

8 陳思;基于數(shù)據(jù)挖掘的大學(xué)生客戶識(shí)別模型的研究[D];昆明理工大學(xué);2015年

9 位長(zhǎng)帥;基于客戶數(shù)據(jù)挖掘的電信客戶關(guān)系管理研究[D];西南交通大學(xué);2015年

10 安康;基于數(shù)據(jù)挖掘的商業(yè)銀行客戶關(guān)系管理研究[D];蘭州交通大學(xué);2014年

,

本文編號(hào):1025562

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/guanlilunwen/ydhl/1025562.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶a3f95***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com