天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 計(jì)算機(jī)論文 >

面向物流海量數(shù)據(jù)管理及應(yīng)用研究

發(fā)布時(shí)間:2017-07-26 12:32

  本文關(guān)鍵詞:面向物流海量數(shù)據(jù)管理及應(yīng)用研究


  更多相關(guān)文章: 海量數(shù)據(jù) 云存儲(chǔ) 分布式文件系統(tǒng) Hadoop 物流分析 K-Means


【摘要】:近年來,互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)和物聯(lián)網(wǎng)得到了快速的發(fā)展,不斷增加的網(wǎng)上用戶數(shù)量也使得數(shù)據(jù)量不斷增加。單個(gè)機(jī)器的負(fù)載能力已經(jīng)不能很好的存儲(chǔ)現(xiàn)在的海量數(shù)據(jù),怎樣搭建規(guī)模大、效率高、可擴(kuò)展性好的存儲(chǔ)系統(tǒng)尤為重要。云計(jì)算已經(jīng)成為當(dāng)前研究的熱點(diǎn)問題,云計(jì)算衍生出云存儲(chǔ)技術(shù),國(guó)內(nèi)外也開始對(duì)云存儲(chǔ)技術(shù)做了深入的研究。研究云計(jì)算和云存儲(chǔ)標(biāo)準(zhǔn)參考模型是基于Google File System的開源實(shí)現(xiàn)的Hadoop文件系統(tǒng)HDFS,但是HDFS架構(gòu)存在很多的缺點(diǎn),,較為突出的是單個(gè)NameNode易造成整個(gè)集群性能瓶頸問題。本文主要在現(xiàn)有HDFS的研究基礎(chǔ)上,提出了一種基于MongoDB的多NameNode解決方案,該方案能很好的解決HDFS單一NameNode性能瓶頸問題。通過實(shí)驗(yàn)表明,本方案能對(duì)HDFS集群的命名空間進(jìn)行拓展。 與此同時(shí)隨著社會(huì)大物流的發(fā)展,企業(yè)如何從這些海量的信息中挖掘出有用的信息,己經(jīng)成為該領(lǐng)域研究的關(guān)鍵。云計(jì)算具有計(jì)算能力彈性化,存儲(chǔ)能力海量化,節(jié)約成本,提高效率方面等優(yōu)點(diǎn),所以,云計(jì)算已經(jīng)成為能有效的處理數(shù)據(jù)挖掘技術(shù)所面臨難題的方法之一。本文首先從兩個(gè)方面分析MapReduce編程模型和Hadoop平臺(tái),進(jìn)而深入介紹了Mahout,并且詳細(xì)對(duì)Mahout內(nèi)部數(shù)據(jù)表示模型做了深入探討,采用K-Means算法,對(duì)K-Means算法進(jìn)行并行化分析,詳盡的闡述了K-Means聚類在MapReduce編程中的實(shí)現(xiàn)和在Mahout中的應(yīng)用。文章最后,主要針對(duì)我國(guó)物流業(yè)具體情況,提出數(shù)據(jù)挖掘的并行和串行兩種模式,主要是針對(duì)K-Means算法在這兩種情況下解決海量數(shù)據(jù)挖掘問題時(shí)效率的比較,本文從不同距離度量方式,運(yùn)行時(shí)間,迭代次數(shù)等方面評(píng)估了K-Means算法聚類結(jié)果,最后發(fā)現(xiàn)其效率差異,能對(duì)海量數(shù)據(jù)挖掘起到很好的指導(dǎo)實(shí)踐意義。 本文通過基于MongoDB的多NameNode的HDFS云存儲(chǔ)技術(shù)和基于MapReduce編程模型的K-Means算法并行云挖掘技術(shù)很好的處理了物流業(yè)海量數(shù)據(jù)信息的存儲(chǔ)和計(jì)算問題,通過調(diào)用HDFS存儲(chǔ)的海量數(shù)據(jù),上層Mahout進(jìn)行海量數(shù)據(jù)信息并行化數(shù)據(jù)挖掘,挖掘出對(duì)于物流行業(yè)有用的信息。
【關(guān)鍵詞】:海量數(shù)據(jù) 云存儲(chǔ) 分布式文件系統(tǒng) Hadoop 物流分析 K-Means
【學(xué)位授予單位】:南京郵電大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2014
【分類號(hào)】:TP333;TP311.13
【目錄】:
  • 摘要4-5
  • Abstract5-9
  • 第一章 緒論9-12
  • 1.1 課題背景9-11
  • 1.2 文章主要內(nèi)容及章節(jié)安排11-12
  • 第二章 相關(guān)技術(shù)的介紹12-30
  • 2.1 云計(jì)算的概念12-14
  • 2.1.1 云計(jì)算的分類12-13
  • 2.1.2 云計(jì)算特點(diǎn)13-14
  • 2.2 Hadoop 簡(jiǎn)介14-18
  • 2.2.1 Hadoop 歷史14-15
  • 2.2.2 Hadoop 優(yōu)勢(shì)15
  • 2.2.3 Hadoop 子項(xiàng)目15-16
  • 2.2.4 Hadoop 框架模型16-18
  • 2.2.5 Hadoop 應(yīng)用舉例18
  • 2.3 Hadoop 關(guān)鍵技術(shù)18-29
  • 2.3.1 Hadoop 分布式文件系統(tǒng)(HDFS)18-23
  • 2.3.2 MapReduce 技術(shù)23-27
  • 2.3.3 Mahout 技術(shù)27-29
  • 2.4 本章小結(jié)29-30
  • 第三章 海量物流數(shù)據(jù)存儲(chǔ)的設(shè)計(jì)和實(shí)現(xiàn)30-46
  • 3.1 現(xiàn)有 HDFS 架構(gòu)不足30-31
  • 3.2 MongoDB 技術(shù)簡(jiǎn)介31-34
  • 3.2.1 MongoDB 集群的架構(gòu)分析32-33
  • 3.2.2 MongoDB 集群的分片機(jī)制33-34
  • 3.3 可擴(kuò)展的多 NameNode 節(jié)點(diǎn)優(yōu)化原理34-37
  • 3.3.1 優(yōu)化難點(diǎn)34
  • 3.3.2 基于 MongoDB 的解決方案34-37
  • 3.4 多 NameNode 節(jié)點(diǎn)的優(yōu)化應(yīng)以 MongoDB 為基礎(chǔ)來實(shí)現(xiàn)37-43
  • 3.5 實(shí)驗(yàn)結(jié)果及相關(guān)分析43-45
  • 3.6 本章小結(jié)45-46
  • 第四章 物流海量數(shù)據(jù)挖掘子系統(tǒng)46-58
  • 4.1 云數(shù)據(jù)挖掘子系統(tǒng)簡(jiǎn)介46-47
  • 4.2 數(shù)據(jù)挖掘概述47
  • 4.3 文本聚類47-50
  • 4.3.1 中文分詞49-50
  • 4.3.2 文本表示模型50
  • 4.4 物流海量數(shù)據(jù) K-Means 算法并行分析50-55
  • 4.4.1 并行策略50-51
  • 4.4.2 Mahout K-Means 結(jié)構(gòu)51-52
  • 4.4.3 K-Means 聚類 MapReduce 實(shí)現(xiàn)52-55
  • 4.5 并行挖掘與串行挖掘比較55-57
  • 4.6 K-Means 算法應(yīng)用到物流行業(yè)57
  • 4.7 本章小結(jié)57-58
  • 第五章 平臺(tái)搭建及實(shí)驗(yàn)58-68
  • 5.1 Hadoop 平臺(tái)的搭建58-61
  • 5.1.1 搭建 Hadoop 集群58
  • 5.1.2 搭建 hadoop58-61
  • 5.2 安裝 MongoDB 數(shù)據(jù)庫61-62
  • 5.3 安裝 Mahout62-65
  • 5.3.1 安裝 Maven62-64
  • 5.3.2 Mahout 的下載及安裝64-65
  • 5.4 實(shí)驗(yàn)過程65-67
  • 5.4.1 實(shí)驗(yàn)一65-66
  • 5.4.2 實(shí)驗(yàn)二66-67
  • 5.5 本章小結(jié)67-68
  • 第六章 展望與總結(jié)68-70
  • 6.1 總結(jié)68
  • 6.2 展望68-70
  • 參考文獻(xiàn)70-73
  • 附錄 2 攻讀碩士學(xué)位期間撰寫的論文73-74
  • 附錄 3 攻讀碩士學(xué)位期間申請(qǐng)的專利74-75
  • 附錄 4 攻讀碩士學(xué)位期間參加的科研項(xiàng)目75-76
  • 致謝76

【相似文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫 前10條

1 ;中國(guó)科學(xué)院文獻(xiàn)情報(bào)中心“99”級(jí)研究生學(xué)位論文開題介紹[J];現(xiàn)代圖書情報(bào)技術(shù);2001年04期

2 師春苗,肖云;研究生創(chuàng)新不足的原因與對(duì)策[J];科技·人才·市場(chǎng);2001年04期

3 鄭力,王松俊,朱鴿昀,高艷玲;情報(bào)學(xué)研究生學(xué)位論文選題發(fā)展趨勢(shì)研究[J];情報(bào)理論與實(shí)踐;2002年03期

4 ;本刊主辦院校研究生學(xué)位論文題錄[J];高;瘜W(xué)工程學(xué)報(bào);2002年01期

5 ;本刊主辦院校研究生學(xué)位論文題錄[J];高;瘜W(xué)工程學(xué)報(bào);2002年03期

6 ;本刊主辦院校研究生學(xué)位論文題錄[J];高;瘜W(xué)工程學(xué)報(bào);2002年04期

7 ;本刊主辦院校研究生學(xué)位論文題錄[J];高;瘜W(xué)工程學(xué)報(bào);2002年05期

8 王瑩;試談高校研究生學(xué)位論文著作權(quán)的保護(hù)問題[J];河北科技圖苑;2004年03期

9 張愛林;研究生學(xué)位論文的利用與檢索[J];圖書館學(xué)研究;2004年06期

10 ;本刊主辦院校研究生學(xué)位論文題錄[J];高;瘜W(xué)工程學(xué)報(bào);2004年05期

中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫 前4條

1 楊黎娟;秦榮;;淺談研究生學(xué)位論文檔案管理及開發(fā)利用[A];陜西省檔案學(xué)會(huì)第八次檔案學(xué)術(shù)討論會(huì)論文選輯[C];2004年

2 龔樂年;;芻議影響研究生業(yè)務(wù)培養(yǎng)質(zhì)量的幾個(gè)原因[A];第二屆全國(guó)高校電氣工程及其自動(dòng)化專業(yè)教學(xué)改革研討會(huì)論文集(下冊(cè))[C];2004年

3 蔡妙花;曹春;趙乃良;;優(yōu)化管理提升研究生培養(yǎng)質(zhì)量的探索和實(shí)踐[A];電子高等教育學(xué)會(huì)2008年學(xué)術(shù)年會(huì)論文集[C];2008年

4 蔡妙花;曹春;趙乃良;;優(yōu)化管理提升研究生培養(yǎng)質(zhì)量的探索和實(shí)踐[A];電子高等教育學(xué)會(huì)2007年學(xué)術(shù)年會(huì)論文集[C];2007年

中國(guó)重要報(bào)紙全文數(shù)據(jù)庫 前10條

1 方延明;新世紀(jì)我們?cè)鯓优囵B(yǎng)研究生[N];中國(guó)教育報(bào);2001年

2 本版編輯邋陶雷 韓仁武 范吉昌;質(zhì)量在“較真”中提升[N];解放軍報(bào);2008年

3 本報(bào)記者 李玉蘭;研究生學(xué)位論文“打假”的法律思考[N];光明日?qǐng)?bào);2009年

4 記者 程墨 通訊員 嚴(yán)莉莉 陳博;12道“金牌”倒逼研究生寫好論文[N];中國(guó)教育報(bào);2013年

5 李世彬 蘇繼紅;培養(yǎng)研究生創(chuàng)新精神[N];光明日?qǐng)?bào);2006年

6 通訊員 楊茗;質(zhì)量是研究生教育的永恒主題[N];光明日?qǐng)?bào);2006年

7 文永紅;校企聯(lián)合培養(yǎng)研究生三方受益[N];科技日?qǐng)?bào);2006年

8 黃蔚邋實(shí)習(xí)生 包瑩;創(chuàng)新模式 鍛造精英[N];貴州日?qǐng)?bào);2008年

9 王中委邋劉勝江;開啟創(chuàng)新智慧之門[N];解放軍報(bào);2008年

10 特約記者鄭水平;曙光油區(qū)建成首個(gè)“研究生培養(yǎng)創(chuàng)新基地”[N];中國(guó)石油報(bào);2010年

中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫 前5條

1 劉裕;高校教育服務(wù)公平評(píng)價(jià)及效應(yīng)研究[D];西南交通大學(xué);2008年

2 Muhammad Khurram Khan;[D];西南交通大學(xué);2006年

3 朱勇;MicroRNA-23a/27a/24-2在紅系分化中的功能及作用機(jī)制研究[D];北京協(xié)和醫(yī)學(xué)院;2014年

4 劉培順;判決PN機(jī)理論及其在入侵檢測(cè)中的應(yīng)用[D];西南交通大學(xué);2005年

5 李慧娟;維吾爾族婦女民間互助研究[D];蘭州大學(xué);2012年

中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 賈川;我國(guó)高?鐚W(xué)科研究生培養(yǎng)機(jī)制研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2008年

2 吳巨慧;研究生創(chuàng)新能力培養(yǎng)的過程要素及整合的研究[D];浙江大學(xué);2003年

3 王娜;美國(guó)研究生資助研究[D];河北大學(xué);2008年

4 趙郁松;研究生創(chuàng)新能力培養(yǎng)的研究[D];重慶大學(xué);2006年

5 羅艷;研究生導(dǎo)師指導(dǎo)量研究[D];湖南大學(xué);2006年

6 劉威;創(chuàng)新型研究生培養(yǎng)的大學(xué)教育環(huán)境研究[D];中南大學(xué);2007年

7 劉敏;研究生培養(yǎng)體制對(duì)研究生創(chuàng)新能力培養(yǎng)的影響研究[D];湖南師范大學(xué);2007年

8 邵玲;研究生學(xué)習(xí)觀的個(gè)案研究[D];廣西師范大學(xué);2007年

9 李志平;中國(guó)農(nóng)業(yè)科學(xué)院研究生創(chuàng)新能力研究[D];中國(guó)農(nóng)業(yè)科學(xué)院;2006年

10 代志軍;我國(guó)體育院校籃球碩士研究生學(xué)位論文現(xiàn)狀及影響因素的研究[D];北京體育大學(xué);2006年



本文編號(hào):576429

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/jisuanjikexuelunwen/576429.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶78c24***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com