基于Hadoop的全國零售戶數(shù)據(jù)處理與市場感知
發(fā)布時間:2017-04-14 15:20
本文關(guān)鍵詞:基于Hadoop的全國零售戶數(shù)據(jù)處理與市場感知,由筆耕文化傳播整理發(fā)布。
【摘要】:隨著近年來互聯(lián)網(wǎng)的發(fā)展,促使了“互聯(lián)網(wǎng)+”的興起,煙草企業(yè)已經(jīng)擁有了龐大的零售戶信息數(shù)據(jù)。零售戶在全國范圍內(nèi)的數(shù)量已經(jīng)超過了800萬家,每月都會產(chǎn)生大量訂單信息,隨著時間的推移,這個訂單信息數(shù)據(jù)量已經(jīng)達(dá)到TB級別。然而,企業(yè)最初搭建的硬件設(shè)備和軟件不具有存儲和處理這些數(shù)據(jù)的能力,因此導(dǎo)致有價值的信息無法提取出來,形成一個尷尬的局面。本文結(jié)合全國零售戶不斷劇增的信息數(shù)據(jù)與現(xiàn)有的大數(shù)據(jù)存儲技術(shù),提出了基于Hadoop的全國零售戶訂單數(shù)據(jù)分析系統(tǒng)的架構(gòu),詳細(xì)分析了Hadoop集群節(jié)點存儲性能和響應(yīng)時間,實現(xiàn)了海量數(shù)據(jù)的存儲與處理;贏RIMA預(yù)測模型,建立了銷售預(yù)測模型,并對該模型進(jìn)行了驗證,根據(jù)預(yù)測提出了基于預(yù)測的營銷模式,還提出了對零售戶終身價值的計算方式,為決策者提供對零售戶的忠誠度提升策略。具體研究內(nèi)容如下:1)根據(jù)全國零售戶訂單數(shù)據(jù)的性質(zhì),提出了一種基于Hive的數(shù)據(jù)存儲模型,該模型是對海量數(shù)據(jù)進(jìn)行分區(qū)管理,采用月單位劃分?jǐn)?shù)據(jù)分區(qū)表。采用該模型解決針對全國零售戶訂單數(shù)據(jù)的應(yīng)用存儲和負(fù)載均衡問題。2)探討了對整個HDFS常用的數(shù)據(jù)處理辦法,并根據(jù)存儲數(shù)據(jù)的實際情況,提出了一個在異構(gòu)集群下減少數(shù)據(jù)處理的響應(yīng)時間的算法,該算法是分析集群性質(zhì)和對集群處理數(shù)據(jù)的執(zhí)行響應(yīng)時間提出一種基于節(jié)點計算性能的數(shù)據(jù)分配策略。針對全國零售戶數(shù)據(jù),運用該分配策略建立一個數(shù)據(jù)處理模型,降低數(shù)據(jù)在網(wǎng)絡(luò)上傳輸,防止數(shù)據(jù)擁塞,提供集群的時效性。3)企業(yè)具有敏銳的市場感知、把握市場動態(tài)和市場方向的能力,關(guān)鍵在于對大數(shù)據(jù)的挖掘。本文從市場感知和市場響應(yīng)角度,在大數(shù)據(jù)的基礎(chǔ)上,運用ARIMA銷售預(yù)測模型來預(yù)測市場銷售,并且提出了一種計算零售戶市場價值、忠誠度的方法,緩解重要決策對個人經(jīng)驗的依賴,為品牌投放和市場響應(yīng)提供了有效的信息支撐。4)基于Hadoop的數(shù)據(jù)存儲技術(shù)建立了一個大數(shù)據(jù)處理平臺,設(shè)計了一個以企業(yè)產(chǎn)生的零售數(shù)據(jù)為導(dǎo)向的數(shù)據(jù)存儲的生態(tài)大循環(huán)、以戰(zhàn)略為牽引的大數(shù)據(jù)平臺中循環(huán)和以數(shù)據(jù)信息為核心的數(shù)據(jù)同步處理的內(nèi)部3個生態(tài)小循環(huán)的三層生態(tài)循環(huán)系統(tǒng)架構(gòu)。
【關(guān)鍵詞】:大數(shù)據(jù) 數(shù)據(jù)模型 HDFS ARIMA預(yù)測模型 忠誠度
【學(xué)位授予單位】:浙江理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2016
【分類號】:TP311.13;F426.8
【目錄】:
- 摘要4-5
- Abstract5-10
- 第一章 緒論10-16
- 1.1 研究背景、意義10-11
- 1.2 現(xiàn)狀研究11-14
- 1.2.1 大數(shù)據(jù)研究現(xiàn)狀11-12
- 1.2.2 大數(shù)據(jù)的應(yīng)用12-13
- 1.2.3 大數(shù)據(jù)環(huán)境下終端營銷13-14
- 1.4 研究內(nèi)容14
- 1.5 本文組織結(jié)構(gòu)14-16
- 第二章 基于Hadoop全國零售訂單數(shù)據(jù)的分布式存儲16-28
- 2.1 引言16
- 2.2 HDFS體系及數(shù)據(jù)存儲16-20
- 2.2.1 分布式存儲的體系結(jié)構(gòu)研究16-18
- 2.2.2 文件的數(shù)據(jù)存儲18-20
- 2.3 集群DataNode計算性能及其響應(yīng)時間20-27
- 2.3.1 集群性質(zhì)分析20-21
- 2.3.2 計算DataNode性能的算法研究21-23
- 2.3.3 實驗結(jié)果分析23-27
- 2.4 本章小結(jié)27-28
- 第三章 數(shù)據(jù)同步加工處理28-40
- 3.1 引言28
- 3.2 數(shù)據(jù)同步加工28-32
- 3.2.1 數(shù)據(jù)采集模式28-30
- 3.2.2 數(shù)據(jù)同步要解決的問題30-31
- 3.2.3 分布式數(shù)據(jù)同步建模31-32
- 3.3 數(shù)據(jù)預(yù)處理32-36
- 3.3.1 數(shù)據(jù)質(zhì)量32-33
- 3.3.2 數(shù)據(jù)清洗33-36
- 3.4 基于分布式的數(shù)據(jù)加工36-38
- 3.4.1 運用Hive的數(shù)據(jù)加工36-37
- 3.4.2 基于Hbase的結(jié)果數(shù)據(jù)處理37-38
- 3.5 本章小結(jié)38-40
- 第四章 基于零售訂單數(shù)據(jù)的智能市場感知40-55
- 4.1 引言40
- 4.2 企業(yè)營銷中市場預(yù)測模型40-41
- 4.3 市場銷售預(yù)測模型41-46
- 4.3.1 時間序列分析41
- 4.3.2 ARIMA預(yù)測模型原理41-42
- 4.3.3 ARIMA銷售預(yù)測模型構(gòu)建42-46
- 4.4 市場預(yù)測與營銷協(xié)作模式46-50
- 4.4.1 固有的企業(yè)營銷模式46-47
- 4.4.2 影響投放策略的因素47-49
- 4.4.3 預(yù)測需求量模型制定49-50
- 4.5 零售戶畫像模型構(gòu)建50-54
- 4.5.1 零售戶終身價值計算51
- 4.5.2 零售戶忠誠度預(yù)警模型51-53
- 4.5.3 零售戶忠誠度提升策略53-54
- 4.6 本章小結(jié)54-55
- 第五章 全國零售戶訂單數(shù)據(jù)分析系統(tǒng)設(shè)計55-67
- 5.1 引言55
- 5.2 系統(tǒng)總體框架與思路55-59
- 5.2.1 系統(tǒng)體系架構(gòu)55-58
- 5.2.2 系統(tǒng)技術(shù)架構(gòu)58-59
- 5.3 基于Hadoop大數(shù)據(jù)平臺建設(shè)59-63
- 5.3.1 基于Hadoop的大數(shù)據(jù)平臺架構(gòu)59-60
- 5.3.2 數(shù)據(jù)平臺建設(shè)60-61
- 5.3.3 軟硬件準(zhǔn)備61-62
- 5.3.4 網(wǎng)絡(luò)拓?fù)?/span>62-63
- 5.4 系統(tǒng)展示63-66
- 5.4.1 經(jīng)營業(yè)態(tài)下的品牌分析63-64
- 5.4.2 零售戶篩選分析64-65
- 5.4.4 零售忠誠度預(yù)警與提升65-66
- 5.5 本章總結(jié)66-67
- 第六章 總結(jié)與展望67-69
- 6.1 全文總結(jié)67-68
- 6.2 研究展望68-69
- 參考文獻(xiàn)69-71
- 附錄71-72
- 致謝72-73
- 攻讀學(xué)位期間的研究成果73
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 王習(xí)濤;;ARIMA模型在期貨交易預(yù)測中的應(yīng)用研究[J];微計算機信息;2006年15期
2 張翼飛;陳洪;劉嶺;張彥琦;郭波濤;易東;;ARIMA季節(jié)乘積模型在腸道傳染病預(yù)測中的應(yīng)用[J];激光雜志;2008年02期
3 蔣金良;林廣明;;基于ARIMA模型的自動站風(fēng)速預(yù)測[J];控制理論與應(yīng)用;2008年02期
4 曹昱東;王浩;;基于ARIMA模型上海市生活垃圾的預(yù)測與分析[J];電子測試;2013年16期
5 吳u,
本文編號:306290
本文鏈接:http://www.sikaile.net/guanlilunwen/yingxiaoguanlilunwen/306290.html
最近更新
教材專著