基于RHadoop的個人股票交易系統(tǒng)的構建
發(fā)布時間:2017-09-09 03:44
本文關鍵詞:基于RHadoop的個人股票交易系統(tǒng)的構建
更多相關文章: 股票交易 Hadoop Rhadoop 系統(tǒng)設計 R語言
【摘要】:進入21世紀以來,人們的日常生活發(fā)生了很大變化,投資理財逐漸平民化,在眾多的投資方式中,股票尤其獨樹一幟,高收益的同時伴隨著高風險,如何充分了解股票走勢,低風險卻有可觀回報成為熱門研究,尤其是當今互聯(lián)網(wǎng)時代對股票市場的發(fā)展情況產(chǎn)生了極大影響,不但將股票市場從線下擴展到線上,而且在這一過程中產(chǎn)生了海量的股票交易數(shù)據(jù)。利用計算機技術分析這些海量的數(shù)據(jù)信息,可以很好的了解市場的走勢以及查看相似的股票走勢來預測未來。所以,要想及時了解股市動態(tài),穩(wěn)住收益又不被套,急需要擁有自己的股票交易系統(tǒng)從旁佐助。R語言產(chǎn)生于統(tǒng)計學領域,R的前身是S語言,符合GNU的開源軟件,所以與生俱來具有強大的統(tǒng)計計算和制圖能力,其中開源實現(xiàn)的工具包至今有5200多個,充分利用這些工具包,合理搭配使用,將大大簡化我們工作的建模過程,但是單機版的R有著諸多問題,互聯(lián)網(wǎng)時代,數(shù)據(jù)成指數(shù)性增長,由于大數(shù)據(jù)所帶來的單機問題,制約著R的更準確、更快速地統(tǒng)計分析能力;在處理大數(shù)據(jù)方面,Hadoop是熱門研究之一,Hadoop使TB、PB級的存儲、計算成為了可能,然而Hadoop雖然可以進行全量數(shù)據(jù)的分析工作,然而其中缺少成熟的數(shù)學模型,也缺乏理論依據(jù),因此使用者編寫的模型預測出的結果也就會缺少理論上的證實;如此看來,將R的統(tǒng)計分析和Hadoop海量數(shù)據(jù)處理能力結合起來使用,正好可以互補短長;于是,Rhadoop的出現(xiàn)無疑是給有這方面想法的人帶來了福音,Rhadoop主要由rmr、rhbase、rhdfs三部分組成,每一部分都是一個獨立的包,分別實現(xiàn)了R對Hadoop系統(tǒng)中的Map Reduce、Hbase、HDFS的調(diào)用。本文便是通過RHadoop開源軟件包,使R與Hadoop互聯(lián),各取其優(yōu)點。結合R中的各種相關開源包,用R語言進行Map Reduce程序設計,Hadoop的HDFS系統(tǒng)負責存儲海量股票數(shù)據(jù),二者取長補短,構建股票交易系統(tǒng)。本文主要工作:在linux系統(tǒng)中安裝Xen Server,實現(xiàn)虛擬化,然后搭建Hadoop分布式環(huán)境,并配置Hadoop的相關文件,安裝配置JDK,eclipse,R軟件;利用RHadoop搭建R的基于Hadoop分布式平臺的并行程序設計環(huán)境,配置相關文件,進行用R語言編寫Map Reduce分布式程序;結合R語言中的各種包,構建一個完整的交易系統(tǒng)。該系統(tǒng)包括:注冊與登陸、獲取交易數(shù)據(jù)、可視化分析、賬戶管理功能以及以IBM股票(IBM)為例的系統(tǒng)演示。
【關鍵詞】:股票交易 Hadoop Rhadoop 系統(tǒng)設計 R語言
【學位授予單位】:吉林大學
【學位級別】:碩士
【學位授予年份】:2015
【分類號】:F224;F832.51
【目錄】:
- 摘要4-5
- ABSTRACT5-8
- 第1章 緒論8-11
- 1.1 研究背景8-10
- 1.2 研究意義10
- 1.3 研究思路和所做的工作10-11
- 第2章 RHADOOP介紹11-29
- 2.1 HADOOP介紹11-18
- 2.1.1 MapReduce介紹11-14
- 2.1.2 HDFS文件系統(tǒng)14-16
- 2.1.3 HDFS數(shù)據(jù)流16-18
- 2.1.3.1 讀文件過程16-17
- 2.1.3.2 寫文件過程17-18
- 2.2 R介紹18-21
- 2.2.1 R的基本概念18-19
- 2.2.2 R的知識體系結構19-20
- 2.2.3 R的應用舉例20-21
- 2.3 RHADOOP介紹21-29
- 2.3.1 RHadoop詳細介紹22-24
- 2.3.1.1 RHadoop功能介紹22
- 2.3.1.2 RHadoop的常用算法包22-23
- 2.3.1.3 系統(tǒng)架構23
- 2.3.1.4 適用場景23
- 2.3.1.5 優(yōu)缺點分析23
- 2.3.1.6 擴展性23-24
- 2.3.2 RHadoop的分布式應用舉例——協(xié)同過濾應用展示24-29
- 第3章 需求分析29-34
- 3.1 系統(tǒng)功能簡介29-30
- 3.2 系統(tǒng)可行性分析30-31
- 3.3 系統(tǒng)的主要模塊31-32
- 3.3.1 用戶模塊31
- 3.3.2 操作界面31-32
- 3.4 系統(tǒng)的功能分析32-33
- 3.4.1 數(shù)據(jù)獲取模塊功能分析32
- 3.4.2 可視化分析模塊32-33
- 3.4.3 賬戶管理模塊33
- 3.5 系統(tǒng)的狀態(tài)分析33-34
- 第4章 個人股票交易系統(tǒng)的構建34-53
- 4.1 HADOOP平臺搭建34-39
- 4.2 R與RHADOOP包的安裝與配置39-43
- 4.2.1 RStudio Server的安裝39-41
- 4.2.2 RHadoop包的安裝與配置41-43
- 4.3 個人股票交易系統(tǒng)應用層的構建43-47
- 4.3.1 用戶模塊實現(xiàn)43-44
- 4.3.2 操作界面及其功能的實現(xiàn)44-47
- 4.4 以IBM股票數(shù)據(jù)為例的應用測試47-53
- 第5章 總結與展望53-54
- 參考文獻54-55
- 作者簡介及在學期間所取得的科研成果55-56
- 致謝56
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前3條
1 陸秋;程小輝;;基于MapReduce的決策樹算法并行化[J];計算機應用;2012年09期
2 黃文依;王勁松;林勝;;HDFS可視化操作研究與實現(xiàn)[J];天津理工大學學報;2012年01期
3 崔杰;李陶深;蘭紅星;;基于Hadoop的海量數(shù)據(jù)存儲平臺設計與開發(fā)[J];計算機研究與發(fā)展;2012年S1期
,本文編號:818100
本文鏈接:http://www.sikaile.net/guanlilunwen/huobilw/818100.html
最近更新
教材專著