基于RHadoop的個(gè)人股票交易系統(tǒng)的構(gòu)建
發(fā)布時(shí)間:2017-09-09 03:44
本文關(guān)鍵詞:基于RHadoop的個(gè)人股票交易系統(tǒng)的構(gòu)建
更多相關(guān)文章: 股票交易 Hadoop Rhadoop 系統(tǒng)設(shè)計(jì) R語言
【摘要】:進(jìn)入21世紀(jì)以來,人們的日常生活發(fā)生了很大變化,投資理財(cái)逐漸平民化,在眾多的投資方式中,股票尤其獨(dú)樹一幟,高收益的同時(shí)伴隨著高風(fēng)險(xiǎn),如何充分了解股票走勢,低風(fēng)險(xiǎn)卻有可觀回報(bào)成為熱門研究,尤其是當(dāng)今互聯(lián)網(wǎng)時(shí)代對(duì)股票市場的發(fā)展情況產(chǎn)生了極大影響,不但將股票市場從線下擴(kuò)展到線上,而且在這一過程中產(chǎn)生了海量的股票交易數(shù)據(jù)。利用計(jì)算機(jī)技術(shù)分析這些海量的數(shù)據(jù)信息,可以很好的了解市場的走勢以及查看相似的股票走勢來預(yù)測未來。所以,要想及時(shí)了解股市動(dòng)態(tài),穩(wěn)住收益又不被套,急需要擁有自己的股票交易系統(tǒng)從旁佐助。R語言產(chǎn)生于統(tǒng)計(jì)學(xué)領(lǐng)域,R的前身是S語言,符合GNU的開源軟件,所以與生俱來具有強(qiáng)大的統(tǒng)計(jì)計(jì)算和制圖能力,其中開源實(shí)現(xiàn)的工具包至今有5200多個(gè),充分利用這些工具包,合理搭配使用,將大大簡化我們工作的建模過程,但是單機(jī)版的R有著諸多問題,互聯(lián)網(wǎng)時(shí)代,數(shù)據(jù)成指數(shù)性增長,由于大數(shù)據(jù)所帶來的單機(jī)問題,制約著R的更準(zhǔn)確、更快速地統(tǒng)計(jì)分析能力;在處理大數(shù)據(jù)方面,Hadoop是熱門研究之一,Hadoop使TB、PB級(jí)的存儲(chǔ)、計(jì)算成為了可能,然而Hadoop雖然可以進(jìn)行全量數(shù)據(jù)的分析工作,然而其中缺少成熟的數(shù)學(xué)模型,也缺乏理論依據(jù),因此使用者編寫的模型預(yù)測出的結(jié)果也就會(huì)缺少理論上的證實(shí);如此看來,將R的統(tǒng)計(jì)分析和Hadoop海量數(shù)據(jù)處理能力結(jié)合起來使用,正好可以互補(bǔ)短長;于是,Rhadoop的出現(xiàn)無疑是給有這方面想法的人帶來了福音,Rhadoop主要由rmr、rhbase、rhdfs三部分組成,每一部分都是一個(gè)獨(dú)立的包,分別實(shí)現(xiàn)了R對(duì)Hadoop系統(tǒng)中的Map Reduce、Hbase、HDFS的調(diào)用。本文便是通過RHadoop開源軟件包,使R與Hadoop互聯(lián),各取其優(yōu)點(diǎn)。結(jié)合R中的各種相關(guān)開源包,用R語言進(jìn)行Map Reduce程序設(shè)計(jì),Hadoop的HDFS系統(tǒng)負(fù)責(zé)存儲(chǔ)海量股票數(shù)據(jù),二者取長補(bǔ)短,構(gòu)建股票交易系統(tǒng)。本文主要工作:在linux系統(tǒng)中安裝Xen Server,實(shí)現(xiàn)虛擬化,然后搭建Hadoop分布式環(huán)境,并配置Hadoop的相關(guān)文件,安裝配置JDK,eclipse,R軟件;利用RHadoop搭建R的基于Hadoop分布式平臺(tái)的并行程序設(shè)計(jì)環(huán)境,配置相關(guān)文件,進(jìn)行用R語言編寫Map Reduce分布式程序;結(jié)合R語言中的各種包,構(gòu)建一個(gè)完整的交易系統(tǒng)。該系統(tǒng)包括:注冊(cè)與登陸、獲取交易數(shù)據(jù)、可視化分析、賬戶管理功能以及以IBM股票(IBM)為例的系統(tǒng)演示。
【關(guān)鍵詞】:股票交易 Hadoop Rhadoop 系統(tǒng)設(shè)計(jì) R語言
【學(xué)位授予單位】:吉林大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2015
【分類號(hào)】:F224;F832.51
【目錄】:
- 摘要4-5
- ABSTRACT5-8
- 第1章 緒論8-11
- 1.1 研究背景8-10
- 1.2 研究意義10
- 1.3 研究思路和所做的工作10-11
- 第2章 RHADOOP介紹11-29
- 2.1 HADOOP介紹11-18
- 2.1.1 MapReduce介紹11-14
- 2.1.2 HDFS文件系統(tǒng)14-16
- 2.1.3 HDFS數(shù)據(jù)流16-18
- 2.1.3.1 讀文件過程16-17
- 2.1.3.2 寫文件過程17-18
- 2.2 R介紹18-21
- 2.2.1 R的基本概念18-19
- 2.2.2 R的知識(shí)體系結(jié)構(gòu)19-20
- 2.2.3 R的應(yīng)用舉例20-21
- 2.3 RHADOOP介紹21-29
- 2.3.1 RHadoop詳細(xì)介紹22-24
- 2.3.1.1 RHadoop功能介紹22
- 2.3.1.2 RHadoop的常用算法包22-23
- 2.3.1.3 系統(tǒng)架構(gòu)23
- 2.3.1.4 適用場景23
- 2.3.1.5 優(yōu)缺點(diǎn)分析23
- 2.3.1.6 擴(kuò)展性23-24
- 2.3.2 RHadoop的分布式應(yīng)用舉例——協(xié)同過濾應(yīng)用展示24-29
- 第3章 需求分析29-34
- 3.1 系統(tǒng)功能簡介29-30
- 3.2 系統(tǒng)可行性分析30-31
- 3.3 系統(tǒng)的主要模塊31-32
- 3.3.1 用戶模塊31
- 3.3.2 操作界面31-32
- 3.4 系統(tǒng)的功能分析32-33
- 3.4.1 數(shù)據(jù)獲取模塊功能分析32
- 3.4.2 可視化分析模塊32-33
- 3.4.3 賬戶管理模塊33
- 3.5 系統(tǒng)的狀態(tài)分析33-34
- 第4章 個(gè)人股票交易系統(tǒng)的構(gòu)建34-53
- 4.1 HADOOP平臺(tái)搭建34-39
- 4.2 R與RHADOOP包的安裝與配置39-43
- 4.2.1 RStudio Server的安裝39-41
- 4.2.2 RHadoop包的安裝與配置41-43
- 4.3 個(gè)人股票交易系統(tǒng)應(yīng)用層的構(gòu)建43-47
- 4.3.1 用戶模塊實(shí)現(xiàn)43-44
- 4.3.2 操作界面及其功能的實(shí)現(xiàn)44-47
- 4.4 以IBM股票數(shù)據(jù)為例的應(yīng)用測試47-53
- 第5章 總結(jié)與展望53-54
- 參考文獻(xiàn)54-55
- 作者簡介及在學(xué)期間所取得的科研成果55-56
- 致謝56
【參考文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前3條
1 陸秋;程小輝;;基于MapReduce的決策樹算法并行化[J];計(jì)算機(jī)應(yīng)用;2012年09期
2 黃文依;王勁松;林勝;;HDFS可視化操作研究與實(shí)現(xiàn)[J];天津理工大學(xué)學(xué)報(bào);2012年01期
3 崔杰;李陶深;蘭紅星;;基于Hadoop的海量數(shù)據(jù)存儲(chǔ)平臺(tái)設(shè)計(jì)與開發(fā)[J];計(jì)算機(jī)研究與發(fā)展;2012年S1期
,本文編號(hào):818100
本文鏈接:http://sikaile.net/guanlilunwen/huobilw/818100.html
最近更新
教材專著