基于Spark MLlib的股票數(shù)據(jù)分析研究
發(fā)布時(shí)間:2021-01-27 06:36
股票是一個(gè)國家經(jīng)濟(jì)社會(huì)的主要組成部分,但是股票價(jià)格深受經(jīng)濟(jì)環(huán)境、國家政策、國內(nèi)外環(huán)境等的影響,所以股票的波動(dòng)方向與股票價(jià)格本身就很難預(yù)測,再加上股票交易中市場的隨機(jī)性、信息的不對稱性和投資者的從眾心態(tài)使得對股票數(shù)據(jù)的分析研究十分困難。但是對金融市場的研究、對股票的分析卻一直都是研究的熱點(diǎn)。為了能夠更加準(zhǔn)確地分析股價(jià)的波動(dòng)方向,本文提出了對股票交易數(shù)據(jù)進(jìn)行小波降噪處理,并且計(jì)算和收集股票市場中常用到的技術(shù)指標(biāo)因子與情緒類因子,并對這些因子數(shù)據(jù)做主成分分析,經(jīng)過預(yù)處理再進(jìn)行機(jī)器學(xué)習(xí)的分類分析。應(yīng)用機(jī)器學(xué)習(xí)中的邏輯回歸、支持向量機(jī)、隨機(jī)森林對股票數(shù)據(jù)做分類分析后,利用預(yù)測得到的結(jié)果進(jìn)行組合投票,并做對比實(shí)驗(yàn),實(shí)驗(yàn)表明,數(shù)據(jù)在降噪降維后,經(jīng)過組合投票分析能夠得到較為理想的結(jié)果。關(guān)于股票價(jià)格的預(yù)測也是目前研究的重點(diǎn)之一,本文應(yīng)用長短時(shí)記憶網(wǎng)絡(luò)對股票價(jià)格做了預(yù)測,在LSTM中應(yīng)用滑動(dòng)時(shí)間窗口對股票價(jià)格做短期預(yù)測選擇出最佳窗口,之后在相同迭代次數(shù)下,比較了降噪降維數(shù)據(jù)與對比文獻(xiàn)使用的原始數(shù)據(jù)做LSTM的實(shí)驗(yàn)結(jié)果。最后應(yīng)用平均絕對誤差、均方誤差、均方根誤差和平均絕對誤差百分比對誤差進(jìn)行了分析。之后,應(yīng)...
【文章來源】:華北電力大學(xué)(北京)北京市 211工程院校 教育部直屬院校
【文章頁數(shù)】:50 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2-1浦發(fā)銀行降噪前后對比圖??
??圖3-2支持向量機(jī)訓(xùn)練流程??在選擇不同核函數(shù)時(shí),五家公司漲跌分類準(zhǔn)確率如下表3-1所示,???表3-1不同核函數(shù)分類準(zhǔn)確率???公司?多項(xiàng)式核函數(shù)分類準(zhǔn)確率?高斯核函數(shù)分類準(zhǔn)確率??浦發(fā)銀行?0.5032?0.6854??禾嘉股份?0.6039?0.6912??岷江水電?0.6498?0.7052??北大荒?0.5909?0.6874??華發(fā)股份?0.6976?0.7114??可以看到高斯核函數(shù)更具有優(yōu)勢,因此在后面實(shí)驗(yàn)中用到的支持向量機(jī)模型采??用高斯核函數(shù),懲罰系數(shù)釆用默認(rèn)值。??3.1.3隨機(jī)森林??隨機(jī)森林算法是Leo?Breiman在Amit等人的基礎(chǔ)上提出來的,是一種基于決??策樹分類的組合算法。它將多棵決策樹組合在一起做出決策,其中的每棵決策樹都??是由隨機(jī)產(chǎn)生特征值的一個(gè)獨(dú)立集合產(chǎn)生的[3()]。結(jié)構(gòu)圖如下圖3-2所示。??15??
小結(jié)??紹了投票組合機(jī)器學(xué)習(xí)預(yù)測股票波動(dòng)方向的模型,對我國上海證券交公司做了實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果平均準(zhǔn)確率在70%-75%之間,相較之前實(shí)準(zhǔn)確率有了提升,并且相比于神經(jīng)網(wǎng)絡(luò),機(jī)器學(xué)習(xí)訓(xùn)練時(shí)間更短一些小,同時(shí),通過與對比實(shí)驗(yàn)中使用的數(shù)據(jù)集對比,說明本實(shí)驗(yàn)中降噪作對后續(xù)的實(shí)驗(yàn)結(jié)果有明顯的幫助。??
【參考文獻(xiàn)】:
期刊論文
[1]基于復(fù)雜網(wǎng)絡(luò)法的股票市場特征分析與指數(shù)構(gòu)建[J]. 王小燕,姚佳含,袁欣. 管理現(xiàn)代化. 2018(06)
博士論文
[1]隨機(jī)森林算法優(yōu)化研究[D]. 曹正鳳.首都經(jīng)濟(jì)貿(mào)易大學(xué) 2014
碩士論文
[1]基于PCA-SVM-GARCH模型的股價(jià)預(yù)測[D]. 景秋玉.首都經(jīng)濟(jì)貿(mào)易大學(xué) 2018
[2]基于百度指數(shù)的上證50指數(shù)預(yù)測研究[D]. 劉燕.上海師范大學(xué) 2018
[3]基于支持向量機(jī)參數(shù)優(yōu)化算法的股票智能投顧策略研究[D]. 高雯.上海師范大學(xué) 2018
[4]基于文本挖掘的投資者情緒與股票市場的關(guān)聯(lián)性研究[D]. 尹樂民.青島大學(xué) 2018
[5]用Stacking算法堆積隨機(jī)森林、GBDT、SVM、Adaboost等七種算法的多因子選股模型[D]. 李佩琛.浙江工商大學(xué) 2018
[6]基于LSTM和投資者情緒的股票行情預(yù)測研究[D]. 周凌寒.華中師范大學(xué) 2018
[7]基于聚類分析的多因子動(dòng)態(tài)加權(quán)實(shí)證檢驗(yàn)[D]. 陳悅竹.山東大學(xué) 2018
[8]多指標(biāo)選股智能投顧策略構(gòu)建研究[D]. 劉晨.上海師范大學(xué) 2018
[9]隨機(jī)森林在技術(shù)指標(biāo)量化選股中的應(yīng)用[D]. 吳衛(wèi)星.電子科技大學(xué) 2018
[10]基于遞歸神經(jīng)網(wǎng)絡(luò)的股票趨勢預(yù)測研究[D]. 石浩.北京郵電大學(xué) 2018
本文編號:3002617
【文章來源】:華北電力大學(xué)(北京)北京市 211工程院校 教育部直屬院校
【文章頁數(shù)】:50 頁
【學(xué)位級別】:碩士
【部分圖文】:
圖2-1浦發(fā)銀行降噪前后對比圖??
??圖3-2支持向量機(jī)訓(xùn)練流程??在選擇不同核函數(shù)時(shí),五家公司漲跌分類準(zhǔn)確率如下表3-1所示,???表3-1不同核函數(shù)分類準(zhǔn)確率???公司?多項(xiàng)式核函數(shù)分類準(zhǔn)確率?高斯核函數(shù)分類準(zhǔn)確率??浦發(fā)銀行?0.5032?0.6854??禾嘉股份?0.6039?0.6912??岷江水電?0.6498?0.7052??北大荒?0.5909?0.6874??華發(fā)股份?0.6976?0.7114??可以看到高斯核函數(shù)更具有優(yōu)勢,因此在后面實(shí)驗(yàn)中用到的支持向量機(jī)模型采??用高斯核函數(shù),懲罰系數(shù)釆用默認(rèn)值。??3.1.3隨機(jī)森林??隨機(jī)森林算法是Leo?Breiman在Amit等人的基礎(chǔ)上提出來的,是一種基于決??策樹分類的組合算法。它將多棵決策樹組合在一起做出決策,其中的每棵決策樹都??是由隨機(jī)產(chǎn)生特征值的一個(gè)獨(dú)立集合產(chǎn)生的[3()]。結(jié)構(gòu)圖如下圖3-2所示。??15??
小結(jié)??紹了投票組合機(jī)器學(xué)習(xí)預(yù)測股票波動(dòng)方向的模型,對我國上海證券交公司做了實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果平均準(zhǔn)確率在70%-75%之間,相較之前實(shí)準(zhǔn)確率有了提升,并且相比于神經(jīng)網(wǎng)絡(luò),機(jī)器學(xué)習(xí)訓(xùn)練時(shí)間更短一些小,同時(shí),通過與對比實(shí)驗(yàn)中使用的數(shù)據(jù)集對比,說明本實(shí)驗(yàn)中降噪作對后續(xù)的實(shí)驗(yàn)結(jié)果有明顯的幫助。??
【參考文獻(xiàn)】:
期刊論文
[1]基于復(fù)雜網(wǎng)絡(luò)法的股票市場特征分析與指數(shù)構(gòu)建[J]. 王小燕,姚佳含,袁欣. 管理現(xiàn)代化. 2018(06)
博士論文
[1]隨機(jī)森林算法優(yōu)化研究[D]. 曹正鳳.首都經(jīng)濟(jì)貿(mào)易大學(xué) 2014
碩士論文
[1]基于PCA-SVM-GARCH模型的股價(jià)預(yù)測[D]. 景秋玉.首都經(jīng)濟(jì)貿(mào)易大學(xué) 2018
[2]基于百度指數(shù)的上證50指數(shù)預(yù)測研究[D]. 劉燕.上海師范大學(xué) 2018
[3]基于支持向量機(jī)參數(shù)優(yōu)化算法的股票智能投顧策略研究[D]. 高雯.上海師范大學(xué) 2018
[4]基于文本挖掘的投資者情緒與股票市場的關(guān)聯(lián)性研究[D]. 尹樂民.青島大學(xué) 2018
[5]用Stacking算法堆積隨機(jī)森林、GBDT、SVM、Adaboost等七種算法的多因子選股模型[D]. 李佩琛.浙江工商大學(xué) 2018
[6]基于LSTM和投資者情緒的股票行情預(yù)測研究[D]. 周凌寒.華中師范大學(xué) 2018
[7]基于聚類分析的多因子動(dòng)態(tài)加權(quán)實(shí)證檢驗(yàn)[D]. 陳悅竹.山東大學(xué) 2018
[8]多指標(biāo)選股智能投顧策略構(gòu)建研究[D]. 劉晨.上海師范大學(xué) 2018
[9]隨機(jī)森林在技術(shù)指標(biāo)量化選股中的應(yīng)用[D]. 吳衛(wèi)星.電子科技大學(xué) 2018
[10]基于遞歸神經(jīng)網(wǎng)絡(luò)的股票趨勢預(yù)測研究[D]. 石浩.北京郵電大學(xué) 2018
本文編號:3002617
本文鏈接:http://sikaile.net/jingjilunwen/hongguanjingjilunwen/3002617.html
最近更新
教材專著