基于Spark增量聚類的投資組合推薦系統(tǒng)的研究與實(shí)現(xiàn)
發(fā)布時(shí)間:2020-05-24 02:17
【摘要】:“互聯(lián)網(wǎng)+”時(shí)代的到來使得互聯(lián)網(wǎng)金融業(yè)千帆競(jìng)發(fā),投資大眾化熱潮興起,居民的消費(fèi)和投資觀念發(fā)生了翻天覆地的變化。近年來,新開戶股民數(shù)量急劇上升,但中國(guó)股市動(dòng)蕩,投資風(fēng)險(xiǎn)高,散戶能夠獲得的有效信息很少。由于股票市場(chǎng)的高復(fù)雜性和影響股票市場(chǎng)的因素較多,如何為股民提供可靠的信息,如何判斷上市公司的內(nèi)在投資價(jià)值,如何選擇出優(yōu)質(zhì)股和潛力股,組成投資組合,以降低股民的投資風(fēng)險(xiǎn),具有巨大的研究?jī)r(jià)值。本文針對(duì)以上問題,深入調(diào)研了選股和投資組合方法,將基本面分析選股法和聚類分析選股法相結(jié)合,提出自己的投資組合推薦策略。針對(duì)本文研究的帶有全局變化特征的增量數(shù)據(jù),設(shè)計(jì)實(shí)現(xiàn)了一種基于Spark分布式平臺(tái)的增量聚類算法,并對(duì)歷年所有上市公司的財(cái)務(wù)數(shù)據(jù)進(jìn)行仿真實(shí)驗(yàn),設(shè)計(jì)出一款投資組合推薦系統(tǒng),應(yīng)用于實(shí)際。首先,本文深入調(diào)研了選股和投資組合方法,將基本面分析選股法和聚類分析選股法相結(jié)合,提出自己的投資組合推薦策略。根據(jù)基本面分析法,研究公司財(cái)務(wù)數(shù)據(jù)特征和財(cái)務(wù)報(bào)表指標(biāo),提取出能反映公司盈利能力、成長(zhǎng)能力、運(yùn)營(yíng)能力、償債能力的20個(gè)基本指標(biāo),作為增量聚類的特征數(shù)據(jù)。其次,深入分析金融時(shí)間序列數(shù)據(jù)特點(diǎn),對(duì)增量數(shù)據(jù)的格式進(jìn)行詳細(xì)闡述。本課題研究的數(shù)據(jù)是帶有全局變化特征的增量數(shù)據(jù),對(duì)于全局變化數(shù)據(jù)的處理,提出增量極差歸一化-金字塔時(shí)間模型,對(duì)于數(shù)據(jù)點(diǎn)不斷增加的處理,提出增量Kmeans算法,并將兩種算法結(jié)合,在Spark分布式平臺(tái)實(shí)現(xiàn)增量聚類算法模型,實(shí)驗(yàn)論證,該增量聚類算法比傳統(tǒng)Kmeans的聚類效果更好。最后,運(yùn)用Java Web設(shè)計(jì)實(shí)現(xiàn)一款投資組合推薦系統(tǒng)。該系統(tǒng)的主要功能包括公司綜合能力評(píng)估和最優(yōu)投資組合推薦。在20個(gè)基本指標(biāo)基礎(chǔ)上,結(jié)合因子分析法,對(duì)公司綜合能力進(jìn)行評(píng)分;在增量聚類得出的結(jié)果之上,每個(gè)簇內(nèi)利用主成分分析法選出主成分再進(jìn)行排序,選出最好的一支股票作為優(yōu)質(zhì)股,將不同簇選出的優(yōu)質(zhì)股組成最優(yōu)投資組合股票池,并對(duì)系統(tǒng)推薦的最優(yōu)投資組合進(jìn)行86天的股票數(shù)據(jù)回測(cè),回測(cè)結(jié)果顯示,推薦的股票收益率表現(xiàn)良好,能夠?yàn)楣擅裢顿Y決策提供重要信息。對(duì)該系統(tǒng)進(jìn)行功能、性能、界面方面的測(cè)試,測(cè)試結(jié)果表明,該系統(tǒng)運(yùn)行良好。
【圖文】:
圖 1-1 投資組合方法匯總圖Fig. 1-1 A summary diagram of the portfolio approach增量聚類的研究現(xiàn)狀數(shù)據(jù)最重要的特征之一是在現(xiàn)有已經(jīng)存在的大量數(shù)據(jù)基礎(chǔ)上,數(shù)據(jù)持續(xù)地?cái)U(kuò)展。許多領(lǐng)域數(shù)據(jù)量驚人的同時(shí),還在不斷地生成新數(shù)據(jù)監(jiān)控、金融交易管理、網(wǎng)絡(luò)流監(jiān)視和web信息處理等。數(shù)據(jù)集增量式],,其內(nèi)容與分布情況也在不斷地動(dòng)態(tài)更新[32],聚類的結(jié)果總是隨著而改變。每次任何新數(shù)據(jù)到達(dá)時(shí),從頭開始聚類所有數(shù)據(jù)雖然直截現(xiàn)實(shí)。增量聚類是解決增量式數(shù)據(jù)集的重要方法。顯然,對(duì)于不斷,最好在原始聚類結(jié)果的基礎(chǔ)上逐步更新新增數(shù)據(jù)點(diǎn)的所屬簇,而有數(shù)據(jù)整體聚類,嘗試最小化原有數(shù)據(jù)點(diǎn)的掃描和計(jì)算工作,有效現(xiàn)有聚類結(jié)果是非常重要的。傳統(tǒng)的聚類算法是為了解決靜態(tài)數(shù)據(jù)
推薦的股票收益率表現(xiàn)良好,能夠?yàn)楣擅裢顿Y決策提供重要信息。對(duì)該系統(tǒng)進(jìn)行功能、性能、界面方面的測(cè)試,測(cè)試結(jié)果表明,該系統(tǒng)運(yùn)行良好。本論文研究的技術(shù)路線圖如下圖1-2:
【學(xué)位授予單位】:黑龍江大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2019
【分類號(hào)】:F832.51;TP311.13;TP391.3
【圖文】:
圖 1-1 投資組合方法匯總圖Fig. 1-1 A summary diagram of the portfolio approach增量聚類的研究現(xiàn)狀數(shù)據(jù)最重要的特征之一是在現(xiàn)有已經(jīng)存在的大量數(shù)據(jù)基礎(chǔ)上,數(shù)據(jù)持續(xù)地?cái)U(kuò)展。許多領(lǐng)域數(shù)據(jù)量驚人的同時(shí),還在不斷地生成新數(shù)據(jù)監(jiān)控、金融交易管理、網(wǎng)絡(luò)流監(jiān)視和web信息處理等。數(shù)據(jù)集增量式],,其內(nèi)容與分布情況也在不斷地動(dòng)態(tài)更新[32],聚類的結(jié)果總是隨著而改變。每次任何新數(shù)據(jù)到達(dá)時(shí),從頭開始聚類所有數(shù)據(jù)雖然直截現(xiàn)實(shí)。增量聚類是解決增量式數(shù)據(jù)集的重要方法。顯然,對(duì)于不斷,最好在原始聚類結(jié)果的基礎(chǔ)上逐步更新新增數(shù)據(jù)點(diǎn)的所屬簇,而有數(shù)據(jù)整體聚類,嘗試最小化原有數(shù)據(jù)點(diǎn)的掃描和計(jì)算工作,有效現(xiàn)有聚類結(jié)果是非常重要的。傳統(tǒng)的聚類算法是為了解決靜態(tài)數(shù)據(jù)
推薦的股票收益率表現(xiàn)良好,能夠?yàn)楣擅裢顿Y決策提供重要信息。對(duì)該系統(tǒng)進(jìn)行功能、性能、界面方面的測(cè)試,測(cè)試結(jié)果表明,該系統(tǒng)運(yùn)行良好。本論文研究的技術(shù)路線圖如下圖1-2:
【學(xué)位授予單位】:黑龍江大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2019
【分類號(hào)】:F832.51;TP311.13;TP391.3
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 黃清華;胡波;鐘偉;陳磊;石元杰;;Effects of background pressure on the arc characteristics of gas spark gap[J];Plasma Science and Technology;2019年12期
2 鄧偉;;SPARK課程理念下的我國(guó)籃球教學(xué)課程構(gòu)建[J];運(yùn)動(dòng)精品;2019年10期
3 孫建順;;基于SPARK課程理念優(yōu)化足球教學(xué)的實(shí)踐探索——以小學(xué)足球正腳背運(yùn)球?yàn)槔齕J];教學(xué)月刊小學(xué)版(綜合);2017年09期
4 陳虹君;謝彩云;;基于Spark的大數(shù)據(jù)實(shí)驗(yàn)室建設(shè)的研究與實(shí)施[J];教育現(xiàn)代化;2016年37期
5 余濤;劉澤q
本文編號(hào):2678303
本文鏈接:http://sikaile.net/jingjilunwen/jinrongzhengquanlunwen/2678303.html
最近更新
教材專著