基于多項(xiàng)式擬合與支持向量機(jī)的股票關(guān)鍵拐點(diǎn)預(yù)測(cè)
第 1 章 緒論
1.1 研究背景與意義
隨著社會(huì)的穩(wěn)定發(fā)展,普通民眾越來(lái)越熱衷于使用證券投資等理財(cái)方式進(jìn)行理財(cái),尤其股票的投資最受歡迎。股票投資擁有門(mén)檻低、群眾參與度高等特點(diǎn),深受廣大投資者的歡迎。在傳統(tǒng)的投資方式中,投資者對(duì)于股票市場(chǎng)的判斷主要依據(jù)市場(chǎng)信息和政策信息,還有一些投資者以技術(shù)指標(biāo)等分析手段對(duì)投資目標(biāo)進(jìn)行選取。以上投資方式不但效率低下,還會(huì)放大投資者性格上貪婪和投機(jī)等弱點(diǎn),造成其錯(cuò)過(guò)最佳的投資時(shí)機(jī)。 近幾年來(lái)一種名為量化投資的新興投資形式逐漸被中國(guó)投資者所熟知。量化投資的定義為:利用計(jì)算機(jī)相關(guān)技術(shù)對(duì)證券投資相關(guān)信息進(jìn)行分析提取,獲得一個(gè)投資模型,并利用該投資模型實(shí)現(xiàn)對(duì)投資策略的指導(dǎo)。 量化投資者通過(guò)交易模型對(duì)股票數(shù)據(jù)進(jìn)行分析,符合該交易模型的股票意味著該股票可以進(jìn)行投資。量化投資通過(guò)程序化的操作方式有效規(guī)避了人類貪婪和投機(jī)的心理。量化投資基于計(jì)算機(jī)技術(shù)進(jìn)行股票分析,依托計(jì)算機(jī)對(duì)數(shù)據(jù)處理上的優(yōu)勢(shì),擁有比人類高得多的效率,可以對(duì)全部市場(chǎng)的全部股票所產(chǎn)生的海量交易信息數(shù)據(jù)進(jìn)行分析,這一點(diǎn)對(duì)于人類來(lái)說(shuō)在實(shí)踐上十分困難。量化投資也可以通過(guò)數(shù)學(xué)工具對(duì)某支股票的風(fēng)險(xiǎn)進(jìn)行分析,提前提醒投資者投資的風(fēng)險(xiǎn),并作為建議供投資者參考。 量化投資為投資者提供了選股的策略指導(dǎo),利用計(jì)算機(jī)的特點(diǎn),規(guī)避了人性情緒化投資和效率偏低的特點(diǎn)。由于量化投資在中國(guó)股市中剛剛起步,所以該方向的研究意義深遠(yuǎn)。 本文的研究目的就是基于量化投資的特點(diǎn),利用計(jì)算機(jī)在數(shù)據(jù)處理上的優(yōu)勢(shì),對(duì)存在的大量股票信息數(shù)據(jù)進(jìn)行處理,通過(guò)多項(xiàng)式擬合算法提取出股票離散歷史數(shù)據(jù)中的關(guān)鍵拐點(diǎn),利用機(jī)器學(xué)習(xí)的分類算法,在這些拐點(diǎn)與非拐點(diǎn)集合中訓(xùn)練,得出一個(gè)可靠的投資模型。通過(guò)該模型判斷當(dāng)前股票市場(chǎng)是否處于股票價(jià)格關(guān)鍵拐點(diǎn),以此來(lái)為股票投資者提供決策依據(jù)。本文的這種方法規(guī)避了傳統(tǒng)預(yù)測(cè)方法中對(duì)股票完整曲線的預(yù)測(cè)上的精度低噪聲大等問(wèn)題,通過(guò)降低問(wèn)題復(fù)雜度來(lái)提高預(yù)測(cè)精度。
.........
1.2 國(guó)內(nèi)外研究現(xiàn)狀
對(duì)于股票預(yù)測(cè)分析的常用方法有以下幾種: 1.時(shí)間序列分析法:文獻(xiàn)[1]將股票描述為一個(gè)非線性不穩(wěn)定的時(shí)間序列,并利用支持向量機(jī)的回歸算法對(duì)時(shí)間序列模型進(jìn)行分析預(yù)測(cè)。 2.神經(jīng)網(wǎng)絡(luò)法:神經(jīng)網(wǎng)絡(luò)是一種智能化方法,具有擬合非線性函數(shù)的學(xué)習(xí)能力,有較強(qiáng)的健壯性,能夠?qū)⒃肼暈V除[2],可以應(yīng)用到股票預(yù)測(cè)中。 3.決策樹(shù)預(yù)測(cè):這種方式主要基于決策樹(shù),通過(guò)對(duì)互聯(lián)網(wǎng)自媒體中,專家的微博,博客等信息發(fā)布工具進(jìn)行抓取,基于專家的信息進(jìn)行構(gòu)造,形成一個(gè)決策樹(shù)并以此作為預(yù)測(cè)手段。該方法的股票預(yù)測(cè)系統(tǒng)與抓取的專家信息關(guān)系較大,結(jié)果取決于其他人,不能構(gòu)造出屬于自己的預(yù)測(cè)體系。 4.輿論預(yù)測(cè):美國(guó)印第安納大學(xué)的約翰?博倫(Johan Bollen)等人[3],通過(guò)在著名社交網(wǎng)站 Twitter 上獲取的信息,利用可以追蹤情緒的軟件工具將 Twitter 上網(wǎng)友的情緒分為六個(gè)類別,分別是:冷靜、警惕、確信、活力、友善和幸福。通過(guò)使用這些情緒信息來(lái)挖掘民眾對(duì)于某些事件的態(tài)度,以此來(lái)預(yù)測(cè)上市公司股票的價(jià)值,獲得了較好的預(yù)測(cè)結(jié)果。 文獻(xiàn)[5]對(duì)時(shí)間序列法和神經(jīng)網(wǎng)絡(luò)法兩種方式進(jìn)行了分析比較,得出結(jié)論:相較于ARIMA 時(shí)間序列模型的預(yù)測(cè)精度,神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)更加準(zhǔn)確一些,其根本原因是因?yàn)楣善笔袌?chǎng)中包含許多影響因素,對(duì)于這些變化的非線性行為,ARIMA 時(shí)間序列模型作為先行模型具有一些缺點(diǎn),而神經(jīng)網(wǎng)絡(luò)的非線性映射能力可以將這些影響因素區(qū)分出來(lái)[3],所以二者中神經(jīng)網(wǎng)絡(luò)更好。
..........
第 2 章 股票技術(shù)分析與機(jī)器學(xué)習(xí)技術(shù)
證券的分析技術(shù)主要分為基本面分析和技術(shù)分析兩大類;久娣治龅哪康氖菫榱伺袛喙蓛r(jià)現(xiàn)有的價(jià)位是否正常,并根據(jù)宏觀政策、領(lǐng)域發(fā)展趨勢(shì)或者未來(lái)社會(huì)走勢(shì)等信息預(yù)測(cè)該支股票今后的發(fā)展,該方法適用于判斷長(zhǎng)期持有一支股票是否有盈利的可能。而技術(shù)分析主要是用來(lái)預(yù)測(cè)股票短期的趨勢(shì),通過(guò)技術(shù)指標(biāo)判斷出買(mǎi)入時(shí)機(jī)與賣出時(shí)機(jī),價(jià)低進(jìn)入價(jià)高退出,獲得差價(jià)從而盈利。由于基本面分析主要由市場(chǎng)形勢(shì),國(guó)家政策等宏觀不可控因素決定,所以本文使用股票的技術(shù)分析方法判斷股票漲跌。
2.1 技術(shù)分析的前提
由于每個(gè)人對(duì)股票的分析以及看法各不相同并且每個(gè)人購(gòu)入股票的習(xí)慣難以改變。所以在股票歷史中的某種規(guī)則可能會(huì)反映在今后的股票市場(chǎng)的變化中。通過(guò)對(duì)歷史數(shù)據(jù)的分析挖掘,很有可能會(huì)獲取到某種盈利策略.如果股票的價(jià)格以一種完全隨機(jī)的方式進(jìn)行變化,那么預(yù)測(cè)并沒(méi)有太大的作用。但是由于各類趨勢(shì)的存在,,使得股票的價(jià)格不是以一個(gè)完全隨機(jī)的方式變化,而是根據(jù)股民心理、買(mǎi)入賣出數(shù)量和小道消息等一系列原因發(fā)生變化。在獲得某種趨勢(shì)信息后可以有一定的時(shí)間進(jìn)行買(mǎi)與賣操作,從而獲利。能夠影響股票價(jià)格的因素一旦產(chǎn)生,在股票的價(jià)格曲線中可以觀測(cè)到該因素對(duì)股票價(jià)格的影響。 經(jīng)過(guò)文獻(xiàn)的閱讀發(fā)現(xiàn),文獻(xiàn)[4]的作者通過(guò)多次重復(fù)實(shí)驗(yàn),證明了技術(shù)分析在中國(guó)股票市場(chǎng)中應(yīng)用的有效性。[4]這表明了技術(shù)分析在中國(guó)股票市場(chǎng)的有效性,為本文使用技術(shù)分析的手段預(yù)測(cè)股票關(guān)鍵拐點(diǎn)提供了理論依據(jù)。
........
2.2 常用技術(shù)分析的手段
常用的技術(shù)分析主要有通道突破,相對(duì)強(qiáng)弱指標(biāo),均線等等,各自有不同的特點(diǎn)和應(yīng)用領(lǐng)域:通道突破的主要原理是根據(jù)某種算法模擬出股票價(jià)格所擁有的最大最小區(qū)間,當(dāng)股票突破了曲線上限或下限時(shí)說(shuō)明當(dāng)前股票的狀態(tài)超過(guò)了股票應(yīng)有的正常值,所以會(huì)向反方向調(diào)整。均線又稱移動(dòng)平均線,該策略算法比較簡(jiǎn)單,將某一時(shí)間段所有的收盤(pán)價(jià)求和然后除以該周期,得到一個(gè)平均值。均值的時(shí)間段長(zhǎng)度可以根據(jù)需求進(jìn)行變換,在實(shí)際應(yīng)用中 5 日、10 日、20 日和 30 日較為常見(jiàn)。在股票市場(chǎng)中,每一天都能根據(jù)之前的k 天求出一個(gè)平均值,多日的平均值放在一起即可得到一條曲線,該條曲線就是移動(dòng)平均線。根據(jù)均線時(shí)間周期的大小可以將均線分為短期均線、中期均線和長(zhǎng)期均線三種,適用范圍各自不同。在實(shí)際中往往綜合這三種均線的不同組合形式來(lái)判斷預(yù)測(cè)股市的行情。移動(dòng)平均線可以用來(lái)作為投資人士判斷買(mǎi)點(diǎn)賣點(diǎn)的依據(jù),可以簡(jiǎn)單快捷的表現(xiàn)出股票價(jià)格的走勢(shì)。 對(duì)于均線交易策略,文獻(xiàn)[6]證明了其合理性,通過(guò)對(duì)移動(dòng)平均交易策略的深入研究得出了在均線規(guī)則下頭投資者可以獲得超額收益。
.........【學(xué)位級(jí)別】:碩士
第 3 章 基于多項(xiàng)式擬合的離散數(shù)據(jù)趨勢(shì)關(guān)鍵拐點(diǎn)識(shí)別 ........ 18
3.1 實(shí)驗(yàn)意義 ......... 18
3.2 傳統(tǒng)的趨勢(shì)拐點(diǎn)獲取方法 ........... 18
3.3 改進(jìn)思路 ......... 19
3.3.1 插值擬合與多項(xiàng)式擬合的比較選擇 ....... 20
3.4 基于多項(xiàng)式擬合的離散數(shù)據(jù)趨勢(shì)拐點(diǎn)識(shí)別 ..... 21
3.5 效果對(duì)比 ......... 27
第 4 章 基于支持向量機(jī)的股票關(guān)鍵拐點(diǎn)預(yù)測(cè) ........ 32
4.1 實(shí)驗(yàn)架構(gòu) ......... 32
4.2 歷史數(shù)據(jù)抓取 ..... 33
4.2.1 數(shù)據(jù)獲取方式 ......... 33
4.2.2 數(shù)據(jù)保存格式 ......... 33
4.3 收盤(pán)價(jià)關(guān)鍵拐點(diǎn)識(shí)別 ....... 33
4.4 特征向量生成 ..... 36
4.5 兩類分類任務(wù)以及特征向量整合 ..... 41
4.6 支持向量機(jī)核函數(shù)的選擇 ........... 44
第 5 章 結(jié)果分析 ........ 50
5. 1 關(guān)鍵拐點(diǎn)應(yīng)用效果 ........ 50
5.2 效果對(duì)比 ......... 51
第 5 章 結(jié)果分析
5. 1 關(guān)鍵拐點(diǎn)應(yīng)用效果
在測(cè)試數(shù)據(jù)中應(yīng)用訓(xùn)練所得出的向上關(guān)鍵拐點(diǎn)模型。經(jīng)過(guò)模型分類后,取值為 0的日期表示該點(diǎn)不是向上關(guān)鍵拐點(diǎn),取值為 1 的值表示該點(diǎn)是向上關(guān)鍵拐點(diǎn)并且可以進(jìn)行買(mǎi)入操作。取向上關(guān)鍵拐點(diǎn)集合中的一個(gè)元素拿到股票軟件中進(jìn)行比對(duì),由下圖5.1 可知,在 2003 年 9 月 18 日之后,股市開(kāi)啟了一段持續(xù)數(shù)天的上漲趨勢(shì),中間雖有震蕩,但主體價(jià)格還是上漲的。在測(cè)試數(shù)據(jù)中應(yīng)用訓(xùn)練所得出的向下關(guān)鍵拐點(diǎn)模型。經(jīng)過(guò)模型分類后,取值為 0的日期表示該點(diǎn)不是向下關(guān)鍵拐點(diǎn),取值為 1 的值表示該點(diǎn)是向下關(guān)鍵拐點(diǎn),可以進(jìn)行賣出操作。在股票軟件中找出該向下拐點(diǎn)的日期,在股價(jià)趨勢(shì)圖中進(jìn)行比對(duì),由圖5.2 可知,從那天起股票的價(jià)格開(kāi)啟了一段持續(xù)多天的下降趨勢(shì)。下降幅度非常大。
.......
總結(jié)
在實(shí)驗(yàn)的采樣階段,區(qū)別于其他的股票關(guān)鍵拐點(diǎn)預(yù)測(cè),本文提出了基于多項(xiàng)式擬合的股票關(guān)鍵拐點(diǎn)識(shí)別方式。通過(guò)此方法提取出股票收盤(pán)價(jià)以及各個(gè)指標(biāo)的關(guān)鍵拐點(diǎn)。在分類模型的訓(xùn)練階段,本文提出以能反映的股票拐點(diǎn)信息的 MACD、KDJ 和換手率等技術(shù)指標(biāo)作為支持向量機(jī)的特征向量的方法,以分類模型的方式而不是回歸模型的方式對(duì)股票的關(guān)鍵拐點(diǎn)進(jìn)行預(yù)測(cè),最終,通過(guò)實(shí)驗(yàn)表明,該方法可以為投資者提供一定的參考。 為了完成實(shí)驗(yàn),本文所做的具體工作如下所示:
(1)通過(guò)閱讀大量參考文獻(xiàn),得知了技術(shù)分析在中國(guó)股票市場(chǎng)的有效性,為下文通過(guò)技術(shù)分析指標(biāo)進(jìn)行股價(jià)關(guān)鍵拐點(diǎn)預(yù)測(cè)奠定了理論基礎(chǔ)。
(2)通過(guò)閱讀文獻(xiàn),了解了應(yīng)用核函數(shù)的支持向量機(jī)在非線性分類預(yù)測(cè)上的優(yōu)勢(shì),選擇支持向量機(jī)作為實(shí)驗(yàn)的基本算法。
(3)通過(guò)實(shí)驗(yàn)分析了在離散數(shù)據(jù)集合中傳統(tǒng)的拐點(diǎn)識(shí)別方式的缺點(diǎn)。為了改進(jìn)這些缺點(diǎn),提出將多項(xiàng)式擬合法應(yīng)用到離散數(shù)據(jù)當(dāng)中來(lái)獲取其關(guān)鍵拐點(diǎn)。
(4)為了獲得多項(xiàng)式擬合方程的最佳方程階數(shù),本文通過(guò)多次實(shí)驗(yàn)對(duì)不同階數(shù)的多項(xiàng)式方程擬合曲線進(jìn)行分析,通過(guò)其平均漲幅,平均持續(xù)時(shí)間,漲幅與離散時(shí)間的標(biāo)準(zhǔn)差以及誤差率,最終得出結(jié)論:13 階的多項(xiàng)式擬合方程在 50 個(gè)數(shù)據(jù)的數(shù)據(jù)集中擁有最佳的擬合效果。
(5)在多項(xiàng)式擬合識(shí)別股票關(guān)鍵拐點(diǎn)的實(shí)際應(yīng)用過(guò)程中,發(fā)現(xiàn)由于股票數(shù)據(jù)量巨大,該方法不能有效的工作。所以對(duì)多項(xiàng)式擬合方法的擬合過(guò)程進(jìn)行改進(jìn)。通過(guò)分治法的思想,把多項(xiàng)式擬合識(shí)別關(guān)鍵拐點(diǎn)這個(gè)方法應(yīng)用到了大量數(shù)據(jù)集合中。完成了股票關(guān)鍵拐點(diǎn)的采樣識(shí)別。
.........
參考文獻(xiàn)(略)
本文編號(hào):98602
本文鏈接:http://sikaile.net/wenshubaike/lwfw/98602.html