基于EMD與神經(jīng)網(wǎng)絡(luò)的中國股票市場預(yù)測
本文關(guān)鍵詞:基于EMD與神經(jīng)網(wǎng)絡(luò)的中國股票市場預(yù)測,由筆耕文化傳播整理發(fā)布。
第30卷第6期
2010年6月
文章編號:1000-6788(2010)06-1027-07Systems系統(tǒng)工程理論與實踐Engineering—Theory&Practice中圖分類號:TP27文獻標志碼:AV01.30,No.6June,2010
基于EMD與神經(jīng)網(wǎng)絡(luò)的中國股票市場預(yù)測
王文波-,費浦生z,羿旭明2
(1.武漢科技大學湖北省冶金工業(yè)過程系統(tǒng)科學重點實驗室,武漢430065;2.武漢大學數(shù)學與統(tǒng)計學院,武漢430072)
摘要應(yīng)用EMD分解算法、混沌分析和神經(jīng)網(wǎng)絡(luò)理論提出了一種中國股票市場建模及預(yù)測的
EMD神經(jīng)網(wǎng)絡(luò)模型.首先應(yīng)用EMD分解算法把原始股市時間序列分解成不同尺度的基本模態(tài)分
量,并在此基礎(chǔ)上進一步分析,表明中國股市存在混沌特性;再經(jīng)混沌分析和神經(jīng)網(wǎng)絡(luò)進行組合預(yù)
測,提高了模型對多種目標函數(shù)的學習能力,有效提高了預(yù)測精度.實驗表明:與現(xiàn)有方法相比,該
方法具有較高的精度.
關(guān)鍵詞經(jīng)驗?zāi)B(tài)分解;股市預(yù)測;混沌分析;神經(jīng)網(wǎng)絡(luò)
PredictionofChinastockmarketbased
EMDandneuralnetwork
WANGWen-b01,FEIPu-shen92,YIXu-min92on
(1.HubeiProvinceKeyLaboratoryofSystemsScienceinMetallurgicalProcess,WuhanUniversityofScienceand
Technology,Wuhan430065,China;2.SchoolofMathematicsandStatistics,WuhanUniversity,Wuhan430072,China)AbstractFollowingempiricalmodedecomposition(EMD),chaosanalysisandneuralnetworktheory,,a
methodispresented
serialistomodelandforecaststockmarket.First,usingEMDtheory,thestockmarkettimecandecomposedintomanyintrinsicmodalfunctions(IMF)whichsignificantlyrepresentpotential
informationoforiginaltimeserial,andthefurtheranalysisofIMFindicatesthatChinastockmarketexists
achaosfeature.Then,byusingchaostheoryandneuralnetwork,theforecastingmodelsareestablished
toforecasttheIMFrespectively.Bythesemeans,themodel
morepreciouspredictioncancanbeimprovedtolearnvariousobjectivefunctionandbeobtmned.Theexperimentsshowthatthepresentedmethod
Caneffectivelyimprovethepredictionaccuracy.
Keywordsempiricalmodedecomposition;stockmarketprediction;chaosanalysis;neuralnetwork
1引言
股票市場是涉及金融、經(jīng)濟、政治、社會以及股民心理等諸多影響因素的復(fù)雜的動力學系統(tǒng),其變化過程具有非線性、混沌性、長期記憶性等特點[1-2J.Peters指出金融市場包括股票市場是由不同投資時間水平的交易者組成的,如短期、中期和長期交易者等【3】.不同類型的交易者以不同的時間尺度看待和影響市場:短期交易者只關(guān)注市場短期的價格變換,其行為引起的價格波動只具有短期的記憶;長期交易者關(guān)注市場長期范圍內(nèi)的價格變化,其行為所引起的價格波動具有長期的記憶.由于不同類型交易者的投資理念、受影響因素及投資策略不同,他們所引起的股票價格波動特征完全不同,分散反映在相應(yīng)的不同時間尺度上.近年來,神經(jīng)網(wǎng)絡(luò)理論在股市時間序列分析、建模及預(yù)測等方面得到了廣泛的應(yīng)用[4-5J.小波分析在時域和頻域都具有良好的多尺度分析能力,能把時間序列按不同的尺度分解成不同的層次.基于小波分析的人工神經(jīng)網(wǎng)絡(luò)結(jié)合了兩者的優(yōu)勢,已廣泛應(yīng)用于股票市場的分析研究【6_7】.但小波變換有以下兩點不足ISl,第一,小波分解是利用基函數(shù)(小波基)來模擬信號,本質(zhì)上還是一種窗口可調(diào)的傅里葉變換,沒有從根本上擺脫傅里葉分析的局限.因此小波分解不能根據(jù)信號本身特性實現(xiàn)自適應(yīng)的多分辨分析,為了模擬原信號,通常會產(chǎn)生很多本身并不存在的虛假的諧波.第二,在小波分解過程中,分解尺度的大小要預(yù)先給定,且不能再改變,但信收稿日期:2009-02-20
資助項目:國家自然科學基金(70771080);冶金工業(yè)過程系統(tǒng)科學重點實驗室基金(C20100)作者簡介:王文波(1978-),男,博士,副教授,主要從事小波分析和EMD算法在非線性信號處理等方面的研究.
1028系統(tǒng)工程理論與實踐第30卷號中包含的時間尺度通常并不能預(yù)先知道,這就導(dǎo)致小波分解時,并不能把信號中所包含的尺度完整的分離出來.1998年Huang提出了經(jīng)驗?zāi)B(tài)分解算法f9】(Empiricalmodedecomposition,EMD),EMD是基于信號局部特征時間尺度,從原信號中提取固有模態(tài)函數(shù)(Intrinsicmodefunction,IMF).該方法從本質(zhì)上講是對一個信號進行平穩(wěn)化處理,其結(jié)果是將信號中不同尺度的波動或趨勢逐級分解開來,產(chǎn)生一系列具有不同特征尺度的數(shù)據(jù)序列,每—個序列代表一個固有模態(tài)函數(shù).這使得分解得到的各個IMF具有明顯的物理背景,每—個IMF代表了原信號中所包含的—個尺度波動成份,而余項通常代表原信號的趨勢或均值.EMD算法與小波算法相比,可以更準確地反映系統(tǒng)原有的物理特性,有更強的局部表現(xiàn)能力.所以在處理非線性、非平穩(wěn)信號時,EMD方法更為有效【10】.股票信號經(jīng)EMD算法分解后,可得到若干個彼此間影響甚微的基本模式分量,這些分量具有不同的尺度,代表了不同投資時間水平的交易者所引起的股市價格波動,從而簡化了股市序列中不同尺度的特征信息之間的干涉或耦合.如果直接將原始股票數(shù)據(jù)輸入神經(jīng)網(wǎng)絡(luò),信號的特征量并不突出,神經(jīng)網(wǎng)絡(luò)需要耗費較長的時間來認識把握信號的特征.而EMD方法中分解出來的IMF分量本身就代表了原信號的不同的局部特征,因此如果將不同的IMF分量同時并行輸入到神經(jīng)網(wǎng)絡(luò)中進行訓練,就使神經(jīng)網(wǎng)絡(luò)能夠更好地認識、把握原信號的特征,從而大大提高了學習訓練的效率和進行判別的準確性【1l】.本文將EMD方法和遞歸神經(jīng)網(wǎng)絡(luò)模型(DRNN)相結(jié)合,對中國股票市場進行預(yù)測.首先利用EMD方法把股市數(shù)據(jù)分解成若干個IMF,再對每個IMF分量利用遞歸神經(jīng)網(wǎng)絡(luò)進行預(yù)測,然后用各個分量的預(yù)測值重構(gòu)出原始信號的預(yù)測序列,從而提高預(yù)測精度.實驗表明,該方法是有效的.
2基于EMD分解和混沌分析的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
2.1EMD分解算法
EMD算法基于這樣的假設(shè):任何信號都是由一系列幅度和相位都隨時間變化的基本模式分量構(gòu)成,這種基本模式分量必須滿足兩個條件,即它的零點數(shù)與極點數(shù)相等或至多相差1個,以及由它的極大值和極小值確定的上下包絡(luò)線關(guān)于時間軸局部對稱.Huang將這種基本模式分量定義為固有模態(tài)函數(shù),即IMF.EMD方法可以將多分量信號的各階IMF一一篩選出來,具體步驟如下:設(shè)原始的信號為s(t),
1)確定s(t)的所有極大值和極小值;
2)根據(jù)極大值和極小值作三次樣條插值來構(gòu)造s(£)的上下包絡(luò)線;
3)根據(jù)上下包絡(luò)線,計算出s(£)的局部均值mil(t)以及s(£)和m11(t)的差值hll(t)=s—m11(£);
4)以h11(t)代替原始信號s(t),重復(fù)以上三步,直到hi(k-1)與hlk之間的方差小于某一設(shè)定值,即認為hlk是一個IMF分量,記Cl=hlk,rl(t)=s(t)一C1,8(t)=rl(t);
5)重復(fù)以上四步,直到‰小于一設(shè)定值,或者‰變成了一個單調(diào)函數(shù)時,原始信號的EMD分解結(jié)束,得到8(t)的分解形式如下:8(t)=∑竺1
特征,并且是窄帶信號.
2.2混沌序列的遞歸神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)算法Q+r,每一個IMF分量都反映了原信號不同實踐尺度的內(nèi)在模態(tài)
在混沌時間序列中,系統(tǒng)中每個分量的變化都是由與其相互作用的其他分量所決定的.因此,每個分量的演化過程都包含著整個系統(tǒng)的信息,動力系統(tǒng)中單分量的實測時序x(t)是一維的,動力系統(tǒng)的全部本質(zhì)特征都隱藏在這一時序中.將動力系統(tǒng)的本質(zhì)特征從這一維時序中提取出來是求解特征值和特征向量的重要內(nèi)容.為了能夠從時間序列中得到動力系統(tǒng)相空間的幾何結(jié)構(gòu),Packard等人采用時間延滯技術(shù),他們把一維時間空間序列嵌入到m維空間中,則x(t)={z(£),x(t—T),…,x(t一(m一1)T)),其中,x(t)表示t時刻系統(tǒng)的動力學狀態(tài),T為延遲時間,m是嵌入空間矩陣的維數(shù).由此可以建立相空間到嵌入空間的映射,則在相空間中必然存在函數(shù),(.)使得延時后的狀態(tài)x(x+T)和當前狀態(tài)x(t)之間滿足x@+T)=,(x(t)),其中,(.)是待尋找的預(yù)測函數(shù),延遲時間7.和嵌入維數(shù)m可以通過不同的方法獲得.
對上述模型,可用神經(jīng)網(wǎng)絡(luò)進行模擬.首先利用混沌相空間重構(gòu)理論,獲得有關(guān)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的先驗知識,以便合理構(gòu)建神經(jīng)網(wǎng)絡(luò)模型.當進行混沌時間序列預(yù)測時,若時間序列為—個有限離散序列時,可使用內(nèi)插法對序列進行擴充,而后再進行混沌參數(shù)分析.設(shè)刀=l,2,…,在艫空間中存在光滑函數(shù),滿足岔(t7+叩T)=f7(x(£,)),式中叩T為預(yù)測步數(shù)【12】,本文中取町T=1,進行單步預(yù)測.最佳延遲和嵌入維數(shù)可使用互信息量法和G_P算法得到,直接單步預(yù)測最大的特點是預(yù)測模型的輸入數(shù)據(jù)均為測量值,得到的單步預(yù)測模
第6期王文波,等:基于EMD與神經(jīng)網(wǎng)絡(luò)的中國股票市場預(yù)測1029型可由下式表示:
圣0+1)=,(z0),z@一T),…,z@一(M一1)T))
式中的M為神經(jīng)網(wǎng)絡(luò)輸入節(jié)點數(shù),{z(i)Iz≤t+1,為測量值.(1)
3基于EMD的遞歸神經(jīng)網(wǎng)絡(luò)單步預(yù)測模型
根據(jù)股票數(shù)據(jù)的混沌特性[1,13l,本文將EMD分解法和神經(jīng)網(wǎng)絡(luò)結(jié)合起來,建立—個新的神經(jīng)網(wǎng)絡(luò)集成結(jié)構(gòu).首先對股票數(shù)據(jù)進行EMD分解,得到包含各個時間尺度特征的基本模式分量IMFs;再通過—個分離的神經(jīng)網(wǎng)絡(luò)對每—個IMF進行預(yù)測;然后通過另—個線性神經(jīng)網(wǎng)絡(luò),將前一階段中的每—個IMF的預(yù)測結(jié)果作為輸入,對原始序列的下—個樣本進行預(yù)測.整個網(wǎng)絡(luò)分為三個階段(如圖1所示),第一階段中,包括EMD分解單元和插值單元,InX(t)和Inimfi為插值后數(shù)據(jù);第二階段中,NS為結(jié)構(gòu)設(shè)計單元;第三階段中,EDNN表示基于EMD的遞歸神經(jīng)網(wǎng)絡(luò),M是—個沒有隱層的線性神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),q為原始數(shù)據(jù)經(jīng)EMD算法分解后得到的IMF分量的個數(shù).
。第一階段.第二階段第!階段。
圖1基于EMD的遞歸神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)
設(shè)給定一股票數(shù)據(jù){x(t)lt=1,2,…,n),n是時間序列的樣本點數(shù)。則預(yù)測算法的具體實現(xiàn)算法如下:1)利用EMD算法分解股票時間序列.在第一步中,將股票時間序列{x(t)lt=1,2,…,佗)利用EMD算法進行分解,得到有限個基本模式分量{im五(t)忙=1,2,…,n;i=1,2,…,口).
2)利用相空間重構(gòu)理論對神經(jīng)網(wǎng)絡(luò)重要參數(shù)進行預(yù)測.若對序列進行內(nèi)插,則稱為插值倍數(shù),股票時間序列經(jīng)EMD分解后,在進入神經(jīng)網(wǎng)絡(luò)之前,使用內(nèi)插算法對原始序列和每個基本模式分量進行擴展.因此可得到序列X他7)={。他7)It7=1,2,…,n7,及{iraf"(£7)It7=1,2,…,n7;i=1,2,…,g),此時(1)式用公式表示即為:畬(t7+(A+1)p)=,(。他,),z,(亡7一T),…,z他7一(M一1)T)).
在神經(jīng)網(wǎng)絡(luò)中,關(guān)于時間延遲,由S(m,N,r’T)【14】為基礎(chǔ)構(gòu)造統(tǒng)計量來確定最佳時間延遲T7,在S和T關(guān)系圖上第—個極小值對應(yīng)最佳延遲T7;嵌入維數(shù)的選擇使用ln(G。(r))與lnr的關(guān)系求得【15】.在選取相空間重構(gòu)中的最佳延遲T7為神經(jīng)網(wǎng)絡(luò)中的T后,網(wǎng)絡(luò)的輸入層節(jié)點數(shù)M=m.因此,神經(jīng)網(wǎng)絡(luò)模型可表示為[161:s(t7+(A+1))=力(u【2--*2】s(t7)+u【1---’2】z7(∥)+o(2】),圣(t7+A+1)=u【2--*3】s(£7+(1+入))+一引,其中力(.)是—個Ⅳ維的向量集合,包括所有隱層神經(jīng)元的激活函數(shù),那么隱層神經(jīng)元的狀態(tài)集合可由下式表示:。
s(t7(1+入))=【8r(t7+(A+1)),s91(t’+(A+1)),…,s熟(t7+(A+1))J,
其中神經(jīng)網(wǎng)絡(luò)的學習算法選用正向傳播算法[17-1s]來實現(xiàn).
3)對不同的分量預(yù)測完后,得到預(yù)測結(jié)果岔七(t+1),k=1,2,…,口+1.然后通過—個單層的感知器,對{釓0+1)}進行線性組合來預(yù)測原始時間序列的下一個樣本點岔@+1),即圣(t+1)=∑:三:u}圣南(t+1).該層網(wǎng)絡(luò)沒有隱層,輸入層數(shù)目等于第二步中的多層神經(jīng)網(wǎng)絡(luò)的個數(shù),即imf的個數(shù)g;其輸出單元是線性的,對于權(quán)值向量uiO=1,2,…,口)的計算,為了計算最小范數(shù)解,它的訓練可以通過文獻【19]中所述算法來完成.
系統(tǒng)工程理論與實踐第30卷
4實驗結(jié)果與討論
本文選取的實驗數(shù)據(jù)如下:
1)1997-01.02至2002—03-29的上證綜合指數(shù)(000001)和深證成份指數(shù)(9901)日收盤值的對數(shù)收益率數(shù)據(jù)(對數(shù)收益率,即rt=lnpjp(t一11,其中pt為第t天的收盤價);
2)隨機選取上證A股中兩只股票(SH600005和SH600051)從2000-4-3至2005—7-22的日收盤價;
3)隨機選取深證A股中兩支股票(SZ000043和SZ000045)從1999—8.3至2004-10.25的日收盤價.所選取數(shù)據(jù)的樣本數(shù)量都為1259個,分別記為Datal,…,Data6,利用EMD神經(jīng)網(wǎng)絡(luò)算法對股市進行建模和預(yù)測.因為對股市混沌時序只能做短期預(yù)測,所以把每個時間序列的前1200個數(shù)據(jù)作為訓練集,后面59個數(shù)據(jù)作為觀察值來檢驗?zāi)P偷念A(yù)測效果,僅用最新的數(shù)據(jù)作一步預(yù)測,采用標準均方根誤差(RMSE)衡量預(yù)測結(jié)果.
0m
0
n叭
0扣04∞60080010001加0
_o.1L........J‘.........L.........L........JL........JL....._J
8D004006∞10D012叩o伊州叫黼叩忡Ⅷ徹0們00叭0枷400咖印010001瑚
0.05廣—————,——————,————————————————————————1
ox1礦50
弓lu-H“_?I?門-.山Ih_忡d帥玉-.I.一
;阿弋一量區(qū)三歪
左列從上到F分別是:原始信號,f,硝,im畈,魄‘,嘲;
圖2右列從上到下分別是:擁睡,f,,哌,魄7;,f,蛻和余項E證綜合指數(shù)的對數(shù)收益率EMD分解結(jié)果
對Datal經(jīng)EMD分解后,產(chǎn)生8個基本模式分量(如圖2所示).根據(jù)原始數(shù)據(jù)和8個分解后數(shù)據(jù)設(shè)計神經(jīng)網(wǎng)絡(luò)的拓撲結(jié)構(gòu),這里需要計算原始數(shù)據(jù)Datal及imfi,t=1,2,…,8的最佳延遲時間與嵌入維數(shù).由于測鼉數(shù)據(jù)是有限的離散數(shù)據(jù),可根據(jù)計算需要對其進行不同數(shù)量的插值處理,計算出S—t關(guān)系,得到原始數(shù)據(jù)及8個模式分量的最佳延遲分別為:6,6,4,7,9,8,8,5,3;將延遲時間代入G_P算法,經(jīng)計算可得到原始數(shù)據(jù)Datal及模式分量im]i,i=1,2,…,8的hC—lIlr關(guān)系圖,由此得到嵌入維數(shù)與關(guān)聯(lián)維數(shù)的對應(yīng)關(guān)系(如表1所示),因此各序列的嵌入維數(shù)為:10,10,8,12,14,15,7,3,3.在本文的EMD神經(jīng)網(wǎng)絡(luò)中輸入節(jié)點個數(shù)和時間延遲分別等于序列的嵌入維數(shù)和最佳延遲.隱層節(jié)點數(shù)的確定采用試湊法,分別得到9個網(wǎng)絡(luò)的結(jié)構(gòu)為:10-12—1,10-12—1,8-6-1,12—12.1,14-12—1,15—8-l,7-9-1,3-3-1,3-3-1.對Data2,…,Data6按照同樣方法進行預(yù)測,預(yù)測結(jié)果如圖3所示.從圖3(a)和圖3(5)中可以看出,在對上證綜指和深證成指的對數(shù)日收益率預(yù)測中,從第1個點到第59個點,預(yù)測的效果都較好,精度較高.而四支股票的日收盤價的預(yù)測中(圖3(c)一圖3(f)),前一部份點(前15個點左右)預(yù)測的精度較好,隨著預(yù)測點個數(shù)的增加,誤差也逐漸增加,特別是最后一段(第50個點以后),預(yù)測值與實際值之間的誤差已經(jīng)非常大.
出現(xiàn)這種情況可能與上證指數(shù)和深成指數(shù)的性質(zhì)有關(guān),這兩種指數(shù)都是以大量上市股票為樣本,按加權(quán)
本文關(guān)鍵詞:基于EMD與神經(jīng)網(wǎng)絡(luò)的中國股票市場預(yù)測,由筆耕文化傳播整理發(fā)布。
本文編號:182145
本文鏈接:http://sikaile.net/kejilunwen/rengongzhinen/182145.html