基于LSTM模型的深度學(xué)習(xí)與遷移學(xué)習(xí)在預(yù)測(cè)外匯匯率中的應(yīng)用研究
發(fā)布時(shí)間:2020-10-12 17:01
正確的分析和預(yù)測(cè)匯率對(duì)制定相關(guān)經(jīng)濟(jì)金融政策,企業(yè)規(guī)避外匯風(fēng)險(xiǎn)來(lái)說(shuō)一直都是具有非常重要的意義的。外匯匯率市場(chǎng)作為一個(gè)非線性變化的動(dòng)態(tài)市場(chǎng),匯率的波動(dòng)變化有著非常顯著的非線性和歷史依賴的特征。神經(jīng)網(wǎng)絡(luò)模型其具有處理非線性特征系統(tǒng)的優(yōu)勢(shì)被廣泛應(yīng)用于外匯預(yù)測(cè)中并被證明比以往的時(shí)間序列預(yù)測(cè)具有更高的精度。但傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)模型卻忽略了序列內(nèi)部的先后時(shí)序關(guān)系,后來(lái)有學(xué)者提出具有記憶持久化功能的遞歸神經(jīng)網(wǎng)絡(luò)(RNN)來(lái)解決時(shí)序依賴的問(wèn)題,但RNN在實(shí)踐中常有梯度消失、難以訓(xùn)練的問(wèn)題。因此后來(lái)人們提出基于門(mén)控制長(zhǎng)短期記憶單元神經(jīng)網(wǎng)絡(luò)即LSTM神經(jīng)網(wǎng)絡(luò)(Long Short-Term Memory),這種神經(jīng)網(wǎng)絡(luò)獨(dú)特的“門(mén)式”控制和記憶單元結(jié)構(gòu)使得其在金融時(shí)間序列中被證明比傳統(tǒng)RNN具有更高的預(yù)測(cè)精度。目前將深度學(xué)習(xí)LSTM神經(jīng)網(wǎng)絡(luò)應(yīng)用于匯率預(yù)測(cè)方面的研究相對(duì)來(lái)說(shuō)比較少,主要還是集中在股指、期貨數(shù)據(jù)上。對(duì)于此本文采用LSTM模型來(lái)對(duì)不同時(shí)間跨度的外匯匯率時(shí)間序列進(jìn)行預(yù)測(cè)。一方面,本文在六種貨幣對(duì)的每分鐘匯率收盤(pán)價(jià)數(shù)據(jù)的基礎(chǔ)上,利用LSTM神經(jīng)網(wǎng)絡(luò)對(duì)不同時(shí)間跨度的短期匯率序列進(jìn)行預(yù)測(cè)并對(duì)比幾種常用的傳統(tǒng)預(yù)測(cè)模型(BP神經(jīng)網(wǎng)絡(luò),支持向量回歸)結(jié)果表明:深度LSTM模型的匯率預(yù)測(cè)模型的預(yù)測(cè)誤差要優(yōu)于這兩個(gè)傳統(tǒng)預(yù)測(cè)模型。另一方面,在外匯匯率更長(zhǎng)時(shí)間跨度預(yù)測(cè)上,對(duì)于神經(jīng)網(wǎng)絡(luò)在時(shí)間間隔增大時(shí)預(yù)測(cè)誤差會(huì)變大這樣一個(gè)問(wèn)題,本文在LSTM模型預(yù)測(cè)的基礎(chǔ)上探究采用遷移學(xué)習(xí)的方法來(lái)提升匯率的變長(zhǎng)時(shí)間跨度下預(yù)測(cè)性能,利用三種貨幣對(duì)的日度匯率序列進(jìn)行時(shí)間遷移和貨幣對(duì)遷移兩方面不同時(shí)間粒度下的匯率預(yù)測(cè)實(shí)證并與LSTM模型直接預(yù)測(cè)比較,實(shí)證結(jié)果表明:1、基于時(shí)間粒度遷移和貨幣對(duì)遷移的LSTM模型具有更低的預(yù)測(cè)誤差;2、在對(duì)澳元兌美元和人民幣兌美元匯率的預(yù)測(cè)中,貨幣對(duì)遷移對(duì)LSTM模型預(yù)測(cè)性能的提升比時(shí)間粒度遷移更大。另外本文以時(shí)間跨度為3天的人民幣匯率為例,通過(guò)EEMD(集合經(jīng)驗(yàn)?zāi)B(tài)分解)方法,將遷移LSTM和LSTM模型預(yù)測(cè)結(jié)果序列進(jìn)行分解并與真實(shí)序列分解的分量序列進(jìn)行對(duì)比,發(fā)現(xiàn)遷移學(xué)習(xí)之所以能夠有效提升LSTM模型對(duì)更長(zhǎng)時(shí)跨度匯率預(yù)測(cè)的性能,是因?yàn)檫w移學(xué)習(xí)在對(duì)低時(shí)間跨度匯率序列進(jìn)行預(yù)訓(xùn)練的過(guò)程中,模型能夠更加充分地學(xué)習(xí)匯率波動(dòng)的長(zhǎng)期變化和趨勢(shì)特征,因而在對(duì)長(zhǎng)時(shí)間跨度匯率序列的預(yù)測(cè)中遷移學(xué)習(xí)LSTM模型能具有更高的精度。
【學(xué)位單位】:華南理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2019
【中圖分類(lèi)】:F832.6
【部分圖文】:
主要介紹本文的研究背景、研究意義,國(guó)內(nèi)外研究現(xiàn)狀以要介紹外匯匯率定義、相關(guān)匯率決定理論,遷移學(xué)習(xí)概念以及絡(luò)、支持向量回歸等相關(guān)模型理論;要應(yīng)用 LSTM 模型、BP 神經(jīng)網(wǎng)絡(luò)模型和 SVR 模型對(duì)六種匯上進(jìn)行分鐘級(jí)的匯率序列預(yù)測(cè)并對(duì)模型的預(yù)測(cè)性能進(jìn)行對(duì)比述基于 LSTM 模型的遷移學(xué)習(xí)在更長(zhǎng)時(shí)間跨度下的匯率預(yù)測(cè)基模型以及最優(yōu)凍結(jié)層數(shù)的基礎(chǔ)上,對(duì)比分析直接 LSTM 預(yù)TM 模型和貨幣對(duì)遷移 LSTM 模型在不同的時(shí)間粒度上預(yù)測(cè)用 EEMD 方法將遷移 LSTM 模型和 LSTM 模型的匯率預(yù)測(cè)序列分解分量進(jìn)行相關(guān)相似度指標(biāo)對(duì)比,分析遷移學(xué)習(xí)在長(zhǎng)列預(yù)測(cè)性能的原因;論與展望,對(duì)本文的主要工作進(jìn)行總結(jié)并指出本文的不足之
間序列預(yù)測(cè)領(lǐng)域當(dāng)中,常用的機(jī)器學(xué)習(xí)模經(jīng)網(wǎng)絡(luò)其良好的非線性擬合能力使得其成支持向量回歸具有完善的統(tǒng)計(jì)數(shù)學(xué)基礎(chǔ),支持向量回歸在各種特征和數(shù)據(jù)預(yù)處理方。一個(gè)回歸平面讓集合內(nèi)所有的數(shù)據(jù)到該)與 y 之間最多有 的偏差,當(dāng) ( )與 y 之SVR 原理圖所示,以 ( )為基準(zhǔn)線,一個(gè)樣本處于這個(gè)間隔帶中,則認(rèn)為這個(gè)訓(xùn)練帶來(lái)的損失為 0。
C 越大,代表越不能容忍誤差,也越容易過(guò)擬合差,越容易欠擬合。 神經(jīng)網(wǎng)絡(luò)網(wǎng)絡(luò)是一種典型的多層正向反饋的神經(jīng)網(wǎng)絡(luò),可以擬合任意線。其拓?fù)浣Y(jié)構(gòu)主要分為三層:輸入層、中間隱藏層和輸出層。三圖 2-2 BP 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)示意圖所示。神經(jīng)網(wǎng)絡(luò)中層與層之間的但同一層的神經(jīng)元之間是不連通的。神經(jīng)網(wǎng)絡(luò)訓(xùn)練的思想就是模出的刺激下不斷優(yōu)化網(wǎng)絡(luò)各神經(jīng)元之間的連接權(quán)值,從而使得網(wǎng)望的輸出。神經(jīng)網(wǎng)絡(luò)所建立的映射逼近數(shù)據(jù)本身輸入輸出之間的映射關(guān)系訓(xùn)練神經(jīng)網(wǎng)絡(luò),通過(guò)合理地設(shè)置參數(shù)使得訓(xùn)練出來(lái)的神經(jīng)網(wǎng)絡(luò)具
【參考文獻(xiàn)】
本文編號(hào):2838036
【學(xué)位單位】:華南理工大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位年份】:2019
【中圖分類(lèi)】:F832.6
【部分圖文】:
主要介紹本文的研究背景、研究意義,國(guó)內(nèi)外研究現(xiàn)狀以要介紹外匯匯率定義、相關(guān)匯率決定理論,遷移學(xué)習(xí)概念以及絡(luò)、支持向量回歸等相關(guān)模型理論;要應(yīng)用 LSTM 模型、BP 神經(jīng)網(wǎng)絡(luò)模型和 SVR 模型對(duì)六種匯上進(jìn)行分鐘級(jí)的匯率序列預(yù)測(cè)并對(duì)模型的預(yù)測(cè)性能進(jìn)行對(duì)比述基于 LSTM 模型的遷移學(xué)習(xí)在更長(zhǎng)時(shí)間跨度下的匯率預(yù)測(cè)基模型以及最優(yōu)凍結(jié)層數(shù)的基礎(chǔ)上,對(duì)比分析直接 LSTM 預(yù)TM 模型和貨幣對(duì)遷移 LSTM 模型在不同的時(shí)間粒度上預(yù)測(cè)用 EEMD 方法將遷移 LSTM 模型和 LSTM 模型的匯率預(yù)測(cè)序列分解分量進(jìn)行相關(guān)相似度指標(biāo)對(duì)比,分析遷移學(xué)習(xí)在長(zhǎng)列預(yù)測(cè)性能的原因;論與展望,對(duì)本文的主要工作進(jìn)行總結(jié)并指出本文的不足之
間序列預(yù)測(cè)領(lǐng)域當(dāng)中,常用的機(jī)器學(xué)習(xí)模經(jīng)網(wǎng)絡(luò)其良好的非線性擬合能力使得其成支持向量回歸具有完善的統(tǒng)計(jì)數(shù)學(xué)基礎(chǔ),支持向量回歸在各種特征和數(shù)據(jù)預(yù)處理方。一個(gè)回歸平面讓集合內(nèi)所有的數(shù)據(jù)到該)與 y 之間最多有 的偏差,當(dāng) ( )與 y 之SVR 原理圖所示,以 ( )為基準(zhǔn)線,一個(gè)樣本處于這個(gè)間隔帶中,則認(rèn)為這個(gè)訓(xùn)練帶來(lái)的損失為 0。
C 越大,代表越不能容忍誤差,也越容易過(guò)擬合差,越容易欠擬合。 神經(jīng)網(wǎng)絡(luò)網(wǎng)絡(luò)是一種典型的多層正向反饋的神經(jīng)網(wǎng)絡(luò),可以擬合任意線。其拓?fù)浣Y(jié)構(gòu)主要分為三層:輸入層、中間隱藏層和輸出層。三圖 2-2 BP 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)示意圖所示。神經(jīng)網(wǎng)絡(luò)中層與層之間的但同一層的神經(jīng)元之間是不連通的。神經(jīng)網(wǎng)絡(luò)訓(xùn)練的思想就是模出的刺激下不斷優(yōu)化網(wǎng)絡(luò)各神經(jīng)元之間的連接權(quán)值,從而使得網(wǎng)望的輸出。神經(jīng)網(wǎng)絡(luò)所建立的映射逼近數(shù)據(jù)本身輸入輸出之間的映射關(guān)系訓(xùn)練神經(jīng)網(wǎng)絡(luò),通過(guò)合理地設(shè)置參數(shù)使得訓(xùn)練出來(lái)的神經(jīng)網(wǎng)絡(luò)具
【參考文獻(xiàn)】
相關(guān)期刊論文 前4條
1 馬超;徐瑾輝;藍(lán)斌;侯天誠(chéng);歐陽(yáng)澤拯;;基于EMD與NARX網(wǎng)絡(luò)的匯率預(yù)測(cè)方法研究[J];西安文理學(xué)院學(xué)報(bào)(自然科學(xué)版);2015年02期
2 莊福振;羅平;何清;史忠植;;遷移學(xué)習(xí)研究進(jìn)展[J];軟件學(xué)報(bào);2015年01期
3 黃益平;王勛;華秀萍;;中國(guó)通貨膨脹的決定因素[J];金融研究;2010年06期
4 楊炘,馬洪波;人工神經(jīng)網(wǎng)絡(luò)在中長(zhǎng)期匯率預(yù)測(cè)中的應(yīng)用[J];系統(tǒng)工程;1999年01期
本文編號(hào):2838036
本文鏈接:http://sikaile.net/jingjilunwen/huobiyinxinglunwen/2838036.html
最近更新
教材專(zhuān)著