利用高斯過(guò)程對(duì)金融市場(chǎng)中的在線知識(shí)選擇性重用的探索研究
發(fā)布時(shí)間:2023-11-14 17:35
金融市場(chǎng)的資產(chǎn)價(jià)格形成機(jī)制復(fù)雜。受到宏觀與微觀因素的影響,金融市場(chǎng)的環(huán)境總是處在不斷地變化之中,這種非平穩(wěn)的特性使得僅用單一策略刻畫金融市場(chǎng)的算法(如ARMA、SVR、NN等)往往在樣本內(nèi)外存在著較大的差異性。為了解決環(huán)境非平穩(wěn)的問(wèn)題,強(qiáng)化學(xué)習(xí)的技術(shù)被引入了金融市場(chǎng)的在線動(dòng)態(tài)決策問(wèn)題中。強(qiáng)化學(xué)習(xí)(Reinforcement Learning,以下簡(jiǎn)稱為RL)是一個(gè)智能體在與環(huán)境交互的過(guò)程中,通過(guò)與環(huán)境的交互反饋來(lái)學(xué)習(xí)如何采取動(dòng)作,從而獲得最大累積獎(jiǎng)勵(lì)的訓(xùn)練過(guò)程,它在許多場(chǎng)景都有著廣泛的應(yīng)用。利用反饋的信息,智能體具備了感知市場(chǎng)動(dòng)向的能力,從而確保模型可以動(dòng)態(tài)在線地糾正對(duì)環(huán)境的認(rèn)識(shí),不斷適應(yīng)變化的環(huán)境。然而前人應(yīng)用在金融領(lǐng)域的強(qiáng)化學(xué)習(xí)技術(shù)依然遺留一個(gè)難點(diǎn):由于市場(chǎng)風(fēng)格的切換可能是很快的,當(dāng)智能體依據(jù)反饋進(jìn)行樣本級(jí)別的更新時(shí),很可能需要花費(fèi)很久才能學(xué)出當(dāng)前環(huán)境下的最優(yōu)策略,在這一過(guò)程中原有的舊知識(shí)可能會(huì)成為一種阻礙;而如果拋棄舊知識(shí)的桎梏,每次都從白板學(xué)起,那么首先舊有的知識(shí)會(huì)被白白浪費(fèi),其次當(dāng)未來(lái)又切換到原有風(fēng)格上,智能體又需要重新學(xué)習(xí),并且也無(wú)法保證模型學(xué)完前環(huán)境不會(huì)切換到其他風(fēng)格。為...
【文章頁(yè)數(shù)】:62 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第一章 序言
第一節(jié) 選題背景
第二節(jié) 問(wèn)題描述及研究方法
第三節(jié) 結(jié)構(gòu)安排
第二章 文獻(xiàn)綜述
第一節(jié) 投資策略研究
第二節(jié) 強(qiáng)化學(xué)習(xí)中的利用與探索
一、利用知識(shí)的研究
二、探索知識(shí)的研究
第三章 問(wèn)題定義及模型描述
第一節(jié) 問(wèn)題描述與符號(hào)定義
第二節(jié) 預(yù)備知識(shí)
一、探索與利用
二、高斯過(guò)程
三、策略重用
第三節(jié) 模型框架
一、獎(jiǎng)勵(lì)及遺憾的定義
二、GP的植入
三、如何利用EE植入探索
四、如何結(jié)合PR提升重用效率
五、模型框架總結(jié)
第四章 實(shí)驗(yàn)驗(yàn)證
第一節(jié) 主實(shí)驗(yàn)準(zhǔn)備
一、數(shù)據(jù)集描述
二、任務(wù)描述
三、對(duì)比基線策略
四、評(píng)價(jià)指標(biāo)
第二節(jié) 主實(shí)驗(yàn)結(jié)果與結(jié)論
一、十年期CBTBAI vs現(xiàn)金
二、不同久期CBTBAI之間的動(dòng)態(tài)切換
三、燒蝕實(shí)驗(yàn)
第三節(jié) 輔助實(shí)驗(yàn)
一、任務(wù)描述
二、實(shí)驗(yàn)設(shè)計(jì)
三、結(jié)果分析
第五章 總結(jié)
參考文獻(xiàn)
附錄 A 股價(jià)的形成機(jī)理
致謝
個(gè)人簡(jiǎn)歷及研究成果
本文編號(hào):3863875
【文章頁(yè)數(shù)】:62 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
第一章 序言
第一節(jié) 選題背景
第二節(jié) 問(wèn)題描述及研究方法
第三節(jié) 結(jié)構(gòu)安排
第二章 文獻(xiàn)綜述
第一節(jié) 投資策略研究
第二節(jié) 強(qiáng)化學(xué)習(xí)中的利用與探索
一、利用知識(shí)的研究
二、探索知識(shí)的研究
第三章 問(wèn)題定義及模型描述
第一節(jié) 問(wèn)題描述與符號(hào)定義
第二節(jié) 預(yù)備知識(shí)
一、探索與利用
二、高斯過(guò)程
三、策略重用
第三節(jié) 模型框架
一、獎(jiǎng)勵(lì)及遺憾的定義
二、GP的植入
三、如何利用EE植入探索
四、如何結(jié)合PR提升重用效率
五、模型框架總結(jié)
第四章 實(shí)驗(yàn)驗(yàn)證
第一節(jié) 主實(shí)驗(yàn)準(zhǔn)備
一、數(shù)據(jù)集描述
二、任務(wù)描述
三、對(duì)比基線策略
四、評(píng)價(jià)指標(biāo)
第二節(jié) 主實(shí)驗(yàn)結(jié)果與結(jié)論
一、十年期CBTBAI vs現(xiàn)金
二、不同久期CBTBAI之間的動(dòng)態(tài)切換
三、燒蝕實(shí)驗(yàn)
第三節(jié) 輔助實(shí)驗(yàn)
一、任務(wù)描述
二、實(shí)驗(yàn)設(shè)計(jì)
三、結(jié)果分析
第五章 總結(jié)
參考文獻(xiàn)
附錄 A 股價(jià)的形成機(jī)理
致謝
個(gè)人簡(jiǎn)歷及研究成果
本文編號(hào):3863875
本文鏈接:http://sikaile.net/jingjilunwen/hongguanjingjilunwen/3863875.html
最近更新
教材專著