天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于XGBoost算法的多因子選股策略研究

發(fā)布時(shí)間:2023-04-02 20:57
  量化投資在投資過(guò)程中以計(jì)算機(jī)和數(shù)學(xué)模型為媒介,具有高效、易評(píng)價(jià)、低波動(dòng)的優(yōu)點(diǎn),而機(jī)器學(xué)習(xí)因?yàn)樘幚砀呔S數(shù)據(jù)效率較高漸漸被應(yīng)用到量化投資領(lǐng)域,XGBoost算法作為一種具有較高預(yù)測(cè)準(zhǔn)確度、速率較高的算法,被越來(lái)越多的應(yīng)用到現(xiàn)代多因子選股模型中。本文正是采用XGBoost算法構(gòu)建多因子量化選股策略進(jìn)行實(shí)證研究。梳理了通過(guò)Tushare Pro平臺(tái)獲取的因子數(shù)據(jù)以及日頻數(shù)據(jù)等財(cái)務(wù)數(shù)據(jù)進(jìn)行計(jì)算最后得到398個(gè)因子,然后通過(guò)Rank-IC和信息熵綜合選取排名前50的因子,通過(guò)對(duì)Logistic回歸模型、隨機(jī)森林、XGBoost算法構(gòu)建選股模型,選取三個(gè)股票收益率具有各自特征的時(shí)間段作為回測(cè)區(qū)間來(lái)評(píng)價(jià)策略表現(xiàn),分別為股災(zāi)前(2010年1月-2014年12月),股災(zāi)期間(2012年1月-2016年12月)以及股災(zāi)后(2016年3月-2021年12月)對(duì)三種模型的對(duì)比分析,結(jié)果表明綜合三個(gè)時(shí)間段,雖然XGBoost算法在最后一個(gè)時(shí)間段略遜于Logistic回歸模型和隨機(jī)森林,但整體來(lái)看XGBoost算法的策略表現(xiàn)還是三個(gè)模型中最為理想的。接下來(lái)文章通過(guò)改變訓(xùn)練集長(zhǎng)度以及加入因子動(dòng)態(tài)篩選對(duì)XGBoost算...

【文章頁(yè)數(shù)】:91 頁(yè)

【學(xué)位級(jí)別】:碩士

【文章目錄】:
摘要
ABSTRACT
1 緒論
    1.1 選題背景及意義
        1.1.1 選題背景
        1.1.2 選題意義
    1.2 文獻(xiàn)綜述
        1.2.1 傳統(tǒng)多因子選股
        1.2.2 機(jī)器算法與多因子選股
        1.2.3 XGBoost算法在選股策略中的應(yīng)用
        1.2.4 文獻(xiàn)評(píng)述
    1.3 研究框架與方法
        1.3.1 研究框架
        1.3.2 研究方法
2 機(jī)器學(xué)習(xí)算法與多因子選股
    2.1 量化投資原理及策略介紹
    2.2 多因子量化選股模型
        2.2.1 CAPM單因子模型
        2.2.2 Fama-French三因素模型
        2.2.3 APT理論(套利定價(jià)理論)
    2.3 機(jī)器學(xué)習(xí)基礎(chǔ)理論
3 多因子選股策略常用模型簡(jiǎn)介及應(yīng)用
    3.1 LOGISTIC回歸模型
    3.2 隨機(jī)森林模型
    3.3 XGBOOST算法
    3.4 Logistic、隨機(jī)森林、XGBoost算法指標(biāo)對(duì)比分析
        3.4.1 模型評(píng)價(jià)指標(biāo)介紹
        3.4.2 三種算法的指標(biāo)對(duì)比分析
4 基于XGBOOST算法的多因子選股策略構(gòu)建以及實(shí)證分析
    4.1 數(shù)據(jù)獲取與預(yù)處理
        4.1.1 數(shù)據(jù)來(lái)源
        4.1.2 數(shù)據(jù)預(yù)處理
    4.2 基于RANK-IC與信息熵的因子篩選
        4.2.1 基于Rank-IC理論概述
        4.2.2 基于信息熵因子理論概述
        4.2.3 結(jié)合Rank-IC值與信息熵綜合選取因子
    4.3 因子數(shù)量的選擇
    4.4 參數(shù)調(diào)優(yōu)
    4.5 不同模型構(gòu)建的策略回測(cè)表現(xiàn)對(duì)比分析
        4.5.1 Logistic回歸模型策略表現(xiàn)
        4.5.2 隨機(jī)森林策略表現(xiàn)
        4.5.3 XGBoost算法策略表現(xiàn)
        4.5.4 三種算法回測(cè)對(duì)比分析
    4.6 本章小結(jié)
5 基于訓(xùn)練集以及滾動(dòng)建模對(duì)XGBOOST算法策略的改進(jìn)
    5.1 因子有效性與訓(xùn)練集設(shè)定邏輯
    5.2 因子重要性動(dòng)態(tài)分析
    5.3 不同訓(xùn)練集長(zhǎng)度及等權(quán)融合下策略的績(jī)效和分析
    5.4 基于XGBOOST算法構(gòu)建的量化策略建議
        5.4.1 本章結(jié)論
        5.4.2 策略建議
6 總結(jié)與展望
    6.1 本文結(jié)論與創(chuàng)新點(diǎn)
        6.1.1. 本文結(jié)論
        6.1.2. 本文創(chuàng)新點(diǎn)
    6.2 本文不足和未來(lái)展望
        6.2.1 本文不足
        6.2.2 研究展望
附錄
參考文獻(xiàn)
后記



本文編號(hào):3779941

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/jingjifazhanlunwen/3779941.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶3a71e***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com