基于LightGBM算法的量化選股策略方案策劃
發(fā)布時間:2020-05-29 01:47
【摘要】:最近幾十年,科學技術飛速發(fā)展。與此同時在此背景下,計算機技術也在飛速的發(fā)展,接連取得突破性成就。也正是計算機技術的飛速發(fā)展,金融量化事業(yè)才得以快速發(fā)展。量化投資不同于以往的投資方式,量化投資是一種主動型的資產管理方法,它是指通過數(shù)量化的方法和程序化的計算機軟件算法來進行交易。量化投資作其以系統(tǒng)性、紀律性和分散性等等一些特點獲得了投資者的廣泛青睞。我國量化投資事業(yè)在一些方面與發(fā)達國家還有較大差距,比如量化思想、量化市場環(huán)境和量化技術。但是可喜的是,我國這幾年在量化方面也取得了很大的成就,很多券商、基金公司、銀行等金融機構都配置了專門的量化部門。本文著眼于眼下國內量化投資的大環(huán)境,也期望通過量化投資方式,在股票市場上取得良好的回報。因此,本文選取滬深300成份股2013年7月至2018年6月每月最后一個交易日的因子數(shù)據(jù)作為數(shù)據(jù)樣本,模型構建主要分為數(shù)據(jù)預處理、因子篩選、模型參數(shù)尋優(yōu)、模型構建與結果分析、模型比較與優(yōu)化幾個部分。本文構建基于Light GBM算法的多因子選股模型,以滬深300成份股為備選股票池,通過上述方案從中選取具有投資價值的股票構建投資組合,選出的股票組合的總收益為40.09%,年化復合收益率高達18.36%,夏普比率為0.4110,有75%的月份跑贏滬深300指數(shù),最后凈值達到1.4009,遠超基準滬深300指數(shù)收益率。總的來說,此多因子選股模型是能夠取得持續(xù)正收益的模型。
【圖文】:
訓練樣本空間呈現(xiàn)出線性可分狀態(tài)時,這時的支持向量機分類最為簡單,只要到一個找的分割面就好了。但是,往往樣本不是線性可分的狀態(tài),這時候支持量機算法就會通過核函數(shù)這個方法,將原始的數(shù)據(jù)投射到更加高維度的特征間,這樣做的目的就是為了使線性不可分狀態(tài)變成線性可分狀態(tài)。這時候就可找出最好的超平面去實現(xiàn)分類任務。與此同時,,找到最優(yōu)分類平面是在以使得構風險降到最低為條件的,以將置信范圍降低到最小范圍當做其目標的。如下圖所示,就是支持向量機算法的簡單原理示意圖。原理示意圖還是比直觀明了的,這說明支持向量機模型雖然有很復雜的原理內容,但是支持向量算法的最直接的思路卻是很直觀明了的。下圖中藍色的點和橙色的點代表著兩不同樣例,支持向量機算法的目的就是找出將他們分為兩類的那個最優(yōu)的超平H 。1H 是橙色樣本構成的平面,這個平面是距離最優(yōu)超平面最近的,并且還超平面是平行的關系。2H 也是相同原理。
的三倍標準差范圍上下波動,而異常值就是那些與平均值相差超過三倍圍的值,用公式表示就是:P (x 3 ) 0.03(如果特征數(shù)值滿足正態(tài)分布的條件這種情況,那么偏差絕對值大于這個的值出現(xiàn)的概率不會大于 0.03 這個概率值。這一般很難會發(fā)生,此時可以將之成為數(shù)據(jù)中的異常值。相比于3 原則使用條件苛刻,處理異常值的箱型圖方法就不要求特征如此嚴格的分布。箱型圖的原理也是十分的簡單,它通過四分位數(shù)來檢的存在。箱型圖通過作圖來給出特征數(shù)據(jù)的直觀分布展示,從這個箱型就可以清楚地看出異常值的存在。另外,用箱型圖而不是3 原則來檢的存在的另外的一個好處在于四分位數(shù)更具有魯棒性,有四分之一的數(shù)得任意遠且不會使四分位數(shù)受到干擾。
【學位授予單位】:上海師范大學
【學位級別】:碩士
【學位授予年份】:2019
【分類號】:F832.51
本文編號:2686183
【圖文】:
訓練樣本空間呈現(xiàn)出線性可分狀態(tài)時,這時的支持向量機分類最為簡單,只要到一個找的分割面就好了。但是,往往樣本不是線性可分的狀態(tài),這時候支持量機算法就會通過核函數(shù)這個方法,將原始的數(shù)據(jù)投射到更加高維度的特征間,這樣做的目的就是為了使線性不可分狀態(tài)變成線性可分狀態(tài)。這時候就可找出最好的超平面去實現(xiàn)分類任務。與此同時,,找到最優(yōu)分類平面是在以使得構風險降到最低為條件的,以將置信范圍降低到最小范圍當做其目標的。如下圖所示,就是支持向量機算法的簡單原理示意圖。原理示意圖還是比直觀明了的,這說明支持向量機模型雖然有很復雜的原理內容,但是支持向量算法的最直接的思路卻是很直觀明了的。下圖中藍色的點和橙色的點代表著兩不同樣例,支持向量機算法的目的就是找出將他們分為兩類的那個最優(yōu)的超平H 。1H 是橙色樣本構成的平面,這個平面是距離最優(yōu)超平面最近的,并且還超平面是平行的關系。2H 也是相同原理。
的三倍標準差范圍上下波動,而異常值就是那些與平均值相差超過三倍圍的值,用公式表示就是:P (x 3 ) 0.03(如果特征數(shù)值滿足正態(tài)分布的條件這種情況,那么偏差絕對值大于這個的值出現(xiàn)的概率不會大于 0.03 這個概率值。這一般很難會發(fā)生,此時可以將之成為數(shù)據(jù)中的異常值。相比于3 原則使用條件苛刻,處理異常值的箱型圖方法就不要求特征如此嚴格的分布。箱型圖的原理也是十分的簡單,它通過四分位數(shù)來檢的存在。箱型圖通過作圖來給出特征數(shù)據(jù)的直觀分布展示,從這個箱型就可以清楚地看出異常值的存在。另外,用箱型圖而不是3 原則來檢的存在的另外的一個好處在于四分位數(shù)更具有魯棒性,有四分之一的數(shù)得任意遠且不會使四分位數(shù)受到干擾。
【學位授予單位】:上海師范大學
【學位級別】:碩士
【學位授予年份】:2019
【分類號】:F832.51
【參考文獻】
相關期刊論文 前4條
1 曹正鳳;紀宏;謝邦昌;;使用隨機森林算法實現(xiàn)優(yōu)質股票的選擇[J];首都經(jīng)濟貿易大學學報;2014年02期
2 陳榮達;虞歡歡;;基于啟發(fā)式算法的支持向量機選股模型[J];系統(tǒng)工程;2014年02期
3 蘇治;傅曉媛;;核主成分遺傳算法與SVR選股模型改進[J];統(tǒng)計研究;2013年05期
4 董伯明;美國股票市場的技術分析法及其理論[J];世界經(jīng)濟研究;1990年01期
本文編號:2686183
本文鏈接:http://sikaile.net/jingjilunwen/jinrongzhengquanlunwen/2686183.html