基于隨機森林算法的多因子量化選股方案策劃
發(fā)布時間:2020-03-28 08:18
【摘要】:在金融市場中,如何獲取較高的收益率,一直是投資者和投機者們分外關(guān)心的問題。量化投資理論因其與數(shù)學高度結(jié)合,具有高度的紀律性和系統(tǒng)性,已經(jīng)成為國外的主流投資策略方案。近年來,隨著人工智能的出現(xiàn),機器學習也逐漸進入學者們的視野,其中,決策樹和神經(jīng)網(wǎng)絡(luò)已經(jīng)被一些學者們用來解決經(jīng)濟學問題,而更多的機器學習算法和量化投資的結(jié)合,是未來發(fā)展的新趨勢。在美國量化投資30多年的發(fā)展史中,量化投資在目前美國二級市場的成交量占比達到將近80%,基金經(jīng)理們通過挖掘市場信息構(gòu)建數(shù)量模型,進而選擇股票組合,賺得盆缽體滿。其中世界上著名的文藝復興科技公司的“大獎?wù)聦_基金”的年均回報率高達34%,且發(fā)揮穩(wěn)定。與美國已經(jīng)成熟和完備的量化投資市場相比,我國的量化投資開展地較晚,但發(fā)展速度迅猛,存在著很多可以挖掘和提升的發(fā)展空間。根據(jù)2017年12月底的報道,我國A股市場已居世界第二位,在日均換手率,也就是流動性方面穩(wěn)居第一位。但同時,在世界對沖基金總規(guī)模3萬億,其中30%以上都采用量化投資方式的現(xiàn)狀來說,我國的量化投資規(guī)模還不足5%。而當今的國內(nèi)的A股市場的有效性不強,量化投資可以利用大量的數(shù)據(jù)統(tǒng)計和挖掘,捕捉市場微觀交易機會,享受量化選股策略帶來的超出市場的超額收益和市場本身整體上漲所帶來的收益。因此選取合適的方法和模型建立量化投資策略開辟市場,為券商和相關(guān)機構(gòu)提升資管規(guī)模,獲得更高收益具有重要的現(xiàn)實意義。在利用多因子模型進行量化選股的策略中,因子選取和因子分類選擇是兩個關(guān)鍵點。在這兩個方向上,本文都做了相應(yīng)的優(yōu)化。在因子選取方面,本文選取的因子的數(shù)據(jù)包含了財務(wù)、估值、動量等等相關(guān)因子共計70個,在因子的數(shù)量和種類上有了一定的擴充。在因子分類方面,本文使用隨機森林算法,對因子進行分類。在運用隨機森林算法進行訓練之后,它可以針對feature的重要性進行輸出,并且可以檢測出feature之間的相關(guān)影響。由于創(chuàng)造模型的時候是使用無偏估計的方式,因此賦予了模型更好的泛化能力,實現(xiàn)簡單,訓練速度快。除此之外,本文還把隨機森林算法和SVM算法進行比較,從而更加凸顯了隨機森林算法在容錯性和避免過擬合等方面的優(yōu)勢。根據(jù)上述設(shè)計思路,本文首先收集基本面、政策面、市場面等等方面對股票波動存在可能影響的因子,共70個。選取2008年12月31日之前上市的部分A股股票和滬深300指數(shù)成分股構(gòu)建基于隨機森林算法的多因子選股模型,在對其優(yōu)化和修改之后進行回測,獲得了極高的收益率,有了良好的效果。本文通過將新型的因子選擇和隨機森林算法相結(jié)合設(shè)計出的量化選股策略獲得了高于市場和相關(guān)指數(shù)以及策略的收益率,具有一定的可行性和實踐意義,同時對現(xiàn)有的選股策略和基金公司未來選股策略的設(shè)計和發(fā)展提供了新的思路。
【圖文】:
圖 1.1 本文的技術(shù)路線文的主要貢獻文建立了基于隨機森林算法的多因子量化選股模型,對其各步驟和改進,并與其他方法和選股策略進行比較,獲得了良好的效果,了隨機森林算法在量化投資方面的優(yōu)勢,更適合建立量化選股模身具有的容錯率高和避免欠擬合的特性是對投資市場現(xiàn)狀的良好著量化投資在我國的不斷發(fā)展,將各種新型的更高效率的算法與相結(jié)合,是一種創(chuàng)新,,也是一種將計量方法與金融結(jié)合的方法。創(chuàng)化選股模型進行實踐并獲取更高的收益,是一種新的嘗試,也給選股的發(fā)展提供了新的思路和方向。
上海師范大學碩士學位論文 第4章 基于隨機森林算法的量化選股方案策劃設(shè)計第 4 章 基于隨機森林算法的量化選股方案策劃設(shè)計4.1 方案設(shè)計的思路與方法指標介紹4.1.1 方案設(shè)計流程本文方案設(shè)計的思路主要是從七個方面來展開,包括獲取數(shù)據(jù)構(gòu)建股票池、提取特征和標簽構(gòu)建因子池、數(shù)據(jù)預(yù)處理、設(shè)置訓練集和交叉驗證集、訓練調(diào)整參數(shù)、樣本測試和模型評估。具體流程圖如下:
【學位授予單位】:上海師范大學
【學位級別】:碩士
【學位授予年份】:2019
【分類號】:F832.51
【圖文】:
圖 1.1 本文的技術(shù)路線文的主要貢獻文建立了基于隨機森林算法的多因子量化選股模型,對其各步驟和改進,并與其他方法和選股策略進行比較,獲得了良好的效果,了隨機森林算法在量化投資方面的優(yōu)勢,更適合建立量化選股模身具有的容錯率高和避免欠擬合的特性是對投資市場現(xiàn)狀的良好著量化投資在我國的不斷發(fā)展,將各種新型的更高效率的算法與相結(jié)合,是一種創(chuàng)新,,也是一種將計量方法與金融結(jié)合的方法。創(chuàng)化選股模型進行實踐并獲取更高的收益,是一種新的嘗試,也給選股的發(fā)展提供了新的思路和方向。
上海師范大學碩士學位論文 第4章 基于隨機森林算法的量化選股方案策劃設(shè)計第 4 章 基于隨機森林算法的量化選股方案策劃設(shè)計4.1 方案設(shè)計的思路與方法指標介紹4.1.1 方案設(shè)計流程本文方案設(shè)計的思路主要是從七個方面來展開,包括獲取數(shù)據(jù)構(gòu)建股票池、提取特征和標簽構(gòu)建因子池、數(shù)據(jù)預(yù)處理、設(shè)置訓練集和交叉驗證集、訓練調(diào)整參數(shù)、樣本測試和模型評估。具體流程圖如下:
【學位授予單位】:上海師范大學
【學位級別】:碩士
【學位授予年份】:2019
【分類號】:F832.51
【相似文獻】
相關(guān)期刊論文 前10條
1 沈智勇;蘇
本文編號:2604190
本文鏈接:http://sikaile.net/jingjilunwen/jinrongzhengquanlunwen/2604190.html
教材專著