基于頂端排序與深度模型的基本面量化方法
發(fā)布時(shí)間:2021-07-04 01:31
在股票市場(chǎng)中,量化投資作為一種利用計(jì)算機(jī)程序替代人為主觀判斷的投資方式,可以避免投資者因情緒波動(dòng)而做出非理性的投資決策。通過(guò)對(duì)上市公司財(cái)務(wù)報(bào)表、公開數(shù)據(jù)進(jìn)行文本挖掘與抽取,量化投資策略可以實(shí)現(xiàn)對(duì)于上市公司的基本面的分析,并尋找盈利狀況較好的優(yōu)質(zhì)公司進(jìn)行資產(chǎn)配置。為進(jìn)一步提升量化投資策略的效果,本文對(duì)基本面量化策略中的量化選股模型和公告文本信息抽取問(wèn)題進(jìn)行了研究,主要?jiǎng)?chuàng)新成果如下:1.本文提出了一種基于頂端排序模型的量化選股算法。以往量化選股算法基于分類模型,難以體現(xiàn)對(duì)多支股票之間優(yōu)劣的比較。本文從優(yōu)化排序的角度出發(fā),提出大小窗口下的頂端排序模型,著重預(yù)測(cè)業(yè)績(jī)最優(yōu)的少數(shù)股票及其順序,更加利于資產(chǎn)配置。該方法構(gòu)建大窗口來(lái)跟進(jìn)股價(jià)較長(zhǎng)時(shí)期內(nèi)漲跌模式的演進(jìn),利用小窗口實(shí)現(xiàn)股價(jià)短期內(nèi)走勢(shì)的捕獲,以此實(shí)現(xiàn)準(zhǔn)確的排序。該方法具有時(shí)間復(fù)雜度低、可解釋性強(qiáng)的優(yōu)點(diǎn),且得到的因子線性權(quán)重也可以結(jié)合傳統(tǒng)多因子策略進(jìn)行選股。實(shí)證檢驗(yàn)結(jié)果表明,本文方法顯著優(yōu)于對(duì)比方法,可以穩(wěn)定獲得超額收益。2.本文提出了一種基于深度模型的遞進(jìn)式公告信息抽取方法,通過(guò)及時(shí)準(zhǔn)確地獲取上市公司最新公開信息,來(lái)幫助量化算法快速準(zhǔn)確地反映...
【文章來(lái)源】:南京大學(xué)江蘇省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:64 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖3-丨:傳統(tǒng)排序與頂端排序效果比較??
?(3-14)??若滿足,則返回頂端排序模型的權(quán)重w之后構(gòu)造當(dāng)期基本面因子特征進(jìn)行??內(nèi)積;若不滿足收斂條件,則進(jìn)行下一輪的迭代。如圖3-2所示展示了頂端排??序模型的算法框架。??3.3實(shí)驗(yàn)驗(yàn)證??在本節(jié),本文利用真實(shí)上市公司基本面因子數(shù)據(jù)對(duì)頂端排序算法進(jìn)行驗(yàn)??證,數(shù)據(jù)來(lái)源某資產(chǎn)管理公司。??為方便理解,首先進(jìn)行符號(hào)的定義。給定包含m家上市公司基本面因子數(shù)??據(jù)與股票收益率,其中每一家公司基本面因子數(shù)據(jù)足e??表示數(shù)據(jù)具有n期且每一期具有rf維數(shù)據(jù),相應(yīng)的,給定對(duì)應(yīng)公司股票收益率??y/r0。w,為大窗口時(shí)間長(zhǎng)度參數(shù),為小窗口時(shí)間長(zhǎng)度參數(shù)。??3.3.1實(shí)驗(yàn)框架??下面簡(jiǎn)要說(shuō)明基于大小窗口下的頂端排序選股方法實(shí)驗(yàn)框架。主要在實(shí)驗(yàn)??層面對(duì)大小窗口下的頂端排序模型進(jìn)行細(xì)節(jié)說(shuō)明。??在初始化參數(shù)之后,首先對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,包括對(duì)數(shù)據(jù)的缺失值處理、??中位數(shù)去極值以及標(biāo)準(zhǔn)化。在缺失值的處理上
相同的構(gòu)造方法構(gòu)造當(dāng)期各公司的基本面因子特征;使用計(jì)算好的頂端排序權(quán)??重與構(gòu)造的特征進(jìn)行內(nèi)積,得到當(dāng)期所有個(gè)股的排序。最后選取前30%個(gè)股作??為當(dāng)期股票持倉(cāng),在第二日開盤后進(jìn)行調(diào)倉(cāng)。算法整體框架如圖3-3所示:??在利用歷史數(shù)據(jù)進(jìn)行實(shí)驗(yàn)時(shí),換倉(cāng)周期為周換倉(cāng),在上周最后一個(gè)交易日??T結(jié)束后提取個(gè)股60日因子及收益率,對(duì)每日分別運(yùn)行頂端排序模型,得到因??子權(quán)重,對(duì)60日因子權(quán)重以半衰期30日求得加權(quán)均值,使用此權(quán)重與T日個(gè)??股因子暴露加權(quán)后得到個(gè)股當(dāng)日排序,選取前100只股票并求其行業(yè)中性權(quán)重??后,在下周第一個(gè)交易日T+1進(jìn)行換倉(cāng),為了避免使用未來(lái)數(shù)據(jù),提取T-5日??及之前的個(gè)股因子及其后5日收益率。實(shí)驗(yàn)流程圖如圖3-4所示:??接下來(lái)介紹實(shí)驗(yàn)所使用的相關(guān)參數(shù)及設(shè)置:??參回測(cè)時(shí)間從2008年5月至2018年6月,2008年1月-2008年5月用來(lái)確定??參數(shù)。???在訓(xùn)練時(shí),股票池選取全A股票訓(xùn)練模型,剔除當(dāng)期停牌股票,并將當(dāng)期??收益率排名前15%的股票作為正例(y?=?1)
【參考文獻(xiàn)】:
期刊論文
[1]基于多因子選股的半監(jiān)督核聚類算法改進(jìn)研究[J]. 李文星,李俊琪. 統(tǒng)計(jì)與信息論壇. 2018(03)
[2]基于多因子模型的量化選股分析[J]. 徐景昭. 金融理論探索. 2017(03)
[3]隨機(jī)森林算法在多因子選股上的應(yīng)用[J]. 李齊,楊君岐. 經(jīng)營(yíng)管理者. 2017(06)
[4]淺析基于大數(shù)據(jù)的多因子量化選股策略[J]. 李姝錦,胡曉旭,王聰. 經(jīng)濟(jì)研究導(dǎo)刊. 2016(17)
[5]中國(guó)股票市場(chǎng)的月份效應(yīng)——基于消費(fèi)習(xí)慣的解釋[J]. 范辛亭,董文卓. 中山大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版). 2007(03)
[6]文本挖掘技術(shù)研究進(jìn)展[J]. 袁軍鵬,朱東華,李毅,李連宏,黃進(jìn). 計(jì)算機(jī)應(yīng)用研究. 2006(02)
[7]文本挖掘研究進(jìn)展[J]. 諶志群,張國(guó)煊. 模式識(shí)別與人工智能. 2005(01)
[8]中國(guó)股市動(dòng)量策略和反向策略的贏利性[J]. 羅洪浪,王浣塵. 系統(tǒng)工程理論方法應(yīng)用. 2004(06)
[9]Web中文文本分詞技術(shù)研究[J]. 馬玉春,宋瀚濤. 計(jì)算機(jī)應(yīng)用. 2004(04)
[10]文本挖掘及其關(guān)鍵技術(shù)與方法[J]. 王麗坤,王宏,陸玉昌. 計(jì)算機(jī)科學(xué). 2002(12)
碩士論文
[1]因子選股模型在中國(guó)市場(chǎng)的實(shí)證研究[D]. 劉毅.復(fù)旦大學(xué) 2012
[2]多因子定價(jià)模型理論及在中國(guó)股票市場(chǎng)的檢驗(yàn)[D]. 王小龍.武漢大學(xué) 2005
本文編號(hào):3263753
【文章來(lái)源】:南京大學(xué)江蘇省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:64 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖3-丨:傳統(tǒng)排序與頂端排序效果比較??
?(3-14)??若滿足,則返回頂端排序模型的權(quán)重w之后構(gòu)造當(dāng)期基本面因子特征進(jìn)行??內(nèi)積;若不滿足收斂條件,則進(jìn)行下一輪的迭代。如圖3-2所示展示了頂端排??序模型的算法框架。??3.3實(shí)驗(yàn)驗(yàn)證??在本節(jié),本文利用真實(shí)上市公司基本面因子數(shù)據(jù)對(duì)頂端排序算法進(jìn)行驗(yàn)??證,數(shù)據(jù)來(lái)源某資產(chǎn)管理公司。??為方便理解,首先進(jìn)行符號(hào)的定義。給定包含m家上市公司基本面因子數(shù)??據(jù)與股票收益率,其中每一家公司基本面因子數(shù)據(jù)足e??表示數(shù)據(jù)具有n期且每一期具有rf維數(shù)據(jù),相應(yīng)的,給定對(duì)應(yīng)公司股票收益率??y/r0。w,為大窗口時(shí)間長(zhǎng)度參數(shù),為小窗口時(shí)間長(zhǎng)度參數(shù)。??3.3.1實(shí)驗(yàn)框架??下面簡(jiǎn)要說(shuō)明基于大小窗口下的頂端排序選股方法實(shí)驗(yàn)框架。主要在實(shí)驗(yàn)??層面對(duì)大小窗口下的頂端排序模型進(jìn)行細(xì)節(jié)說(shuō)明。??在初始化參數(shù)之后,首先對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,包括對(duì)數(shù)據(jù)的缺失值處理、??中位數(shù)去極值以及標(biāo)準(zhǔn)化。在缺失值的處理上
相同的構(gòu)造方法構(gòu)造當(dāng)期各公司的基本面因子特征;使用計(jì)算好的頂端排序權(quán)??重與構(gòu)造的特征進(jìn)行內(nèi)積,得到當(dāng)期所有個(gè)股的排序。最后選取前30%個(gè)股作??為當(dāng)期股票持倉(cāng),在第二日開盤后進(jìn)行調(diào)倉(cāng)。算法整體框架如圖3-3所示:??在利用歷史數(shù)據(jù)進(jìn)行實(shí)驗(yàn)時(shí),換倉(cāng)周期為周換倉(cāng),在上周最后一個(gè)交易日??T結(jié)束后提取個(gè)股60日因子及收益率,對(duì)每日分別運(yùn)行頂端排序模型,得到因??子權(quán)重,對(duì)60日因子權(quán)重以半衰期30日求得加權(quán)均值,使用此權(quán)重與T日個(gè)??股因子暴露加權(quán)后得到個(gè)股當(dāng)日排序,選取前100只股票并求其行業(yè)中性權(quán)重??后,在下周第一個(gè)交易日T+1進(jìn)行換倉(cāng),為了避免使用未來(lái)數(shù)據(jù),提取T-5日??及之前的個(gè)股因子及其后5日收益率。實(shí)驗(yàn)流程圖如圖3-4所示:??接下來(lái)介紹實(shí)驗(yàn)所使用的相關(guān)參數(shù)及設(shè)置:??參回測(cè)時(shí)間從2008年5月至2018年6月,2008年1月-2008年5月用來(lái)確定??參數(shù)。???在訓(xùn)練時(shí),股票池選取全A股票訓(xùn)練模型,剔除當(dāng)期停牌股票,并將當(dāng)期??收益率排名前15%的股票作為正例(y?=?1)
【參考文獻(xiàn)】:
期刊論文
[1]基于多因子選股的半監(jiān)督核聚類算法改進(jìn)研究[J]. 李文星,李俊琪. 統(tǒng)計(jì)與信息論壇. 2018(03)
[2]基于多因子模型的量化選股分析[J]. 徐景昭. 金融理論探索. 2017(03)
[3]隨機(jī)森林算法在多因子選股上的應(yīng)用[J]. 李齊,楊君岐. 經(jīng)營(yíng)管理者. 2017(06)
[4]淺析基于大數(shù)據(jù)的多因子量化選股策略[J]. 李姝錦,胡曉旭,王聰. 經(jīng)濟(jì)研究導(dǎo)刊. 2016(17)
[5]中國(guó)股票市場(chǎng)的月份效應(yīng)——基于消費(fèi)習(xí)慣的解釋[J]. 范辛亭,董文卓. 中山大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版). 2007(03)
[6]文本挖掘技術(shù)研究進(jìn)展[J]. 袁軍鵬,朱東華,李毅,李連宏,黃進(jìn). 計(jì)算機(jī)應(yīng)用研究. 2006(02)
[7]文本挖掘研究進(jìn)展[J]. 諶志群,張國(guó)煊. 模式識(shí)別與人工智能. 2005(01)
[8]中國(guó)股市動(dòng)量策略和反向策略的贏利性[J]. 羅洪浪,王浣塵. 系統(tǒng)工程理論方法應(yīng)用. 2004(06)
[9]Web中文文本分詞技術(shù)研究[J]. 馬玉春,宋瀚濤. 計(jì)算機(jī)應(yīng)用. 2004(04)
[10]文本挖掘及其關(guān)鍵技術(shù)與方法[J]. 王麗坤,王宏,陸玉昌. 計(jì)算機(jī)科學(xué). 2002(12)
碩士論文
[1]因子選股模型在中國(guó)市場(chǎng)的實(shí)證研究[D]. 劉毅.復(fù)旦大學(xué) 2012
[2]多因子定價(jià)模型理論及在中國(guó)股票市場(chǎng)的檢驗(yàn)[D]. 王小龍.武漢大學(xué) 2005
本文編號(hào):3263753
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3263753.html
最近更新
教材專著