基于函數(shù)型數(shù)據(jù)聚類分析的股票投資組合策略研究
發(fā)布時間:2021-04-06 09:20
自1990年我國上交所和深交所成立以來,我國股票交易市場發(fā)展迅速,并伴隨著全球資本市場的一體化和風險不斷的增加,如何規(guī)避市場波動,獲得更大的回報,構(gòu)建較優(yōu)投資組合策略,已成為每個投資者所關注的問題。與此同時,金融數(shù)據(jù)呈爆發(fā)式增長,其波動復雜、高噪聲。在面對日趨復雜且繁的數(shù)據(jù)時,傳統(tǒng)分析方法將難以解決,而函數(shù)型數(shù)據(jù)分析方法作為一種較新的數(shù)據(jù)分析方法,能夠處理海量復雜的數(shù)據(jù),實現(xiàn)對無限維度數(shù)據(jù)的模式挖掘,挖掘出更多重要信息。本文以我國上證50指數(shù)中的43支成分股為研究對象,首先進行數(shù)據(jù)的收集、日收益率的計算,再進行數(shù)據(jù)預處理與函數(shù)型數(shù)據(jù)擬合,轉(zhuǎn)換為函數(shù)型數(shù)據(jù)后,進行函數(shù)型數(shù)據(jù)描述性分析以及函數(shù)型數(shù)據(jù)主成分分析,再利用所得結(jié)果,采用K-means聚類方法對43支股票進行聚類,最后再以聚類結(jié)果構(gòu)建不同投資組合策略,對組合收益效果進行驗證,以期為投資者構(gòu)建投資組合策略提供參考。本文的研究結(jié)果表明:(1)采用函數(shù)型數(shù)據(jù)分析方法能較好地挖掘出所研究股票的深度信息,并以此進行聚類,可將具有不同收益率走勢特征的股票進行區(qū)分。(2)使用函數(shù)型數(shù)據(jù)分析方法進行數(shù)據(jù)重構(gòu)擬合時,光滑參數(shù)λ綜合考慮過擬合和過光滑...
【文章來源】:華僑大學福建省
【文章頁數(shù)】:63 頁
【學位級別】:碩士
【部分圖文】:
圖3.14支股票日對數(shù)收益率
28加上內(nèi)節(jié)點的個數(shù)l。本文中,內(nèi)節(jié)點的個數(shù)l等于節(jié)點個數(shù)L減2,即l=L-2=4,而基函數(shù)的個數(shù)n等于內(nèi)點個數(shù)l加基函數(shù)階數(shù)m,即n=m+l=8。關于光滑參數(shù)λ選取,可自行挑選,也可利用上文提到的廣義交叉驗證,取其最小值。如有必要,可主觀選擇外加考慮廣義交叉驗證的結(jié)果,最后確定光滑系數(shù)。另外,如果沒有粗糙懲罰,基函數(shù)的個數(shù)唯一決定光滑度。他們之間的關系是:所采用的基函數(shù)個數(shù)越多,曲線擬合度會越好,但其光滑度會越差;所采用的基函數(shù)個數(shù)越少,曲線的光滑度會越好,但其擬合度會越差。但是,如果結(jié)合粗糙懲罰法,則光滑度由光滑參數(shù)決定。他們之間的關系是:光滑參數(shù)越大,曲線的光滑度會越好,但其擬合度會越差;光滑參數(shù)越小,曲線擬合度會越好,但其光滑度會越差。此時,就和選取基函數(shù)的個數(shù)沒有關系。因此,本文選擇8個基函數(shù)構(gòu)造函數(shù)型數(shù)據(jù),并再選擇合適的光滑參數(shù)是可行的。最終得到懲罰參數(shù)對數(shù)與GCV值之間的關系如圖3.2,圖中展示了GCV值隨著光滑參數(shù)λ的對數(shù)值10logλ從-2到10的變化過程?梢园l(fā)現(xiàn),GCV的值剛開始隨著對數(shù)值增加而保持不變,而當光滑參數(shù)的對數(shù)值10logλ超過5時,GCV的值開始急速下降,一直銳減到10logλ達到7,此時下降速度開始變慢。如果采取GCV最小的方法,則光滑參數(shù)λ取7.710,這時GCV取到最小值0.001261654。此方法所取的光滑參數(shù)雖然具有較好的光滑效果,但可能會導致所擬合的曲線過于光滑。簡單的說,該方法的光滑效果可以除掉大部分的噪聲,但去除噪聲的同時,可能部分有用的收益率信息也將被過濾掉。圖3.2廣義交叉驗證值圖3.2和表3.4展現(xiàn)部分光滑參數(shù)λ和GCV值的對應關系?梢钥闯,光
29滑參數(shù)在510-7.710的范圍內(nèi),增加光滑參數(shù)會降低GCV。其中,在6.410-6.510范圍內(nèi),GCV下降幅度較大。但在6.910-710范圍內(nèi),GCV下降幅度較校表3.4廣義交叉驗證具體數(shù)值光滑參數(shù)GCV值GCV差值6.4100.001263698754510×6.5100.0012631536.9100.001262414716310×7100.0012622517.7100.001261654NA圖中兩條曲線是第一支股票(浦發(fā)銀行600000)分別在光滑參數(shù)710和7.710時,對1219個交易日對數(shù)收益率原始數(shù)據(jù)擬合后的函數(shù)曲線對比。紅色曲線表示光滑參數(shù)710,黑色曲線表示光滑參數(shù)7.710。由圖可知,光滑參數(shù)7.710擬合的黑色曲線過于光滑,沒有太多的彎曲,導致不止將噪聲去掉,還有可能把有用的真實信息也過濾掉。圖3.3不同光滑參數(shù)下的擬合對比相比而言,光滑參數(shù)710擬合的紅色曲線就沒有出現(xiàn)過度光滑的問題,特別是在第200個交易日后體現(xiàn)出了日對數(shù)收益率數(shù)據(jù)的變化趨勢。最后,經(jīng)過判斷外加考慮廣義交叉驗證的結(jié)果,確定使用光滑參數(shù)為710對日對數(shù)收益率數(shù)據(jù)進行函數(shù)性數(shù)據(jù)擬合。此時,GCV的值為0.001262251,比
【參考文獻】:
期刊論文
[1]基于Copula-GH-CoVaR模型的風險溢出效應研究[J]. 張保帥,段俊,田盈. 重慶師范大學學報(自然科學版). 2019(04)
[2]函數(shù)型數(shù)據(jù)聚類分析研究綜述與展望[J]. 王德青,朱建平,劉曉葳,何凌云. 數(shù)理統(tǒng)計與管理. 2018(01)
[3]熵池理論和風險平均分散化模型在投資組合分配中的應用[J]. 葛穎,程希駿,符永健. 中國科學技術(shù)大學學報. 2013(09)
[4]多階段均值-絕對偏差投資組合優(yōu)化研究[J]. 張鵬. 武漢科技大學學報. 2011(02)
[5]基于小波和多重分形的金融時間序列聚類[J]. 鐘維年,高清維,陳燕玲. 系統(tǒng)工程. 2009(03)
[6]基于下偏矩風險的行為投資組合模型研究[J]. 彭飛,史本山,黃登仕. 管理科學學報. 2008(06)
[7]基于ICA的時間序列聚類方法及其在股票數(shù)據(jù)分析中的應用[J]. 郭崇慧,賈宏峰,張娜. 運籌與管理. 2008(05)
[8]函數(shù)性數(shù)據(jù)的統(tǒng)計分析:思想、方法和應用[J]. 嚴明義. 統(tǒng)計研究. 2007(02)
[9]基于方差波動多重分形特征的金融時間序列聚類[J]. 黃超,吳清烈,武忠,朱揚勇. 系統(tǒng)工程. 2006(06)
[10]金融市場的相關性分析——Copula-GARCH模型及其應用[J]. 韋艷華,張世英. 系統(tǒng)工程. 2004(04)
博士論文
[1]譜聚類方法研究及其在金融時間序列數(shù)據(jù)挖掘中的應用[D]. 蘇木亞.大連理工大學 2011
碩士論文
[1]基于密度和距離自適應確定初始聚類中心的K-Prototypes算法的研究與應用[D]. 陳穎潔.吉林大學 2019
[2]時間序列挖掘方法及在投資組合中的應用[D]. 鄭宇泉.廈門大學 2007
本文編號:3121190
【文章來源】:華僑大學福建省
【文章頁數(shù)】:63 頁
【學位級別】:碩士
【部分圖文】:
圖3.14支股票日對數(shù)收益率
28加上內(nèi)節(jié)點的個數(shù)l。本文中,內(nèi)節(jié)點的個數(shù)l等于節(jié)點個數(shù)L減2,即l=L-2=4,而基函數(shù)的個數(shù)n等于內(nèi)點個數(shù)l加基函數(shù)階數(shù)m,即n=m+l=8。關于光滑參數(shù)λ選取,可自行挑選,也可利用上文提到的廣義交叉驗證,取其最小值。如有必要,可主觀選擇外加考慮廣義交叉驗證的結(jié)果,最后確定光滑系數(shù)。另外,如果沒有粗糙懲罰,基函數(shù)的個數(shù)唯一決定光滑度。他們之間的關系是:所采用的基函數(shù)個數(shù)越多,曲線擬合度會越好,但其光滑度會越差;所采用的基函數(shù)個數(shù)越少,曲線的光滑度會越好,但其擬合度會越差。但是,如果結(jié)合粗糙懲罰法,則光滑度由光滑參數(shù)決定。他們之間的關系是:光滑參數(shù)越大,曲線的光滑度會越好,但其擬合度會越差;光滑參數(shù)越小,曲線擬合度會越好,但其光滑度會越差。此時,就和選取基函數(shù)的個數(shù)沒有關系。因此,本文選擇8個基函數(shù)構(gòu)造函數(shù)型數(shù)據(jù),并再選擇合適的光滑參數(shù)是可行的。最終得到懲罰參數(shù)對數(shù)與GCV值之間的關系如圖3.2,圖中展示了GCV值隨著光滑參數(shù)λ的對數(shù)值10logλ從-2到10的變化過程?梢园l(fā)現(xiàn),GCV的值剛開始隨著對數(shù)值增加而保持不變,而當光滑參數(shù)的對數(shù)值10logλ超過5時,GCV的值開始急速下降,一直銳減到10logλ達到7,此時下降速度開始變慢。如果采取GCV最小的方法,則光滑參數(shù)λ取7.710,這時GCV取到最小值0.001261654。此方法所取的光滑參數(shù)雖然具有較好的光滑效果,但可能會導致所擬合的曲線過于光滑。簡單的說,該方法的光滑效果可以除掉大部分的噪聲,但去除噪聲的同時,可能部分有用的收益率信息也將被過濾掉。圖3.2廣義交叉驗證值圖3.2和表3.4展現(xiàn)部分光滑參數(shù)λ和GCV值的對應關系?梢钥闯,光
29滑參數(shù)在510-7.710的范圍內(nèi),增加光滑參數(shù)會降低GCV。其中,在6.410-6.510范圍內(nèi),GCV下降幅度較大。但在6.910-710范圍內(nèi),GCV下降幅度較校表3.4廣義交叉驗證具體數(shù)值光滑參數(shù)GCV值GCV差值6.4100.001263698754510×6.5100.0012631536.9100.001262414716310×7100.0012622517.7100.001261654NA圖中兩條曲線是第一支股票(浦發(fā)銀行600000)分別在光滑參數(shù)710和7.710時,對1219個交易日對數(shù)收益率原始數(shù)據(jù)擬合后的函數(shù)曲線對比。紅色曲線表示光滑參數(shù)710,黑色曲線表示光滑參數(shù)7.710。由圖可知,光滑參數(shù)7.710擬合的黑色曲線過于光滑,沒有太多的彎曲,導致不止將噪聲去掉,還有可能把有用的真實信息也過濾掉。圖3.3不同光滑參數(shù)下的擬合對比相比而言,光滑參數(shù)710擬合的紅色曲線就沒有出現(xiàn)過度光滑的問題,特別是在第200個交易日后體現(xiàn)出了日對數(shù)收益率數(shù)據(jù)的變化趨勢。最后,經(jīng)過判斷外加考慮廣義交叉驗證的結(jié)果,確定使用光滑參數(shù)為710對日對數(shù)收益率數(shù)據(jù)進行函數(shù)性數(shù)據(jù)擬合。此時,GCV的值為0.001262251,比
【參考文獻】:
期刊論文
[1]基于Copula-GH-CoVaR模型的風險溢出效應研究[J]. 張保帥,段俊,田盈. 重慶師范大學學報(自然科學版). 2019(04)
[2]函數(shù)型數(shù)據(jù)聚類分析研究綜述與展望[J]. 王德青,朱建平,劉曉葳,何凌云. 數(shù)理統(tǒng)計與管理. 2018(01)
[3]熵池理論和風險平均分散化模型在投資組合分配中的應用[J]. 葛穎,程希駿,符永健. 中國科學技術(shù)大學學報. 2013(09)
[4]多階段均值-絕對偏差投資組合優(yōu)化研究[J]. 張鵬. 武漢科技大學學報. 2011(02)
[5]基于小波和多重分形的金融時間序列聚類[J]. 鐘維年,高清維,陳燕玲. 系統(tǒng)工程. 2009(03)
[6]基于下偏矩風險的行為投資組合模型研究[J]. 彭飛,史本山,黃登仕. 管理科學學報. 2008(06)
[7]基于ICA的時間序列聚類方法及其在股票數(shù)據(jù)分析中的應用[J]. 郭崇慧,賈宏峰,張娜. 運籌與管理. 2008(05)
[8]函數(shù)性數(shù)據(jù)的統(tǒng)計分析:思想、方法和應用[J]. 嚴明義. 統(tǒng)計研究. 2007(02)
[9]基于方差波動多重分形特征的金融時間序列聚類[J]. 黃超,吳清烈,武忠,朱揚勇. 系統(tǒng)工程. 2006(06)
[10]金融市場的相關性分析——Copula-GARCH模型及其應用[J]. 韋艷華,張世英. 系統(tǒng)工程. 2004(04)
博士論文
[1]譜聚類方法研究及其在金融時間序列數(shù)據(jù)挖掘中的應用[D]. 蘇木亞.大連理工大學 2011
碩士論文
[1]基于密度和距離自適應確定初始聚類中心的K-Prototypes算法的研究與應用[D]. 陳穎潔.吉林大學 2019
[2]時間序列挖掘方法及在投資組合中的應用[D]. 鄭宇泉.廈門大學 2007
本文編號:3121190
本文鏈接:http://sikaile.net/shoufeilunwen/benkebiyelunwen/3121190.html
最近更新
教材專著