基于函數(shù)型數(shù)據(jù)聚類(lèi)分析的股票投資組合策略研究
發(fā)布時(shí)間:2021-04-06 09:20
自1990年我國(guó)上交所和深交所成立以來(lái),我國(guó)股票交易市場(chǎng)發(fā)展迅速,并伴隨著全球資本市場(chǎng)的一體化和風(fēng)險(xiǎn)不斷的增加,如何規(guī)避市場(chǎng)波動(dòng),獲得更大的回報(bào),構(gòu)建較優(yōu)投資組合策略,已成為每個(gè)投資者所關(guān)注的問(wèn)題。與此同時(shí),金融數(shù)據(jù)呈爆發(fā)式增長(zhǎng),其波動(dòng)復(fù)雜、高噪聲。在面對(duì)日趨復(fù)雜且繁的數(shù)據(jù)時(shí),傳統(tǒng)分析方法將難以解決,而函數(shù)型數(shù)據(jù)分析方法作為一種較新的數(shù)據(jù)分析方法,能夠處理海量復(fù)雜的數(shù)據(jù),實(shí)現(xiàn)對(duì)無(wú)限維度數(shù)據(jù)的模式挖掘,挖掘出更多重要信息。本文以我國(guó)上證50指數(shù)中的43支成分股為研究對(duì)象,首先進(jìn)行數(shù)據(jù)的收集、日收益率的計(jì)算,再進(jìn)行數(shù)據(jù)預(yù)處理與函數(shù)型數(shù)據(jù)擬合,轉(zhuǎn)換為函數(shù)型數(shù)據(jù)后,進(jìn)行函數(shù)型數(shù)據(jù)描述性分析以及函數(shù)型數(shù)據(jù)主成分分析,再利用所得結(jié)果,采用K-means聚類(lèi)方法對(duì)43支股票進(jìn)行聚類(lèi),最后再以聚類(lèi)結(jié)果構(gòu)建不同投資組合策略,對(duì)組合收益效果進(jìn)行驗(yàn)證,以期為投資者構(gòu)建投資組合策略提供參考。本文的研究結(jié)果表明:(1)采用函數(shù)型數(shù)據(jù)分析方法能較好地挖掘出所研究股票的深度信息,并以此進(jìn)行聚類(lèi),可將具有不同收益率走勢(shì)特征的股票進(jìn)行區(qū)分。(2)使用函數(shù)型數(shù)據(jù)分析方法進(jìn)行數(shù)據(jù)重構(gòu)擬合時(shí),光滑參數(shù)λ綜合考慮過(guò)擬合和過(guò)光滑...
【文章來(lái)源】:華僑大學(xué)福建省
【文章頁(yè)數(shù)】:63 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖3.14支股票日對(duì)數(shù)收益率
28加上內(nèi)節(jié)點(diǎn)的個(gè)數(shù)l。本文中,內(nèi)節(jié)點(diǎn)的個(gè)數(shù)l等于節(jié)點(diǎn)個(gè)數(shù)L減2,即l=L-2=4,而基函數(shù)的個(gè)數(shù)n等于內(nèi)點(diǎn)個(gè)數(shù)l加基函數(shù)階數(shù)m,即n=m+l=8。關(guān)于光滑參數(shù)λ選取,可自行挑選,也可利用上文提到的廣義交叉驗(yàn)證,取其最小值。如有必要,可主觀選擇外加考慮廣義交叉驗(yàn)證的結(jié)果,最后確定光滑系數(shù)。另外,如果沒(méi)有粗糙懲罰,基函數(shù)的個(gè)數(shù)唯一決定光滑度。他們之間的關(guān)系是:所采用的基函數(shù)個(gè)數(shù)越多,曲線擬合度會(huì)越好,但其光滑度會(huì)越差;所采用的基函數(shù)個(gè)數(shù)越少,曲線的光滑度會(huì)越好,但其擬合度會(huì)越差。但是,如果結(jié)合粗糙懲罰法,則光滑度由光滑參數(shù)決定。他們之間的關(guān)系是:光滑參數(shù)越大,曲線的光滑度會(huì)越好,但其擬合度會(huì)越差;光滑參數(shù)越小,曲線擬合度會(huì)越好,但其光滑度會(huì)越差。此時(shí),就和選取基函數(shù)的個(gè)數(shù)沒(méi)有關(guān)系。因此,本文選擇8個(gè)基函數(shù)構(gòu)造函數(shù)型數(shù)據(jù),并再選擇合適的光滑參數(shù)是可行的。最終得到懲罰參數(shù)對(duì)數(shù)與GCV值之間的關(guān)系如圖3.2,圖中展示了GCV值隨著光滑參數(shù)λ的對(duì)數(shù)值10logλ從-2到10的變化過(guò)程。可以發(fā)現(xiàn),GCV的值剛開(kāi)始隨著對(duì)數(shù)值增加而保持不變,而當(dāng)光滑參數(shù)的對(duì)數(shù)值10logλ超過(guò)5時(shí),GCV的值開(kāi)始急速下降,一直銳減到10logλ達(dá)到7,此時(shí)下降速度開(kāi)始變慢。如果采取GCV最小的方法,則光滑參數(shù)λ取7.710,這時(shí)GCV取到最小值0.001261654。此方法所取的光滑參數(shù)雖然具有較好的光滑效果,但可能會(huì)導(dǎo)致所擬合的曲線過(guò)于光滑。簡(jiǎn)單的說(shuō),該方法的光滑效果可以除掉大部分的噪聲,但去除噪聲的同時(shí),可能部分有用的收益率信息也將被過(guò)濾掉。圖3.2廣義交叉驗(yàn)證值圖3.2和表3.4展現(xiàn)部分光滑參數(shù)λ和GCV值的對(duì)應(yīng)關(guān)系。可以看出,光
29滑參數(shù)在510-7.710的范圍內(nèi),增加光滑參數(shù)會(huì)降低GCV。其中,在6.410-6.510范圍內(nèi),GCV下降幅度較大。但在6.910-710范圍內(nèi),GCV下降幅度較校表3.4廣義交叉驗(yàn)證具體數(shù)值光滑參數(shù)GCV值GCV差值6.4100.001263698754510×6.5100.0012631536.9100.001262414716310×7100.0012622517.7100.001261654NA圖中兩條曲線是第一支股票(浦發(fā)銀行600000)分別在光滑參數(shù)710和7.710時(shí),對(duì)1219個(gè)交易日對(duì)數(shù)收益率原始數(shù)據(jù)擬合后的函數(shù)曲線對(duì)比。紅色曲線表示光滑參數(shù)710,黑色曲線表示光滑參數(shù)7.710。由圖可知,光滑參數(shù)7.710擬合的黑色曲線過(guò)于光滑,沒(méi)有太多的彎曲,導(dǎo)致不止將噪聲去掉,還有可能把有用的真實(shí)信息也過(guò)濾掉。圖3.3不同光滑參數(shù)下的擬合對(duì)比相比而言,光滑參數(shù)710擬合的紅色曲線就沒(méi)有出現(xiàn)過(guò)度光滑的問(wèn)題,特別是在第200個(gè)交易日后體現(xiàn)出了日對(duì)數(shù)收益率數(shù)據(jù)的變化趨勢(shì)。最后,經(jīng)過(guò)判斷外加考慮廣義交叉驗(yàn)證的結(jié)果,確定使用光滑參數(shù)為710對(duì)日對(duì)數(shù)收益率數(shù)據(jù)進(jìn)行函數(shù)性數(shù)據(jù)擬合。此時(shí),GCV的值為0.001262251,比
【參考文獻(xiàn)】:
期刊論文
[1]基于Copula-GH-CoVaR模型的風(fēng)險(xiǎn)溢出效應(yīng)研究[J]. 張保帥,段俊,田盈. 重慶師范大學(xué)學(xué)報(bào)(自然科學(xué)版). 2019(04)
[2]函數(shù)型數(shù)據(jù)聚類(lèi)分析研究綜述與展望[J]. 王德青,朱建平,劉曉葳,何凌云. 數(shù)理統(tǒng)計(jì)與管理. 2018(01)
[3]熵池理論和風(fēng)險(xiǎn)平均分散化模型在投資組合分配中的應(yīng)用[J]. 葛穎,程希駿,符永健. 中國(guó)科學(xué)技術(shù)大學(xué)學(xué)報(bào). 2013(09)
[4]多階段均值-絕對(duì)偏差投資組合優(yōu)化研究[J]. 張鵬. 武漢科技大學(xué)學(xué)報(bào). 2011(02)
[5]基于小波和多重分形的金融時(shí)間序列聚類(lèi)[J]. 鐘維年,高清維,陳燕玲. 系統(tǒng)工程. 2009(03)
[6]基于下偏矩風(fēng)險(xiǎn)的行為投資組合模型研究[J]. 彭飛,史本山,黃登仕. 管理科學(xué)學(xué)報(bào). 2008(06)
[7]基于ICA的時(shí)間序列聚類(lèi)方法及其在股票數(shù)據(jù)分析中的應(yīng)用[J]. 郭崇慧,賈宏峰,張娜. 運(yùn)籌與管理. 2008(05)
[8]函數(shù)性數(shù)據(jù)的統(tǒng)計(jì)分析:思想、方法和應(yīng)用[J]. 嚴(yán)明義. 統(tǒng)計(jì)研究. 2007(02)
[9]基于方差波動(dòng)多重分形特征的金融時(shí)間序列聚類(lèi)[J]. 黃超,吳清烈,武忠,朱揚(yáng)勇. 系統(tǒng)工程. 2006(06)
[10]金融市場(chǎng)的相關(guān)性分析——Copula-GARCH模型及其應(yīng)用[J]. 韋艷華,張世英. 系統(tǒng)工程. 2004(04)
博士論文
[1]譜聚類(lèi)方法研究及其在金融時(shí)間序列數(shù)據(jù)挖掘中的應(yīng)用[D]. 蘇木亞.大連理工大學(xué) 2011
碩士論文
[1]基于密度和距離自適應(yīng)確定初始聚類(lèi)中心的K-Prototypes算法的研究與應(yīng)用[D]. 陳穎潔.吉林大學(xué) 2019
[2]時(shí)間序列挖掘方法及在投資組合中的應(yīng)用[D]. 鄭宇泉.廈門(mén)大學(xué) 2007
本文編號(hào):3121190
【文章來(lái)源】:華僑大學(xué)福建省
【文章頁(yè)數(shù)】:63 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖3.14支股票日對(duì)數(shù)收益率
28加上內(nèi)節(jié)點(diǎn)的個(gè)數(shù)l。本文中,內(nèi)節(jié)點(diǎn)的個(gè)數(shù)l等于節(jié)點(diǎn)個(gè)數(shù)L減2,即l=L-2=4,而基函數(shù)的個(gè)數(shù)n等于內(nèi)點(diǎn)個(gè)數(shù)l加基函數(shù)階數(shù)m,即n=m+l=8。關(guān)于光滑參數(shù)λ選取,可自行挑選,也可利用上文提到的廣義交叉驗(yàn)證,取其最小值。如有必要,可主觀選擇外加考慮廣義交叉驗(yàn)證的結(jié)果,最后確定光滑系數(shù)。另外,如果沒(méi)有粗糙懲罰,基函數(shù)的個(gè)數(shù)唯一決定光滑度。他們之間的關(guān)系是:所采用的基函數(shù)個(gè)數(shù)越多,曲線擬合度會(huì)越好,但其光滑度會(huì)越差;所采用的基函數(shù)個(gè)數(shù)越少,曲線的光滑度會(huì)越好,但其擬合度會(huì)越差。但是,如果結(jié)合粗糙懲罰法,則光滑度由光滑參數(shù)決定。他們之間的關(guān)系是:光滑參數(shù)越大,曲線的光滑度會(huì)越好,但其擬合度會(huì)越差;光滑參數(shù)越小,曲線擬合度會(huì)越好,但其光滑度會(huì)越差。此時(shí),就和選取基函數(shù)的個(gè)數(shù)沒(méi)有關(guān)系。因此,本文選擇8個(gè)基函數(shù)構(gòu)造函數(shù)型數(shù)據(jù),并再選擇合適的光滑參數(shù)是可行的。最終得到懲罰參數(shù)對(duì)數(shù)與GCV值之間的關(guān)系如圖3.2,圖中展示了GCV值隨著光滑參數(shù)λ的對(duì)數(shù)值10logλ從-2到10的變化過(guò)程。可以發(fā)現(xiàn),GCV的值剛開(kāi)始隨著對(duì)數(shù)值增加而保持不變,而當(dāng)光滑參數(shù)的對(duì)數(shù)值10logλ超過(guò)5時(shí),GCV的值開(kāi)始急速下降,一直銳減到10logλ達(dá)到7,此時(shí)下降速度開(kāi)始變慢。如果采取GCV最小的方法,則光滑參數(shù)λ取7.710,這時(shí)GCV取到最小值0.001261654。此方法所取的光滑參數(shù)雖然具有較好的光滑效果,但可能會(huì)導(dǎo)致所擬合的曲線過(guò)于光滑。簡(jiǎn)單的說(shuō),該方法的光滑效果可以除掉大部分的噪聲,但去除噪聲的同時(shí),可能部分有用的收益率信息也將被過(guò)濾掉。圖3.2廣義交叉驗(yàn)證值圖3.2和表3.4展現(xiàn)部分光滑參數(shù)λ和GCV值的對(duì)應(yīng)關(guān)系。可以看出,光
29滑參數(shù)在510-7.710的范圍內(nèi),增加光滑參數(shù)會(huì)降低GCV。其中,在6.410-6.510范圍內(nèi),GCV下降幅度較大。但在6.910-710范圍內(nèi),GCV下降幅度較校表3.4廣義交叉驗(yàn)證具體數(shù)值光滑參數(shù)GCV值GCV差值6.4100.001263698754510×6.5100.0012631536.9100.001262414716310×7100.0012622517.7100.001261654NA圖中兩條曲線是第一支股票(浦發(fā)銀行600000)分別在光滑參數(shù)710和7.710時(shí),對(duì)1219個(gè)交易日對(duì)數(shù)收益率原始數(shù)據(jù)擬合后的函數(shù)曲線對(duì)比。紅色曲線表示光滑參數(shù)710,黑色曲線表示光滑參數(shù)7.710。由圖可知,光滑參數(shù)7.710擬合的黑色曲線過(guò)于光滑,沒(méi)有太多的彎曲,導(dǎo)致不止將噪聲去掉,還有可能把有用的真實(shí)信息也過(guò)濾掉。圖3.3不同光滑參數(shù)下的擬合對(duì)比相比而言,光滑參數(shù)710擬合的紅色曲線就沒(méi)有出現(xiàn)過(guò)度光滑的問(wèn)題,特別是在第200個(gè)交易日后體現(xiàn)出了日對(duì)數(shù)收益率數(shù)據(jù)的變化趨勢(shì)。最后,經(jīng)過(guò)判斷外加考慮廣義交叉驗(yàn)證的結(jié)果,確定使用光滑參數(shù)為710對(duì)日對(duì)數(shù)收益率數(shù)據(jù)進(jìn)行函數(shù)性數(shù)據(jù)擬合。此時(shí),GCV的值為0.001262251,比
【參考文獻(xiàn)】:
期刊論文
[1]基于Copula-GH-CoVaR模型的風(fēng)險(xiǎn)溢出效應(yīng)研究[J]. 張保帥,段俊,田盈. 重慶師范大學(xué)學(xué)報(bào)(自然科學(xué)版). 2019(04)
[2]函數(shù)型數(shù)據(jù)聚類(lèi)分析研究綜述與展望[J]. 王德青,朱建平,劉曉葳,何凌云. 數(shù)理統(tǒng)計(jì)與管理. 2018(01)
[3]熵池理論和風(fēng)險(xiǎn)平均分散化模型在投資組合分配中的應(yīng)用[J]. 葛穎,程希駿,符永健. 中國(guó)科學(xué)技術(shù)大學(xué)學(xué)報(bào). 2013(09)
[4]多階段均值-絕對(duì)偏差投資組合優(yōu)化研究[J]. 張鵬. 武漢科技大學(xué)學(xué)報(bào). 2011(02)
[5]基于小波和多重分形的金融時(shí)間序列聚類(lèi)[J]. 鐘維年,高清維,陳燕玲. 系統(tǒng)工程. 2009(03)
[6]基于下偏矩風(fēng)險(xiǎn)的行為投資組合模型研究[J]. 彭飛,史本山,黃登仕. 管理科學(xué)學(xué)報(bào). 2008(06)
[7]基于ICA的時(shí)間序列聚類(lèi)方法及其在股票數(shù)據(jù)分析中的應(yīng)用[J]. 郭崇慧,賈宏峰,張娜. 運(yùn)籌與管理. 2008(05)
[8]函數(shù)性數(shù)據(jù)的統(tǒng)計(jì)分析:思想、方法和應(yīng)用[J]. 嚴(yán)明義. 統(tǒng)計(jì)研究. 2007(02)
[9]基于方差波動(dòng)多重分形特征的金融時(shí)間序列聚類(lèi)[J]. 黃超,吳清烈,武忠,朱揚(yáng)勇. 系統(tǒng)工程. 2006(06)
[10]金融市場(chǎng)的相關(guān)性分析——Copula-GARCH模型及其應(yīng)用[J]. 韋艷華,張世英. 系統(tǒng)工程. 2004(04)
博士論文
[1]譜聚類(lèi)方法研究及其在金融時(shí)間序列數(shù)據(jù)挖掘中的應(yīng)用[D]. 蘇木亞.大連理工大學(xué) 2011
碩士論文
[1]基于密度和距離自適應(yīng)確定初始聚類(lèi)中心的K-Prototypes算法的研究與應(yīng)用[D]. 陳穎潔.吉林大學(xué) 2019
[2]時(shí)間序列挖掘方法及在投資組合中的應(yīng)用[D]. 鄭宇泉.廈門(mén)大學(xué) 2007
本文編號(hào):3121190
本文鏈接:http://sikaile.net/shoufeilunwen/benkebiyelunwen/3121190.html
最近更新
教材專(zhuān)著