基于多因子選股的半監(jiān)督核聚類(lèi)算法改進(jìn)研究
發(fā)布時(shí)間:2020-06-04 14:33
【摘要】:研究了一種附有引力影響因子的半監(jiān)督K-means核函數(shù)聚類(lèi)算法,并將該方法應(yīng)用于多因子選股模型中。研究表明,相比傳統(tǒng)的聚類(lèi)模型,改進(jìn)的模型具有較強(qiáng)的泛化能力,模型在處理樣本線性不可分、樣本分布非球狀簇等問(wèn)題上具有明顯的優(yōu)勢(shì),能選出較優(yōu)的股票組合。
【圖文】:
試點(diǎn)距離較大時(shí),多項(xiàng)式核函數(shù)值逐漸增大,并將趨于無(wú)窮。因此,多項(xiàng)式核函數(shù)具有較強(qiáng)的泛化能力,但學(xué)習(xí)能力較弱。圖2多項(xiàng)式核函數(shù)高斯核函數(shù)將樣本向量映射到高維特征空間中,會(huì)使得樣本點(diǎn)變得非常稀疏,要改變這一特性必須滿(mǎn)足兩個(gè)條件,第一是在測(cè)試點(diǎn)附近有較快衰減,第二是在無(wú)限遠(yuǎn)處仍保持適度衰減。本文基于核函數(shù)理論,引入了一種修正的高斯核函數(shù)[10],其表達(dá)式為:K(xi,xj)=expσ2‖xi-xj‖2+γ2+()λ(4)其中,σ是核函數(shù)的帶寬變量,γ為位移參數(shù),λ為微調(diào)參數(shù)變量,該核函數(shù)兼具全局性核函數(shù)與局部性核函數(shù)的性質(zhì)。通過(guò)修正后的高斯核函數(shù)可知,當(dāng)樣本點(diǎn)接近于測(cè)試點(diǎn)時(shí),函數(shù)取值較大;離測(cè)試點(diǎn)越遠(yuǎn),則函數(shù)取值越校σ值為函數(shù)帶寬變量,通過(guò)控制σ值可以靈活地控制函數(shù)的帶寬,且σ取值越大函數(shù)圖像帶寬越校γ的取值主要影響的是核函數(shù)的“胖瘦”程度;γ取值越大,核函數(shù)圖形越“胖”。λ為微調(diào)參數(shù),該參數(shù)能夠確保隨著輸入值與測(cè)試值的距離增加,,核函數(shù)值不會(huì)趨于無(wú)窮校相較于原始的高斯核函數(shù),在方差σ相同的情況下,修正的高斯核函數(shù)具有較大的峰度,距離較近的點(diǎn)對(duì)核函數(shù)影響較大,隨著距離增加,該核函數(shù)值會(huì)迅速衰減,但不會(huì)趨于無(wú)窮小,該核函數(shù)兼顧較強(qiáng)的泛化能力和學(xué)習(xí)能力。從圖3可知,相比于原始高斯核函數(shù),修正的高斯核函數(shù)樣本點(diǎn)在離測(cè)試點(diǎn)較近的區(qū)域,函數(shù)值衰減較快,在離測(cè)試點(diǎn)較遠(yuǎn)的區(qū)域,修正的高斯核函數(shù)的函數(shù)值衰減速度相比于原始的高斯核函數(shù)要慢很多。通過(guò)調(diào)整修正后的高斯核函數(shù)的參數(shù)γ,可以靈活控制函數(shù)值的衰減速度。修正后
值越校σ值為函數(shù)帶寬變量,通過(guò)控制σ值可以靈活地控制函數(shù)的帶寬,且σ取值越大函數(shù)圖像帶寬越校γ的取值主要影響的是核函數(shù)的“胖瘦”程度;γ取值越大,核函數(shù)圖形越“胖”。λ為微調(diào)參數(shù),該參數(shù)能夠確保隨著輸入值與測(cè)試值的距離增加,核函數(shù)值不會(huì)趨于無(wú)窮校相較于原始的高斯核函數(shù),在方差σ相同的情況下,修正的高斯核函數(shù)具有較大的峰度,距離較近的點(diǎn)對(duì)核函數(shù)影響較大,隨著距離增加,該核函數(shù)值會(huì)迅速衰減,但不會(huì)趨于無(wú)窮小,該核函數(shù)兼顧較強(qiáng)的泛化能力和學(xué)習(xí)能力。從圖3可知,相比于原始高斯核函數(shù),修正的高斯核函數(shù)樣本點(diǎn)在離測(cè)試點(diǎn)較近的區(qū)域,函數(shù)值衰減較快,在離測(cè)試點(diǎn)較遠(yuǎn)的區(qū)域,修正的高斯核函數(shù)的函數(shù)值衰減速度相比于原始的高斯核函數(shù)要慢很多。通過(guò)調(diào)整修正后的高斯核函數(shù)的參數(shù)γ,可以靈活控制函數(shù)值的衰減速度。修正后的高斯核函數(shù)能夠在一定程度上彌補(bǔ)原始高斯核函數(shù)值在無(wú)限遠(yuǎn)處趨于無(wú)窮小的不足。因此,修正后的高斯核函數(shù)同時(shí)具備了較強(qiáng)的泛化能力和學(xué)習(xí)能力。圖3修正后的高斯核函數(shù)(二)改進(jìn)的半監(jiān)督K-means核聚類(lèi)改進(jìn)的半監(jiān)督K-means核聚類(lèi)將修正后的高斯核函數(shù)用于樣本之間相似度的測(cè)量,使得半監(jiān)督K-means聚類(lèi)方法在處理線性不可分樣本時(shí)具有較好的效果。本文基于帶引力參數(shù)的半監(jiān)督K-means聚類(lèi)算法,通過(guò)引入修正后的高斯核函數(shù)算法,使得新的模型在處理模型局部最優(yōu)、樣本分布為非球狀簇及樣本線性不可分等問(wèn)題上具有較好的效果。改進(jìn)半監(jiān)督K-means核聚類(lèi)算法主要基于以下兩個(gè)方面考慮:第一,在引力影響因子計(jì)算過(guò)程中引入核函數(shù)。引力影響因子算法通過(guò)引入核函數(shù),使得已標(biāo)
本文編號(hào):2696522
【圖文】:
試點(diǎn)距離較大時(shí),多項(xiàng)式核函數(shù)值逐漸增大,并將趨于無(wú)窮。因此,多項(xiàng)式核函數(shù)具有較強(qiáng)的泛化能力,但學(xué)習(xí)能力較弱。圖2多項(xiàng)式核函數(shù)高斯核函數(shù)將樣本向量映射到高維特征空間中,會(huì)使得樣本點(diǎn)變得非常稀疏,要改變這一特性必須滿(mǎn)足兩個(gè)條件,第一是在測(cè)試點(diǎn)附近有較快衰減,第二是在無(wú)限遠(yuǎn)處仍保持適度衰減。本文基于核函數(shù)理論,引入了一種修正的高斯核函數(shù)[10],其表達(dá)式為:K(xi,xj)=expσ2‖xi-xj‖2+γ2+()λ(4)其中,σ是核函數(shù)的帶寬變量,γ為位移參數(shù),λ為微調(diào)參數(shù)變量,該核函數(shù)兼具全局性核函數(shù)與局部性核函數(shù)的性質(zhì)。通過(guò)修正后的高斯核函數(shù)可知,當(dāng)樣本點(diǎn)接近于測(cè)試點(diǎn)時(shí),函數(shù)取值較大;離測(cè)試點(diǎn)越遠(yuǎn),則函數(shù)取值越校σ值為函數(shù)帶寬變量,通過(guò)控制σ值可以靈活地控制函數(shù)的帶寬,且σ取值越大函數(shù)圖像帶寬越校γ的取值主要影響的是核函數(shù)的“胖瘦”程度;γ取值越大,核函數(shù)圖形越“胖”。λ為微調(diào)參數(shù),該參數(shù)能夠確保隨著輸入值與測(cè)試值的距離增加,,核函數(shù)值不會(huì)趨于無(wú)窮校相較于原始的高斯核函數(shù),在方差σ相同的情況下,修正的高斯核函數(shù)具有較大的峰度,距離較近的點(diǎn)對(duì)核函數(shù)影響較大,隨著距離增加,該核函數(shù)值會(huì)迅速衰減,但不會(huì)趨于無(wú)窮小,該核函數(shù)兼顧較強(qiáng)的泛化能力和學(xué)習(xí)能力。從圖3可知,相比于原始高斯核函數(shù),修正的高斯核函數(shù)樣本點(diǎn)在離測(cè)試點(diǎn)較近的區(qū)域,函數(shù)值衰減較快,在離測(cè)試點(diǎn)較遠(yuǎn)的區(qū)域,修正的高斯核函數(shù)的函數(shù)值衰減速度相比于原始的高斯核函數(shù)要慢很多。通過(guò)調(diào)整修正后的高斯核函數(shù)的參數(shù)γ,可以靈活控制函數(shù)值的衰減速度。修正后
值越校σ值為函數(shù)帶寬變量,通過(guò)控制σ值可以靈活地控制函數(shù)的帶寬,且σ取值越大函數(shù)圖像帶寬越校γ的取值主要影響的是核函數(shù)的“胖瘦”程度;γ取值越大,核函數(shù)圖形越“胖”。λ為微調(diào)參數(shù),該參數(shù)能夠確保隨著輸入值與測(cè)試值的距離增加,核函數(shù)值不會(huì)趨于無(wú)窮校相較于原始的高斯核函數(shù),在方差σ相同的情況下,修正的高斯核函數(shù)具有較大的峰度,距離較近的點(diǎn)對(duì)核函數(shù)影響較大,隨著距離增加,該核函數(shù)值會(huì)迅速衰減,但不會(huì)趨于無(wú)窮小,該核函數(shù)兼顧較強(qiáng)的泛化能力和學(xué)習(xí)能力。從圖3可知,相比于原始高斯核函數(shù),修正的高斯核函數(shù)樣本點(diǎn)在離測(cè)試點(diǎn)較近的區(qū)域,函數(shù)值衰減較快,在離測(cè)試點(diǎn)較遠(yuǎn)的區(qū)域,修正的高斯核函數(shù)的函數(shù)值衰減速度相比于原始的高斯核函數(shù)要慢很多。通過(guò)調(diào)整修正后的高斯核函數(shù)的參數(shù)γ,可以靈活控制函數(shù)值的衰減速度。修正后的高斯核函數(shù)能夠在一定程度上彌補(bǔ)原始高斯核函數(shù)值在無(wú)限遠(yuǎn)處趨于無(wú)窮小的不足。因此,修正后的高斯核函數(shù)同時(shí)具備了較強(qiáng)的泛化能力和學(xué)習(xí)能力。圖3修正后的高斯核函數(shù)(二)改進(jìn)的半監(jiān)督K-means核聚類(lèi)改進(jìn)的半監(jiān)督K-means核聚類(lèi)將修正后的高斯核函數(shù)用于樣本之間相似度的測(cè)量,使得半監(jiān)督K-means聚類(lèi)方法在處理線性不可分樣本時(shí)具有較好的效果。本文基于帶引力參數(shù)的半監(jiān)督K-means聚類(lèi)算法,通過(guò)引入修正后的高斯核函數(shù)算法,使得新的模型在處理模型局部最優(yōu)、樣本分布為非球狀簇及樣本線性不可分等問(wèn)題上具有較好的效果。改進(jìn)半監(jiān)督K-means核聚類(lèi)算法主要基于以下兩個(gè)方面考慮:第一,在引力影響因子計(jì)算過(guò)程中引入核函數(shù)。引力影響因子算法通過(guò)引入核函數(shù),使得已標(biāo)
【相似文獻(xiàn)】
相關(guān)期刊論文 前1條
1 ;技術(shù)指標(biāo)選股[J];股市動(dòng)態(tài)分析;2014年20期
相關(guān)碩士學(xué)位論文 前8條
1 司曉彤;基于回歸法的多因子選股模型的投資組合分析[D];青島大學(xué);2017年
2 王慧琳;醫(yī)藥主題私募基金選股策略及其產(chǎn)品設(shè)計(jì)[D];南京大學(xué);2017年
3 李璐;基于數(shù)據(jù)挖掘的量化選股策略的研究[D];天津商業(yè)大學(xué);2017年
4 李想;基于XGBoost算法的多因子量化選股方案策劃[D];上海師范大學(xué);2017年
5 鄧尚洲;基于長(zhǎng)期投資的A股選股方法研究[D];南昌大學(xué);2017年
6 蘭強(qiáng)太;基于主成分分析和BP神經(jīng)網(wǎng)絡(luò)算法的綜合選股實(shí)證研究[D];暨南大學(xué);2017年
7 汪涌;多因子量化投資風(fēng)險(xiǎn)分散策略研究[D];重慶郵電大學(xué);2017年
8 馬晴雪;基于公告分類(lèi)校準(zhǔn)的多指標(biāo)SVM創(chuàng)業(yè)板選股方案設(shè)計(jì)[D];上海師范大學(xué);2017年
本文編號(hào):2696522
本文鏈接:http://sikaile.net/jingjilunwen/jinrongzhengquanlunwen/2696522.html
最近更新
教材專(zhuān)著