天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

k均值聚類優(yōu)化及其在基金投資中的應(yīng)用

發(fā)布時(shí)間:2024-03-13 05:19
  隨著大數(shù)據(jù)的發(fā)展,數(shù)據(jù)分析、數(shù)據(jù)挖掘等創(chuàng)新技術(shù)已經(jīng)在眾多學(xué)科領(lǐng)域中得到了廣泛運(yùn)用。聚類分析是我們?cè)趯?shí)踐中運(yùn)用非常多的一種無(wú)監(jiān)督數(shù)據(jù)挖掘類算法。而k均值聚類算法是日常中使用頻率最多的聚類型算法,但是k均值聚類算法也同樣有其缺點(diǎn):首先算法很可能陷入局部最優(yōu),難以實(shí)現(xiàn)想要的聚類效果,初始聚類中心的選取肯定會(huì)影響到聚類的最終結(jié)果,不一樣的初始中心肯定會(huì)是不一樣的呈現(xiàn),可能達(dá)不到理想的聚類結(jié)果;其次k值的選取很難確定,k均值聚類需要我們提前決定最終的聚類個(gè)數(shù),聚類數(shù)值不同必然造成的聚類結(jié)果也會(huì)不同。本文對(duì)k均值聚類的研究探討主要是兩方面:一是如何確定聚類的數(shù)目;二是如何選擇初始聚類中心。針對(duì)k值本文總結(jié)運(yùn)用了手肘法、Mclust、PAM、Nbclust等四種方法來(lái)確定k值,綜合四種方法結(jié)合實(shí)際問(wèn)題情況分析結(jié)果,最終能很好地得出k值,消除了很多主觀因素;針對(duì)初始聚類中心的選擇,本文提出將k-means++算法中采用隨機(jī)原則選第一個(gè)初始聚類中心這一步改為第一個(gè)初始聚類中心確定性選取為離全局中心最遠(yuǎn)的點(diǎn)。而剩下k-1個(gè)按距離越遠(yuǎn)越好的原則選取。即先得到所有數(shù)據(jù)點(diǎn)與最近聚類中心的距離D(x)(也就是算出...

【文章頁(yè)數(shù)】:46 頁(yè)

【學(xué)位級(jí)別】:碩士

【文章目錄】:
摘要
Abstract
1 緒言
    1.1 研究背景及意義
    1.2 國(guó)內(nèi)外研究現(xiàn)狀
    1.3 本文主要研究?jī)?nèi)容
    1.4 論文組織結(jié)構(gòu)
2 理論準(zhǔn)備
    2.1 k均值聚類算法
    2.2 k-means++算法
    2.3 k值確定法
    2.4 本章小結(jié)
3 改進(jìn)算法
    3.1 改進(jìn)算法思路
    3.2 本章小結(jié)
4 實(shí)驗(yàn)研究
    4.1 指標(biāo)篩選與數(shù)據(jù)預(yù)處理
    4.2 確定k值
    4.3 算法實(shí)現(xiàn)及評(píng)估
    4.4 本章小結(jié)
5 收益回測(cè)
6 基金投資擴(kuò)展
7 總結(jié)與展望
    7.1 總結(jié)
    7.2 展望
致謝
參考文獻(xiàn)
附錄



本文編號(hào):3927249

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/jingjilunwen/hongguanjingjilunwen/3927249.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶31cc8***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com