天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

非獨(dú)立同分布下K均值算法的改進(jìn)及在球員數(shù)據(jù)分析中的應(yīng)用研究

發(fā)布時(shí)間:2024-02-04 01:07
  互聯(lián)網(wǎng)時(shí)代的到來必將產(chǎn)生大量的數(shù)據(jù),數(shù)據(jù)挖掘則是從這些數(shù)據(jù)中用非平凡的方法來發(fā)現(xiàn)有價(jià)值的信息,聚類分析作為這些非平凡的方法之一,是數(shù)據(jù)挖掘中的一個(gè)重要研究領(lǐng)域。在聚類分析的相關(guān)算法中,K均值算法是其中的經(jīng)典算法之一,其簡單、高效,但也存在一些缺陷,例如隨機(jī)選取聚類中心點(diǎn)容易導(dǎo)致聚類結(jié)果不穩(wěn)定,并且會受到一些離群點(diǎn)的影響,使得聚類結(jié)果往往只是局部最優(yōu)。此外,傳統(tǒng)K均值算法及目前對其改進(jìn)的算法都是在獨(dú)立同分布下進(jìn)行的。然而真實(shí)世界的數(shù)據(jù)往往是非獨(dú)立同分布的(Non-Independent and Identically Distribution,簡寫Non-IID),即屬性值、屬性、對象之間或多或少都會存在一些耦合或交互關(guān)系。如果忽略了這類關(guān)系,可能會導(dǎo)致數(shù)據(jù)中的重要信息丟失,從而影響聚類分析的結(jié)果。因此本文在Non-IID概念下對K均值算法進(jìn)行改進(jìn),并將優(yōu)化后的算法應(yīng)用到NBA球員數(shù)據(jù)中。本文的主要工作如下:在理論研究方面,主要分為兩個(gè)部分。第一部分,針對K均值算法隨機(jī)選取初始聚類中心以及易受離群點(diǎn)影響而導(dǎo)致聚類不穩(wěn)定的缺陷,提出一種獨(dú)立同分布下優(yōu)化K均值算法(Optimized K-m...

【文章頁數(shù)】:71 頁

【學(xué)位級別】:碩士

【部分圖文】:

圖1.1NonIID-OPK算法思想框架

圖1.1NonIID-OPK算法思想框架

齊魯工業(yè)大學(xué)碩士學(xué)位論文5有NBA球員信息,其中包括球員個(gè)人資料信息(例如身高,體重,年齡,位置,年薪等)以及比賽數(shù)據(jù)信息(例如得分,籃板,助攻,蓋帽,搶斷,失誤,命中率等)。然后對所爬取的數(shù)據(jù)進(jìn)行預(yù)處理,清除其中噪聲和不一致的數(shù)據(jù),并根據(jù)分析任務(wù)選擇出其中較為關(guān)鍵的屬性因子。最....


圖2.1數(shù)據(jù)挖掘過程的大體步驟

圖2.1數(shù)據(jù)挖掘過程的大體步驟

第2章相關(guān)技術(shù)綜述8一個(gè)統(tǒng)一的數(shù)據(jù)倉庫中。第二步是數(shù)據(jù)的選擇與變換,主要是從數(shù)據(jù)倉庫中選擇并提取出與挖掘任務(wù)相關(guān)的數(shù)據(jù),并將這些數(shù)據(jù)通過處理轉(zhuǎn)換或統(tǒng)一成適合挖掘的形式。相關(guān)的數(shù)據(jù)變換方法有平滑、聚集、數(shù)據(jù)泛化、數(shù)據(jù)歸一化、屬性構(gòu)造等。第三步是進(jìn)行數(shù)據(jù)挖掘,主要是根據(jù)數(shù)據(jù)庫中的數(shù)據(jù)....


圖2.2聚類算法分類

圖2.2聚類算法分類

第2章相關(guān)技術(shù)綜述14基于網(wǎng)格的方法(grid-basedmethods):該方法多用來處理大數(shù)據(jù)集,其主要思想是將大數(shù)據(jù)集中的數(shù)據(jù)對象進(jìn)行劃分,分割成一個(gè)個(gè)單元格的形式,然后再組合成網(wǎng)格結(jié)構(gòu),之后的分析操作都在這個(gè)已經(jīng)構(gòu)建好的網(wǎng)格結(jié)構(gòu)上執(zhí)行。所以這類方法在處理大量復(fù)雜的數(shù)據(jù)時(shí),....


圖2.3Non-IID和IID距離計(jì)算

圖2.3Non-IID和IID距離計(jì)算

?選擇。因?yàn)楸疚闹饕槍?shù)值型數(shù)據(jù)進(jìn)行研究,所以選擇歐幾里得距離計(jì)算公式作為相似性度量公式,但是在相似性度量的計(jì)算上,Non-IID環(huán)境下和傳統(tǒng)獨(dú)立同分布環(huán)境下并不相同,其區(qū)別大體如圖2.3所示,如果想要計(jì)算中心點(diǎn)O到對象3之間的距離3,可以看出在傳統(tǒng)獨(dú)立同分布環(huán)境下,1、2、3....



本文編號:3894944

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3894944.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶4d577***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com
亚洲中文字幕乱码亚洲| 99久久精品免费精品国产| 国产午夜精品久久福利| 福利视频一区二区在线| 亚洲精品欧美精品一区三区| 国产又粗又猛又爽又黄| 99久久精品国产日本| 日本91在线观看视频| 国产情侣激情在线对白| 国产成人免费高潮激情电| 亚洲中文字幕在线视频频道| 日韩欧美一区二区黄色| 99久久人妻精品免费一区| 五月的丁香婷婷综合网| 久久国内午夜福利直播| 亚洲天堂一区在线播放| 色偷偷偷拍视频在线观看| 精品视频一区二区三区不卡| 加勒比东京热拍拍一区二区| 婷婷色香五月综合激激情| av在线免费观看在线免费观看| 国产精品欧美一级免费| 久久少妇诱惑免费视频| 大香蕉久草网一区二区三区| 欧美丰满大屁股一区二区三区| 午夜精品久久久99热连载| 大香蕉伊人精品在线观看| 黑色丝袜脚足国产一区二区| 国内精品美女福利av在线| 黄色在线免费高清观看| 在线观看视频日韩精品| 欧美国产日产综合精品| 我要看日本黄色小视频| 欧美日韩少妇精品专区性色| 国产精品一区二区视频成人| 国产亚洲不卡一区二区| 欧美极品欧美精品欧美| 欧洲一区二区三区自拍天堂| 日韩成人h视频在线观看| 日本久久中文字幕免费| 五月婷婷综合激情啪啪|