天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

改進(jìn)的K-means算法研究與實現(xiàn)

發(fā)布時間:2021-01-14 13:42
  初始中心和相似性度量方法的選擇都會影響K-means算法精準(zhǔn)程度,論文研究的目的是引入新的相似性度量方法和初始中心參數(shù)選擇技術(shù),從而提高算法的準(zhǔn)確度。論文研究內(nèi)容及方法如下:首先,論文引入密度極小值理論,基于密度參數(shù)的基礎(chǔ)上,利用歐氏距離計算數(shù)據(jù)集的密度參數(shù),獲取所有的密度參數(shù)之后,獲取K個中心,如果數(shù)據(jù)對象A到K個中心具有相同的距離,此時排序簇中數(shù)據(jù)對象到A的密度距離,選擇最小的密度距離并將A歸至對應(yīng)的類中,這就可以使數(shù)據(jù)對象與鄰近的數(shù)據(jù)對象變得更加緊湊,表明數(shù)據(jù)對象與鄰近對象密度更高,能夠更加準(zhǔn)確的反映數(shù)據(jù)集內(nèi)部的分布式結(jié)構(gòu)關(guān)系。其次,論文引入互信息作為相似性度量方法,可以利用互信息評估數(shù)據(jù)對象之間互相包含的程度,適用于模糊度較高的文檔數(shù)據(jù)以及上下文信息包含量較大的應(yīng)用場景,比如在文本聚類中,如果兩篇文章同屬于一個簇,這兩片文檔的特征詞含量一般重疊的較多,因此可以更加準(zhǔn)確的發(fā)現(xiàn)數(shù)據(jù)集潛在的結(jié)構(gòu)。論文實驗結(jié)果表明,引入密度極小值設(shè)置初始中心,可以提高K-means算法的準(zhǔn)確度;利用互信息改進(jìn)K-means算法的相似性度量,改進(jìn)后的K-means算法能夠較準(zhǔn)確描述數(shù)據(jù)對象之間的關(guān)系,反... 

【文章來源】:安徽大學(xué)安徽省 211工程院校

【文章頁數(shù)】:57 頁

【學(xué)位級別】:碩士

【部分圖文】:

改進(jìn)的K-means算法研究與實現(xiàn)


密度相連數(shù)據(jù)劃分簇結(jié)果

均值算法,目標(biāo)函數(shù),公式,原理


值算法在執(zhí)行過程中,將數(shù)據(jù)集X劃分到簇r中的同時,保持F的信息最大化,??這樣就可以更好地將擁有最多互信息的文檔劃分到一個簇,基于互信息的K均??值算法執(zhí)行思路如圖5.1所示。??P(XJ)? ̄?1{XJ)??\?P(j\x、P〇-\T)?\?I??P(T)??\airiQ'-,X)?MAX?I(T-,Y)??圖5.1基于互信息的K均值算法原理??基于互信息的K均值算法目標(biāo)函數(shù)可以如公式(5.1)所示。??F\p(t?I?x)]?=?I{X-?Y)?+?1{X-T)-MT;Y)?(5.?〇??其中,符號P是一個拉格朗日乘法算子,其可以有效的實現(xiàn)壓縮文本數(shù)據(jù)集??I的信息和保有相關(guān)特征單詞變量y的一個關(guān)鍵平臺,對于一個網(wǎng)站來講,文本??數(shù)據(jù)集和征單詞變量r評價之間的互信息/(x;?是一個常數(shù),同時??36??

【參考文獻(xiàn)】:
期刊論文
[1]基于內(nèi)聚度和耦合度的二分K均值方法[J]. 郁湧,康慶怡,陳長賡,闞世林,駱永軍.  計算機(jī)科學(xué). 2018(S1)
[2]κ-均值算法的初始化方法綜述[J]. 徐大川,許宜誠,張冬梅.  運籌學(xué)學(xué)報. 2018(02)
[3]基于余弦距離選取初始簇中心的文本聚類研究[J]. 王彬宇,劉文芬,胡學(xué)先,魏江宏.  計算機(jī)工程與應(yīng)用. 2018(10)
[4]基于先驗知識MinMax k-Means聚類算法的道路裂縫研究[J]. 郭立媛,張磊,李威,韓旭.  中國測試. 2018(04)
[5]基于改進(jìn)k均值與高斯混合模型的宮頸圖像分割[J]. 劉君,余婷婷,石慧娟.  中國生物醫(yī)學(xué)工程學(xué)報. 2018(02)
[6]基于改進(jìn)HOG特征提取的車型識別算法[J]. 耿慶田,趙浩宇,于繁華,王宇婷,趙宏偉.  中國光學(xué). 2018(02)
[7]一種基于信息論模型的入侵檢測特征提取方法[J]. 宋勇,蔡志平.  電子科技大學(xué)學(xué)報. 2018(02)
[8]改進(jìn)K-means算法優(yōu)化RBF神經(jīng)網(wǎng)絡(luò)的出水氨氮預(yù)測[J]. 喬俊飛,孫玉慶,韓紅桂.  控制工程. 2018(03)
[9]基于kmeans聚類與BP神經(jīng)網(wǎng)絡(luò)算法的辦公建筑逐時電負(fù)荷預(yù)測[J]. 劉倩穎,阮應(yīng)君,時翔,李錚偉.  熱能動力工程. 2018(03)
[10]基于AP布置優(yōu)化和K-means聚類算法的室內(nèi)定位研究[J]. 陳云飛,杜太行,江春冬,王景玉,李娟妹.  電子技術(shù)應(yīng)用. 2018(03)

碩士論文
[1]K-means算法的改進(jìn)及其在文本聚類中的應(yīng)用研究[D]. 李敏.江南大學(xué) 2018



本文編號:2976960

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/2976960.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶774f5***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
国产午夜免费在线视频| 精品一区二区三区人妻视频| 色婷婷中文字幕在线视频| 91精品视频全国免费| 国产内射在线激情一区| 午夜传媒视频免费在线观看| 亚洲精品成人福利在线| 国产成人精品午夜福利av免费| 国产永久免费高清在线精品| 尤物久久91欧美人禽亚洲| 中文字幕一区二区三区中文| 亚洲最新av在线观看| 女人精品内射国产99| 韩日黄片在线免费观看| 国产三级黄片在线免费看| 大香蕉再在线大香蕉再在线| 久热这里只有精品九九| 粗暴蹂躏中文一区二区三区| 三级高清有码在线观看| 日韩一区二区三区四区乱码视频| 四季av一区二区播放| 欧美日韩国产自拍亚洲| 亚洲精品福利视频你懂的| 国产丝袜女优一区二区三区| 丝袜诱惑一区二区三区| 视频在线观看色一区二区| 日本和亚洲的香蕉视频| 一区二区三区亚洲天堂| 欧美成人黄色一区二区三区| 日本办公室三级在线观看| 大胆裸体写真一区二区| 少妇肥臀一区二区三区| 色婷婷成人精品综合一区| 久热青青草视频在线观看| 91人妻人人揉人人澡人| 中文字幕日韩无套内射| 国产亚洲欧美一区二区| 亚洲国产欧美精品久久| 熟女中文字幕一区二区三区| 国产日韩欧美在线亚洲| 日韩免费午夜福利视频|