基于密度和蟻群的混合聚類算法研究及應(yīng)用
【文章頁數(shù)】:74 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖2-1數(shù)據(jù)聚類需要理解的是聚類分析不同于有監(jiān)督學(xué)習(xí),是一種無監(jiān)督學(xué)習(xí)方法
第二章相關(guān)理論基礎(chǔ)與技術(shù)本章概括性的對(duì)聚類分析、聚類相關(guān)算法的分類進(jìn)行了概括性的陳述,同時(shí)描繪了相似性度量、文本預(yù)處理以及文本表示模型相關(guān)理論技術(shù)。2.1聚類分析2.1.1聚類分析的基本概念數(shù)據(jù)分析是許多計(jì)算機(jī)應(yīng)用的基礎(chǔ),無論是在設(shè)計(jì)階段還是在線操作部分。數(shù)據(jù)分析技術(shù)可以分....
圖2-2層次聚類算法示例圖
圖2-2層次聚類算法示例圖.3基于密度的聚類算法在數(shù)據(jù)庫(kù)中,并不是所有數(shù)據(jù)都是球形簇,因此如何聚類任意的非球形簇研究重點(diǎn)。對(duì)于此問題,從密度角度作出思考形成了新的聚類方法——基聚類算法,該方法屬于分區(qū)聚類方法,其中涉及兩個(gè)區(qū)域的識(shí)別——低密高密度區(qū)域。該方法的重點(diǎn)在于如何....
圖2-3決策圖實(shí)例及示意圖
圖2-3決策圖實(shí)例及示意圖容易發(fā)現(xiàn),圖2-3(A)中的數(shù)據(jù)集包含了兩個(gè)群集和三個(gè)離群點(diǎn)26、27、28,再看圖2-3(B),1號(hào)和10號(hào)數(shù)據(jù)點(diǎn)同時(shí)具有較大的ρ值和值,根據(jù)算法的定義即為兩個(gè)群集的類中心點(diǎn),三個(gè)離群點(diǎn)都具有值較高,ρ很小的特點(diǎn)。對(duì)于圖....
圖2-4LDA圖形模型
N是文檔d所在文檔集中總的文檔數(shù)量,(現(xiàn)的次數(shù),nk代表文檔集中包含單詞tk的文檔數(shù)量。由對(duì)于()和nk兩個(gè)值分別呈現(xiàn)正相關(guān)和負(fù)相關(guān)的關(guān)系多,且該詞條在其他文檔中出現(xiàn)少,其權(quán)值就越大,對(duì)區(qū)大。題模型種非常流行的生成概率主題模型,其中每個(gè)文檔都表示....
本文編號(hào):4024721
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/4024721.html