移動時間勢能聚類算法的研究與應用
發(fā)布時間:2021-03-24 17:04
2016年Yonggang Lu等人提出了一種移動時間層次聚類算法TTHC(Travel-Time based Hierarchical Clustering)。TTHC算法根據(jù)對數(shù)據(jù)點勢能的分析,采用全新的以移動時間為基礎(chǔ)的相似性度量,能夠獲得更佳的聚類效果和聚類精度。但是TTHC算法也有著一些問題:TTHC算法得事先人工設(shè)置類簇個數(shù),并且TTHC算法在給數(shù)據(jù)點分配類別的時候只根據(jù)數(shù)據(jù)點與數(shù)據(jù)點的相似度,TTHC算法沒有考慮到數(shù)據(jù)點的勢能和數(shù)據(jù)點到其父節(jié)點的距離的影響;TTHC算法不能對數(shù)據(jù)集里的噪聲數(shù)據(jù)作出識別,噪聲數(shù)據(jù)容易干擾聚類結(jié)果,以上問題限制了TTHC算法的應用。本文改進了TTHC算法的以上問題,然后把改進之后的ACTT算法和APCTT算法運用到微博文本聚類里。本文詳細內(nèi)容主要有如下幾方面:(1)針對TTHC算法人工設(shè)置類簇中心個數(shù)且在給數(shù)據(jù)點分配類別的時候產(chǎn)生問題,提出了一種自動確定聚類中心的移動時間勢能聚類算法(ACTT:Automatically Clustering based on Travel-Time)。ACTT算法先是計算數(shù)據(jù)點的勢能和數(shù)據(jù)點之間的相似度,然...
【文章來源】:江南大學江蘇省 211工程院校 教育部直屬院校
【文章頁數(shù)】:65 頁
【學位級別】:碩士
【部分圖文】:
勢能分布示例
表示互動的微博轉(zhuǎn)發(fā)微博的時候,之前的轉(zhuǎn)發(fā)過的用戶的微博ID以及//@標識符都會出現(xiàn)一遍
圖 5-2 表示互動的微博轉(zhuǎn)發(fā)微博的時候,之前的轉(zhuǎn)發(fā)過的用戶的微博 ID 以及//@標識符都會出現(xiàn)一遍。這容對于微博本身內(nèi)容的表達也不具實際意義,因此應該刪去這些內(nèi)容。如圖 5-3 所微博。
【參考文獻】:
期刊論文
[1]基于Chameleon聚類分析的多錯誤定位方法[J]. 曹鶴玲,姜淑娟. 電子學報. 2017(02)
[2]基于開放網(wǎng)絡知識的信息檢索與數(shù)據(jù)挖掘[J]. 王元卓,賈巖濤,劉大偉,靳小龍,程學旗. 計算機研究與發(fā)展. 2015(02)
[3]蛋白質(zhì)相互作用網(wǎng)絡的蜂群信息流聚類模型與算法[J]. 雷秀娟,田建芳. 計算機學報. 2012(01)
[4]基于改進CURE聚類算法的無監(jiān)督異常檢測方法[J]. 周亞建,徐晨,李繼國. 通信學報. 2010(07)
[5]基于權(quán)重的Jaccard相似度度量的實體識別方法[J]. 潘磊,雷鈺麗,王崇駿,謝俊元. 北京交通大學學報. 2009(06)
[6]幾個多面體網(wǎng)格剖分問題的NP難度證明[J]. 田延軍,鄧俊輝. 軟件學報. 2008(04)
[7]面向海量數(shù)據(jù)的數(shù)據(jù)一致性研究[J]. 周婧,王意潔,阮煒,李思昆. 計算機科學. 2006(04)
[8]面向信息檢索的自適應中文分詞系統(tǒng)[J]. 曹勇剛,曹羽中,金茂忠,劉超. 軟件學報. 2006(03)
[9]中文停用詞表的自動選取[J]. 顧益軍,樊孝忠,王建華,汪濤,黃維金. 北京理工大學學報. 2005(04)
[10]基于社會網(wǎng)絡分析的產(chǎn)業(yè)集群建模及實證檢驗[J]. 王霄寧. 系統(tǒng)工程. 2005(03)
博士論文
[1]聚類分析中的相似性度量及其應用研究[D]. 白雪.北京交通大學 2012
[2]基因表達數(shù)據(jù)聚類分析算法研究和應用[D]. 楊春梅.天津大學 2006
碩士論文
[1]基于蛋白質(zhì)相互作用網(wǎng)絡及聚類算法的蛋白質(zhì)功能預測方法研究[D]. 蔡娟.中南大學 2012
[2]聚類分析算法CLIQUE的改進及應用[D]. 陳朝華.中南大學 2009
本文編號:3098068
【文章來源】:江南大學江蘇省 211工程院校 教育部直屬院校
【文章頁數(shù)】:65 頁
【學位級別】:碩士
【部分圖文】:
勢能分布示例
表示互動的微博轉(zhuǎn)發(fā)微博的時候,之前的轉(zhuǎn)發(fā)過的用戶的微博ID以及//@標識符都會出現(xiàn)一遍
圖 5-2 表示互動的微博轉(zhuǎn)發(fā)微博的時候,之前的轉(zhuǎn)發(fā)過的用戶的微博 ID 以及//@標識符都會出現(xiàn)一遍。這容對于微博本身內(nèi)容的表達也不具實際意義,因此應該刪去這些內(nèi)容。如圖 5-3 所微博。
【參考文獻】:
期刊論文
[1]基于Chameleon聚類分析的多錯誤定位方法[J]. 曹鶴玲,姜淑娟. 電子學報. 2017(02)
[2]基于開放網(wǎng)絡知識的信息檢索與數(shù)據(jù)挖掘[J]. 王元卓,賈巖濤,劉大偉,靳小龍,程學旗. 計算機研究與發(fā)展. 2015(02)
[3]蛋白質(zhì)相互作用網(wǎng)絡的蜂群信息流聚類模型與算法[J]. 雷秀娟,田建芳. 計算機學報. 2012(01)
[4]基于改進CURE聚類算法的無監(jiān)督異常檢測方法[J]. 周亞建,徐晨,李繼國. 通信學報. 2010(07)
[5]基于權(quán)重的Jaccard相似度度量的實體識別方法[J]. 潘磊,雷鈺麗,王崇駿,謝俊元. 北京交通大學學報. 2009(06)
[6]幾個多面體網(wǎng)格剖分問題的NP難度證明[J]. 田延軍,鄧俊輝. 軟件學報. 2008(04)
[7]面向海量數(shù)據(jù)的數(shù)據(jù)一致性研究[J]. 周婧,王意潔,阮煒,李思昆. 計算機科學. 2006(04)
[8]面向信息檢索的自適應中文分詞系統(tǒng)[J]. 曹勇剛,曹羽中,金茂忠,劉超. 軟件學報. 2006(03)
[9]中文停用詞表的自動選取[J]. 顧益軍,樊孝忠,王建華,汪濤,黃維金. 北京理工大學學報. 2005(04)
[10]基于社會網(wǎng)絡分析的產(chǎn)業(yè)集群建模及實證檢驗[J]. 王霄寧. 系統(tǒng)工程. 2005(03)
博士論文
[1]聚類分析中的相似性度量及其應用研究[D]. 白雪.北京交通大學 2012
[2]基因表達數(shù)據(jù)聚類分析算法研究和應用[D]. 楊春梅.天津大學 2006
碩士論文
[1]基于蛋白質(zhì)相互作用網(wǎng)絡及聚類算法的蛋白質(zhì)功能預測方法研究[D]. 蔡娟.中南大學 2012
[2]聚類分析算法CLIQUE的改進及應用[D]. 陳朝華.中南大學 2009
本文編號:3098068
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3098068.html
最近更新
教材專著