一種基于黑洞算法的模糊C均值文本聚類方法
本文選題:模糊C均值 切入點(diǎn):黑洞算法 出處:《東北大學(xué)學(xué)報(bào)(自然科學(xué)版)》2017年08期 論文類型:期刊論文
【摘要】:FCM算法應(yīng)用于文本聚類時,由于初始聚類中心點(diǎn)選擇的隨機(jī)性,以及容易陷入局部最優(yōu)的問題,導(dǎo)致文本聚類效果較差.為了提高FCM算法的聚類精度,提出了采用黑洞算法尋找FCM最優(yōu)初始聚類中心的方法.黑洞算法是一種啟發(fā)式優(yōu)化方法,在FCM初始聚類中心尋優(yōu)的過程中,始終保持黑洞為全局最優(yōu)解,最終發(fā)現(xiàn)FCM的最優(yōu)初始聚類中心.實(shí)驗(yàn)結(jié)果表明,基于黑洞算法的FCM文本聚類方法可以解決FCM算法對初始中心點(diǎn)敏感和容易陷入局部最優(yōu)的問題,聚類精度明顯提高.
[Abstract]:When the FCM algorithm is applied to text clustering, because of the randomness of initial clustering center selection and the problem that it is easy to fall into local optimum, the text clustering effect is poor. In order to improve the clustering accuracy of FCM algorithm, The black hole algorithm is proposed to find the FCM optimal initial clustering center. The black hole algorithm is a heuristic optimization method. In the process of FCM initial clustering center optimization, the black hole is always kept as the global optimal solution. Finally, the optimal initial clustering center of FCM is found. The experimental results show that the FCM text clustering method based on black hole algorithm can solve the problem that the FCM algorithm is sensitive to the initial center point and is prone to fall into local optimum, and the clustering accuracy is obviously improved.
【作者單位】: 東北大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院;東網(wǎng)科技有限公司;
【基金】:國家高技術(shù)研究發(fā)展計(jì)劃項(xiàng)目(2015AA016005)
【分類號】:TP391.1
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 林春燕,朱東華;一種快速的文本聚類-分類法[J];計(jì)算機(jī)工程與科學(xué);2004年07期
2 趙亞琴;周獻(xiàn)中;;一種基于小生境遺傳算法的中文文本聚類新方法[J];計(jì)算機(jī)工程;2006年06期
3 劉務(wù)華;羅鐵堅(jiān);王文杰;;文本聚類技術(shù)的有效性驗(yàn)證[J];計(jì)算機(jī)工程;2007年01期
4 丁X;許侃;;基于文本聚類方法的我國科技管理研究領(lǐng)域的計(jì)量研究[J];科學(xué)學(xué)研究;2007年S1期
5 孫愛香;楊鑫華;;關(guān)于文本聚類有效性評價(jià)的研究[J];山東理工大學(xué)學(xué)報(bào)(自然科學(xué)版);2007年05期
6 丘志宏;宮雷光;;利用上下文提高文本聚類的效果[J];中文信息學(xué)報(bào);2007年06期
7 吳啟明;易云飛;;文本聚類綜述[J];河池學(xué)院學(xué)報(bào);2008年02期
8 李江華;楊書新;劉利峰;;基于概念格的文本聚類[J];計(jì)算機(jī)應(yīng)用;2008年09期
9 趙文鵬;;淺談文本聚類研究[J];企業(yè)家天地下半月刊(理論版);2009年02期
10 章成志;;文本聚類結(jié)果描述研究綜述[J];現(xiàn)代圖書情報(bào)技術(shù);2009年02期
相關(guān)會議論文 前10條
1 趙世奇;劉挺;李生;;一種基于主題的文本聚類方法[A];第三屆學(xué)生計(jì)算語言學(xué)研討會論文集[C];2006年
2 王洪俊;俞士汶;蘇祺;施水才;肖詩斌;;中文文本聚類的特征單元比較[A];第二屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議(NCIRCS-2005)論文集[C];2005年
3 胡吉祥;許洪波;劉悅;王斌;程學(xué)旗;;基于重復(fù)串的短文本聚類研究[A];全國第八屆計(jì)算語言學(xué)聯(lián)合學(xué)術(shù)會議(JSCL-2005)論文集[C];2005年
4 白剛;張錚;丁宗堯;朱毅;;中文文本聚類在互聯(lián)網(wǎng)搜索的研究與應(yīng)用[A];第三屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集[C];2007年
5 張猛;王大玲;于戈;;一種基于自動閾值發(fā)現(xiàn)的文本聚類方法[A];第二十一屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報(bào)告篇)[C];2004年
6 王樂;田李;賈焰;韓偉紅;;一個并行的文本聚類混合算法[A];第二十四屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報(bào)告篇)[C];2007年
7 章成志;;基于多語文本聚類的主題層次體系生成研究1)[A];國家自然科學(xué)基金委員會管理科學(xué)部宏觀管理與政策學(xué)科青年基金獲得者交流研討會論文集[C];2010年
8 邱立坤;程葳;龍志yN;孫嬌華;;面向BBS的話題挖掘初探[A];全國第八屆計(jì)算語言學(xué)聯(lián)合學(xué)術(shù)會議(JSCL-2005)論文集[C];2005年
9 羅娜;左萬利;袁福宇;張靖波;張慧杰;;使用本體語義提高文本聚類(英文)[A];全國語域web與本體能研討會論文集[C];2006年
10 孫承杰;朱文煥;林磊;劉遠(yuǎn)超;;BBS短文本聚類技術(shù)研究[A];第五屆全國信息檢索學(xué)術(shù)會議論文集[C];2009年
相關(guān)博士學(xué)位論文 前3條
1 徐森;文本聚類集成關(guān)鍵技術(shù)研究[D];哈爾濱工程大學(xué);2010年
2 高茂庭;文本聚類分析若干問題研究[D];天津大學(xué);2007年
3 孟憲軍;互聯(lián)網(wǎng)文本聚類與檢索技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2009年
相關(guān)碩士學(xué)位論文 前10條
1 康健;基于Multi-agent和群體智能的藏文網(wǎng)絡(luò)輿情管理研究[D];西南交通大學(xué);2015年
2 張培偉;基于改進(jìn)Single-Pass算法的熱點(diǎn)話題發(fā)現(xiàn)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];華中師范大學(xué);2015年
3 郭士串;結(jié)合權(quán)重因子與特征向量的文本聚類研究與應(yīng)用[D];江西理工大學(xué);2015年
4 邵明來;中文文本聚類關(guān)鍵技術(shù)研究[D];廣西大學(xué);2015年
5 王恒靜;基于詞類和搭配的微博輿情文本聚類方法研究[D];江蘇科技大學(xué);2015年
6 吳潔潔;基于RI方法的文本聚類研究[D];南昌大學(xué);2015年
7 樊兆欣;個性化新聞推薦系統(tǒng)關(guān)鍵技術(shù)研究與實(shí)現(xiàn)[D];北京理工大學(xué);2015年
8 蘇圣瞳;微博熱點(diǎn)話題發(fā)現(xiàn)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];復(fù)旦大學(xué);2014年
9 孫東普;融合屬性抽取的多粒度專利文本聚類研究[D];大連理工大學(xué);2015年
10 李蕓;基于爬蟲和文本聚類分析的網(wǎng)絡(luò)輿情分析系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2014年
,本文編號:1573712
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1573712.html