融合SOM和改進(jìn)PSO的Web文檔集成聚類算法
發(fā)布時間:2018-02-13 20:49
本文關(guān)鍵詞: Web文檔聚類 自組織特征映射 粗聚類 改進(jìn)PSO算法 細(xì)聚類 集成聚類算法 出處:《計算機(jī)工程與應(yīng)用》2010年34期 論文類型:期刊論文
【摘要】:隨著信息的爆炸式增長,現(xiàn)有的搜索引擎在很多方面不能滿足人們的需要。Web文檔聚類可以減小搜索空間,加快檢索速度,提高查詢精度。提出了一種融合SOM(Self-Organizing Maps)粗聚類和改進(jìn)PSO(Particle Swarm Optimization)細(xì)聚類的Web文檔集成聚類算法。首先根據(jù)向量空間模型表示法,用特征詞條及其權(quán)值表示W(wǎng)eb文檔信息,其次用SOM算法對文檔特征集進(jìn)行粗聚類,得到一組輸出權(quán)值,然后用這組權(quán)值初始化改進(jìn)的PSO算法,用改進(jìn)PSO算法對此聚類結(jié)果進(jìn)行細(xì)化,最終實現(xiàn)Web文檔聚類。仿真結(jié)果表明,該算法能有效提高文檔查詢的查準(zhǔn)率和查全率,具有一定的實用價值。
[Abstract]:With the explosive growth of information, the existing search engines can not meet the needs of people in many ways. Web document clustering can reduce the search space and speed up the search. In order to improve the query precision, this paper presents an algorithm for integrating SOM(Self-Organizing maps rough clustering and improving PSO(Particle Swarm optimization clustering. Firstly, according to vector space model representation, Web document information is represented by feature terms and their weights. Secondly, a set of output weights is obtained by coarse clustering of document feature sets using SOM algorithm, and then the improved PSO algorithm is initialized with this set of weights. The improved PSO algorithm is used to refine the clustering results. Finally, the Web document clustering is realized. The simulation results show that the algorithm can effectively improve the precision and recall of document query, and has certain practical value.
【作者單位】: 湖南科技職業(yè)學(xué)院電子信息系;中南大學(xué)信息科學(xué)與工程學(xué)院;
【分類號】:TP391.1
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 趙闖;趙擁軍;李冬海;;TOA折疊平面特征點無監(jiān)督聚類[J];現(xiàn)代雷達(dá);2010年01期
2 賀玲;蔡益朝;楊征;;高維數(shù)據(jù)聚類方法綜述[J];計算機(jī)應(yīng)用研究;2010年01期
3 雷勇濤;楊兆建;;神經(jīng)網(wǎng)絡(luò)在提升機(jī)故障診斷中的應(yīng)用[J];華南理工大學(xué)學(xué)報(自然科學(xué)版);2010年02期
4 秦然;;基于神經(jīng)網(wǎng)絡(luò)的CT腦血管圖像邊緣檢測算法[J];電子測量與儀器學(xué)報;2010年04期
5 片坤;徐曉鐘;張益銘;;一種改進(jìn)的組合SOFM-SVR股票價格預(yù)測模型[J];計算機(jī)應(yīng)用與軟件;2010年05期
6 鄭若金;韓力群;陳天華;;基于小波分析和神經(jīng)網(wǎng)絡(luò)的心音信號研究[J];計算機(jī)仿真;2010年05期
7 呂,
本文編號:1509071
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1509071.html
最近更新
教材專著