挖掘用戶標(biāo)簽的增強(qiáng)型社區(qū)網(wǎng)頁(yè)聚類算法
本文選題:社區(qū)網(wǎng)頁(yè) + 鏈接關(guān)系; 參考:《微電子學(xué)與計(jì)算機(jī)》2013年02期
【摘要】:網(wǎng)頁(yè)的內(nèi)容信息對(duì)于提高聚類質(zhì)量來說并不完全夠用,針對(duì)網(wǎng)絡(luò)社區(qū)網(wǎng)頁(yè)之間存在的天然鏈接關(guān)系,本文提出了一種挖掘用戶標(biāo)簽的增強(qiáng)型社區(qū)網(wǎng)頁(yè)聚類算法.本文采用多種距離度量方法,并挖掘網(wǎng)頁(yè)鏈接關(guān)系,然后將網(wǎng)頁(yè)的內(nèi)容信息相似度和鏈接關(guān)系結(jié)合起來進(jìn)行聚類.實(shí)驗(yàn)表明,提出的算法是有效的.
[Abstract]:The content information of web pages is not sufficient to improve the clustering quality. In view of the natural link relationship between web pages, this paper proposes an enhanced community page clustering algorithm to mine user tags. In this paper, a variety of distance measures are adopted, and web page link relationships are mined, and then the content information similarity and link relationship of web pages are combined to cluster. Experiments show that the proposed algorithm is effective.
【作者單位】: 廣東輕工職業(yè)技術(shù)學(xué)院計(jì)算機(jī)系;廣東工業(yè)大學(xué)自動(dòng)化學(xué)院;
【基金】:國(guó)家自然科學(xué)基金項(xiàng)目(61074147)
【分類號(hào)】:TP393.092
【參考文獻(xiàn)】
相關(guān)期刊論文 前1條
1 李睿;曾俊t@;周四望;;基于局部標(biāo)簽樹匹配的改進(jìn)網(wǎng)頁(yè)聚類算法[J];計(jì)算機(jī)應(yīng)用;2010年03期
【共引文獻(xiàn)】
相關(guān)期刊論文 前2條
1 翟獻(xiàn)民;田生偉;禹龍;馮冠軍;;面向維吾爾語(yǔ)文本的改進(jìn)后綴樹聚類[J];計(jì)算機(jī)應(yīng)用;2012年04期
2 廖浩偉;楊燕;賈真;尹紅風(fēng);;一種改進(jìn)的基于樹路徑匹配的網(wǎng)頁(yè)結(jié)構(gòu)相似度算法[J];吉林大學(xué)學(xué)報(bào)(理學(xué)版);2012年06期
相關(guān)碩士學(xué)位論文 前1條
1 王星;新聞網(wǎng)頁(yè)抽取技術(shù)的研究與實(shí)現(xiàn)[D];河北工業(yè)大學(xué);2011年
【二級(jí)參考文獻(xiàn)】
相關(guān)期刊論文 前2條
1 肖建鵬;張來順;任星;;直推式支持向量機(jī)在Web信息抽取中的應(yīng)用研究[J];計(jì)算機(jī)工程與應(yīng)用;2009年02期
2 支宗良;陳少飛;;一種基于XQuery的優(yōu)化Web信息抽取方法[J];計(jì)算機(jī)應(yīng)用;2008年01期
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 丁國(guó)棟,王斌,白碩;Web超鏈挖掘:中國(guó)境內(nèi)Web圖結(jié)構(gòu)研究[J];計(jì)算機(jī)工程;2005年14期
2 張敏;;信息抽取技術(shù)在網(wǎng)頁(yè)中的應(yīng)用[J];中國(guó)城市經(jīng)濟(jì);2011年20期
3 李s,
本文編號(hào):1933590
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/1933590.html