基于層次分析的微博短文本特征計(jì)算方法
發(fā)布時(shí)間:2017-08-23 06:02
本文關(guān)鍵詞:基于層次分析的微博短文本特征計(jì)算方法
更多相關(guān)文章: 層次分析 特征計(jì)算 文本聚類 短文本
【摘要】:為了建立用戶精準(zhǔn)興趣模型以有效發(fā)現(xiàn)具有相似興趣的用戶群,提出了一種針對微博的短文本特征計(jì)算方法用于聚類算法,提升聚類效果以更好地挖掘微博用戶的相似興趣集合。該方法融合了微博轉(zhuǎn)發(fā)數(shù)、評論數(shù)、點(diǎn)贊數(shù)等多個(gè)關(guān)鍵指標(biāo)來度量微博短文本特征的重要性。同時(shí),引入層次分析技術(shù),改進(jìn)了傳統(tǒng)的tf-idf特征計(jì)算方法,并利用經(jīng)典文本聚類算法進(jìn)行實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,改進(jìn)后的短文本特征計(jì)算方法與傳統(tǒng)的tf-idf特征計(jì)算方法相比,在類內(nèi)集中度和類間分散度上取得了更好的效果。
【作者單位】: 中國科學(xué)院信息工程研究所;國家計(jì)算機(jī)網(wǎng)絡(luò)應(yīng)急技術(shù)處理協(xié)調(diào)中心;中國科學(xué)院大學(xué);北京郵電大學(xué)信息與通信工程學(xué)院;
【關(guān)鍵詞】: 層次分析 特征計(jì)算 文本聚類 短文本
【基金】:國家高技術(shù)研究發(fā)展計(jì)劃(“863”計(jì)劃)基金資助項(xiàng)目(No.SS2014AA012303) 國家自然科學(xué)基金資助項(xiàng)目(No.61300206,No.61402123)~~
【分類號】:TP391.1
【正文快照】: 近年來,快速發(fā)展的社交網(wǎng)絡(luò)已成為人們交流信息的重要平臺。其中,微博作為主流社交平臺之一,吸引了越來越多的網(wǎng)民參與其中。隨著微博用戶規(guī)模的迅速膨脹,微博平臺上產(chǎn)生和流動的大量數(shù)據(jù)(如朋友關(guān)系、用戶發(fā)布的內(nèi)容等)具有重要的研究意義和應(yīng)用價(jià)值。其中,如何基于微博平臺
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前6條
1 張大鵬;左旺孟;;生物特征計(jì)算進(jìn)展[J];智能計(jì)算機(jī)與應(yīng)用;2011年03期
2 吳中海,,張行功,葉澄清,潘云鶴;一個(gè)適合于特征計(jì)算的多邊形逼近算法[J];計(jì)算機(jī)學(xué)報(bào);1997年12期
3 于子凡;杜貴君;林宗堅(jiān);;圖像盒子維數(shù)特征計(jì)算方法改進(jìn)[J];測繪科學(xué);2006年01期
4 羅楓,陳志楊,張三元,葉修梓;基于OBB樹層次關(guān)系的相交體特征計(jì)算[J];計(jì)算機(jī)應(yīng)用研究;2005年10期
5 王慧斌;程勇;陳哲;;融合視覺深度的特征計(jì)算與水下目標(biāo)跟蹤[J];中國圖象圖形學(xué)報(bào);2014年04期
6 ;[J];;年期
本文編號:723357
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/723357.html
最近更新
教材專著