Web2.0互聯(lián)網(wǎng)在線話題發(fā)現(xiàn)和熱度評估
【圖文】:
第二章 話題檢測與跟蹤相關(guān)技術(shù)Single Pass 聚類算法過程簡單,聚類速度快,時(shí)間復(fù)雜度低,很適合在在線話題發(fā)現(xiàn)系統(tǒng)中使用。數(shù)據(jù)輸入順序不同,Single Pass 聚類結(jié)果不同,聚類的準(zhǔn)確度較低,因此一般會與其它策略一起使用來優(yōu)化聚類結(jié)果準(zhǔn)確度。在話題發(fā)現(xiàn)系統(tǒng)中,Single Pass 算法一次處理一篇新聞報(bào)道,初始時(shí)將第一篇新聞報(bào)道看作一個(gè)新的話題,構(gòu)建它的表示模型。然后依次處理新到來的下一篇新聞報(bào)道,將其與已有的話題模型進(jìn)行相似度比較。如果相似度最大值小于初始設(shè)置的閾值 T,說明其不屬于已有的任何一個(gè)話題,使用它創(chuàng)建新的話題模型,否則將其聚類到與之相似度最大的話題簇中。
華南理工大學(xué)碩士學(xué)位論文在發(fā)生的大大小小事情。隨著信息時(shí)代的到來,,傳統(tǒng)的媒體建立了自己的新聞網(wǎng)站如新華日報(bào)網(wǎng)(http://xh.xhby.net),瀟湘晨報(bào)(http://xxcb.rednet.cn/),新聞聯(lián)播http://news.cctv.com/),湖南衛(wèi)視網(wǎng)(http://www.hunantv.com/)。同時(shí)很多商業(yè)門戶網(wǎng)站也被相繼投資建立,如雅虎新聞、新浪新聞、鳳凰資訊等;ヂ(lián)網(wǎng)新聞網(wǎng)站報(bào)新聞不一定都是原創(chuàng),而是轉(zhuǎn)載于其它的新聞網(wǎng)站。圖 4-1 是一篇新浪新聞,圖 4一篇雅虎新聞。新聞轉(zhuǎn)載網(wǎng)站“新華網(wǎng)”和“中國新聞網(wǎng)”可以看出新聞在不同的網(wǎng)站之間的轉(zhuǎn)載關(guān)系。
【學(xué)位授予單位】:華南理工大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2013
【分類號】:TP393.09;TP311.13
【參考文獻(xiàn)】
相關(guān)期刊論文 前7條
1 徐新華;謝永紅;;增量聚類綜述及增量DBSCAN聚類算法研究[J];華北航天工業(yè)學(xué)院學(xué)報(bào);2006年02期
2 陳莉萍;杜軍平;;突發(fā)事件熱點(diǎn)話題識別系統(tǒng)及關(guān)鍵問題研究[J];計(jì)算機(jī)工程與應(yīng)用;2011年32期
3 劉建曄;李芳;;一種基于密度的高性能增量聚類算法[J];計(jì)算機(jī)工程;2006年21期
4 殷風(fēng)景;肖衛(wèi)東;葛斌;李芳芳;;一種面向網(wǎng)絡(luò)話題發(fā)現(xiàn)的增量文本聚類算法[J];計(jì)算機(jī)應(yīng)用研究;2011年01期
5 洪宇;張宇;劉挺;李生;;話題檢測與跟蹤的評測及研究綜述[J];中文信息學(xué)報(bào);2007年06期
6 劉星星;何婷婷;龔海軍;陳龍;;網(wǎng)絡(luò)熱點(diǎn)事件發(fā)現(xiàn)系統(tǒng)的設(shè)計(jì)[J];中文信息學(xué)報(bào);2008年06期
7 宋丹;王衛(wèi)東;陳英;;基于改進(jìn)向量空間模型的話題識別與跟蹤[J];計(jì)算機(jī)技術(shù)與發(fā)展;2006年09期
相關(guān)博士學(xué)位論文 前3條
1 丁飛;互聯(lián)網(wǎng)社區(qū)信息交互和傳播模式的研究[D];北京交通大學(xué);2010年
2 雷震;基于事件的新聞報(bào)道分析技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2006年
3 潘新;基于復(fù)雜網(wǎng)絡(luò)的輿情傳播模型研究[D];大連理工大學(xué);2010年
本文編號:2550290
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2550290.html