基于滑動窗口的微博時間線摘要算法
本文選題:微博摘要 切入點(diǎn):時間線摘要 出處:《數(shù)據(jù)采集與處理》2017年03期 論文類型:期刊論文
【摘要】:是在時間維度上對文本進(jìn)行內(nèi)容歸納和概要生成的技術(shù)。傳統(tǒng)的時間線摘要主要研究諸如新聞之類的長文本,而本文研究微博短文本的時間線摘要問題。由于微博短文本內(nèi)容特征有限,無法僅依靠文本內(nèi)容生成摘要,本文采用內(nèi)容覆蓋性、時間分布性和傳播影響力3種指標(biāo)評價時間線摘要,并提出了基于滑動窗口的微博時間線摘要算法(Microblog timeline summariaztion based on sliding window,MTSW)。該算法首先利用詞項(xiàng)強(qiáng)度和熵來確定代表性詞項(xiàng);然后基于上述3種指標(biāo)構(gòu)建出評價時間線摘要的綜合評價指標(biāo);最后采用滑動窗口的方法,遍歷時間軸上的微博消息序列,生成微博時間線摘要。利用真實(shí)微博數(shù)據(jù)集的實(shí)驗(yàn)結(jié)果表明,MTSW算法生成的時間線摘要可以有效地反映熱點(diǎn)事件發(fā)展演化的過程。
[Abstract]:Traditional time-line abstracts focus on long texts such as news. In this paper, we study the time line summary of Weibo short text. Due to the limited content features of the short text, we can not only rely on the text content to generate the summary. Time distribution and spreading influence are used to evaluate time-line abstracts, and Weibo time-line summarization algorithm based on sliding window is proposed. Firstly, the term intensity and entropy are used to determine representative word items. Then, based on the above three indexes, a comprehensive evaluation index of the summary of the evaluation time line is constructed. Finally, the sliding window is used to traverse the Weibo message sequence on the time axis. The experimental results show that the time line summary generated by the MTSW algorithm can effectively reflect the development and evolution of hot events.
【作者單位】: 南京師范大學(xué)計算機(jī)科學(xué)與技術(shù)學(xué)院;
【基金】:江蘇省高校自然科學(xué)基金(13KJB520014)資助項(xiàng)目
【分類號】:TP391.1;TP393.092
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 劉鎏,王建國,荊金華,張根度;如何保留安全歷史記錄[J];計算機(jī)應(yīng)用;2002年10期
2 李志娟;鄭青華;;新聞時間線:網(wǎng)絡(luò)碎片化信息整合新風(fēng)景[J];新聞實(shí)踐;2012年08期
3 簡武;動畫工廠——時間線[J];電腦愛好者;2000年03期
4 ;方正旌旗節(jié)目時間線操作[J];電視字幕(特技與動畫);2005年09期
5 ;“方正旌旗”概述——節(jié)目時間線操作技巧(五)[J];電視字幕(特技與動畫);2004年10期
6 王晶,程文青;多媒體課件制作工具中時間線機(jī)制的設(shè)計與實(shí)現(xiàn)[J];微機(jī)發(fā)展;2005年07期
7 ;網(wǎng)事[J];電腦迷;2010年21期
8 公子小白;;Doit:利用GTD思維提供工作效率[J];電腦迷;2013年08期
9 李斌,張陽;硬盤播出軟件時間線的探討[J];西部廣播電視;2000年01期
10 魏振鋼;張欲曉;魏兆強(qiáng);;基于XML的視頻剪輯時間線構(gòu)建方法[J];中國海洋大學(xué)學(xué)報(自然科學(xué)版);2010年06期
相關(guān)重要報紙文章 前3條
1 俞木發(fā);WMM使用技巧一則[N];中國電腦教育報;2004年
2 青島日報、青報網(wǎng)記者 喬文心;手機(jī)匿名應(yīng)用的邊界[N];青島日報;2014年
3 頭重腳輕 馮小民;找工作也要“包裝”[N];電腦報;2002年
相關(guān)碩士學(xué)位論文 前4條
1 祁雅萍;異構(gòu)數(shù)據(jù)流下基于地理位置的時間線研究[D];浙江大學(xué);2015年
2 馮寧;心理時間線:具身模擬和概念隱喻的雙重進(jìn)程?[D];華中師范大學(xué);2015年
3 李輝;基于時間線的事件組織與摘要技術(shù)的研究與應(yīng)用[D];浙江大學(xué);2012年
4 顧艷艷;漢語背景下橫縱軸上的心理時間線[D];河北師范大學(xué);2012年
,本文編號:1647341
本文鏈接:http://sikaile.net/guanlilunwen/ydhl/1647341.html