多特征融合文本聚類的新聞話題發(fā)現(xiàn)模型
本文選題:新聞話題 + 多特征融合。 參考:《國防科技大學(xué)學(xué)報》2017年03期
【摘要】:融合新聞命名實體、新聞標題、新聞重要段落、文本語義等多特征影響,提出基于多特征融合文本聚類的新聞話題發(fā)現(xiàn)模型。模型根據(jù)新聞的多特征影響,提出一種多特征融合文本聚類方法。該方法針對新聞標題、新聞重要段落等特征因素構(gòu)建向量空間模型及相似度算法,基于潛在狄利克雷分配模型構(gòu)建主題空間模型及相似度算法,針對命名實體構(gòu)建命名實體模型及相似度算法,并將三種相似度算法形成最優(yōu)融合。基于多特征融合文本聚類方法,模型改進了用于新聞話題發(fā)現(xiàn)的Single-Pass算法。實驗是在真實新聞數(shù)據(jù)集上開展的,實驗結(jié)果表明:該模型有效地提高了新聞話題發(fā)現(xiàn)的準確率、召回率和綜合評價指標,并具有一定的自適應(yīng)能力。
[Abstract]:A news topic discovery model based on multi-feature fusion text clustering is proposed, which combines the effects of news naming entities, news headlines, important paragraphs of news, text semantics, and so on. Based on the multi-feature influence of news, the model proposes a text clustering method based on multi-feature fusion. This method constructs vector space model and similarity algorithm for the feature factors such as news title, news important paragraph, and topic space model and similarity algorithm based on potential Delikley assignment model. The named entity model and similarity algorithm are constructed for named entities, and the three similarity algorithms are fused optimally. Based on the multi-feature fusion text clustering method, the model improves the Single-Pass algorithm for news topic discovery. The experiment is carried out on the real news data set. The experimental results show that the model can effectively improve the accuracy of news topic discovery, recall rate and comprehensive evaluation index, and has a certain adaptive ability.
【作者單位】: 中國人民大學(xué)信息學(xué)院;北京信息科技大學(xué)信息管理學(xué)院;
【基金】:國家自然科學(xué)基金資助項目(61272513) 北京市教育委員會科技計劃面上資助項目(KM201511232016,SM201511232004) 北京高等學(xué)校青年英才計劃資助項目(YETP1503)
【分類號】:TP391.1
【相似文獻】
相關(guān)期刊論文 前10條
1 初紅霞;王科俊;王希鳳;郭慶昌;韓晶;;多特征融合的退火粒子濾波目標跟蹤[J];計算機工程與應(yīng)用;2011年06期
2 顧鑫;王海濤;汪凌峰;王穎;陳如冰;潘春洪;;基于不確定性度量的多特征融合跟蹤[J];自動化學(xué)報;2011年05期
3 姚紅革;杜亞勤;;基于多模式多特征融合粒子濾波視頻目標跟蹤[J];西安工業(yè)大學(xué)學(xué)報;2012年11期
4 王蘭;;基于多特征融合的票據(jù)分類技術(shù)及應(yīng)用[J];計算機光盤軟件與應(yīng)用;2013年13期
5 陳增照;何秀玲;楊揚;董才林;;基于多特征融合的票據(jù)分類技術(shù)及應(yīng)用[J];計算機工程與應(yīng)用;2006年09期
6 周斌;林喜榮;賈惠波;宋榕;;多特征融合的手背血管識別算法[J];清華大學(xué)學(xué)報(自然科學(xué)版);2007年02期
7 劉貴喜;范春宇;高恩克;;基于粒子濾波與多特征融合的視頻目標跟蹤[J];光電子.激光;2007年09期
8 胡全;邱兆文;王霓虹;;基于多特征融合的圖像語義標注[J];東北林業(yè)大學(xué)學(xué)報;2008年10期
9 周靜;黃心漢;彭剛;;基于多特征融合的飛機目標識別[J];華中科技大學(xué)學(xué)報(自然科學(xué)版);2009年01期
10 沈才梁;許雪貴;許方恒;龍丹;;多特征融合的人臉檢測[J];計算機系統(tǒng)應(yīng)用;2009年11期
相關(guān)會議論文 前3條
1 葉鋒;蔡光東;鄭子華;亓?xí)孕?尹鵬;;基于多特征融合的藥用植物標本識別[A];2011年中國智能自動化學(xué)術(shù)會議論文集(第一分冊)[C];2011年
2 段其昌;季長有;;基于多特征融合的快速人臉檢測[A];第十七屆全國測控計量儀器儀表學(xué)術(shù)年會(MCMI'2007)論文集(上冊)[C];2007年
3 李玉峰;鄭德權(quán);趙鐵軍;;基于SVM和多特征融合的圖像分類[A];第四屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集(上)[C];2008年
相關(guān)博士學(xué)位論文 前5條
1 劉明華;復(fù)雜環(huán)境下基于多特征融合的目標跟蹤關(guān)鍵技術(shù)研究[D];青島科技大學(xué);2016年
2 田綱;基于多特征融合的Mean shift目標跟蹤技術(shù)研究[D];武漢大學(xué);2011年
3 徐志剛;基于多特征融合的路面破損圖像自動識別技術(shù)研究[D];長安大學(xué);2012年
4 陳秀新;多特征融合視頻復(fù)制檢測關(guān)鍵技術(shù)研究[D];北京工業(yè)大學(xué);2013年
5 初紅霞;基于均值移動和粒子濾波的目標跟蹤關(guān)鍵技術(shù)研究[D];哈爾濱工程大學(xué);2012年
相關(guān)碩士學(xué)位論文 前10條
1 張巖;基于多特征融合及二部圖匹配的3D目標檢索技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2015年
2 計明明;基于多特征融合的三維模型檢索技術(shù)[D];浙江大學(xué);2015年
3 王慶;基于多特征融合的人體動作識別方法研究[D];上海大學(xué);2015年
4 劉婕;復(fù)雜場景多特征融合粒子濾波目標跟蹤[D];重慶理工大學(xué);2015年
5 崔劍;基于多特征融合的分級行人檢測方法研究[D];電子科技大學(xué);2015年
6 王珊珊;基于極化SAR非監(jiān)督分類的油膜厚度估算方法研究[D];大連海事大學(xué);2015年
7 肖冠;基于多特征融合的異類傳感器中段目標關(guān)聯(lián)算法研究[D];國防科學(xué)技術(shù)大學(xué);2013年
8 王建榮;基于多特征融合的無人機航拍圖像識別研究[D];成都理工大學(xué);2015年
9 高爽;基于多特征融合的粒子濾波跟蹤算法研究[D];西安電子科技大學(xué);2014年
10 坎啟嬌;基于多特征融合的多目標跟蹤算法[D];河北工業(yè)大學(xué);2015年
,本文編號:1875090
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/1875090.html