面向科學(xué)研究主題的文獻(xiàn)隱含時(shí)間信息分析與挖掘
本文選題:標(biāo)簽主題模型 切入點(diǎn):隱含時(shí)間特征 出處:《情報(bào)學(xué)報(bào)》2017年04期
【摘要】:本研究針對(duì)缺乏檢索對(duì)象時(shí)間范圍和精確語(yǔ)義表達(dá)式的用戶(hù)弱信息檢索需求,為了更好地體現(xiàn)出文獻(xiàn)之間的時(shí)間關(guān)聯(lián)性,提出了一種文本內(nèi)容時(shí)間信息的分析和挖掘方法。本文歸納總結(jié)了學(xué)術(shù)文獻(xiàn)常用時(shí)間詞,并基于圖書(shū)情報(bào)學(xué)題錄信息完成文本時(shí)間詞抽取。在此基礎(chǔ)上利用標(biāo)簽主題模型1abe1ed-LDA實(shí)現(xiàn)文本隱含時(shí)間標(biāo)簽的生成,以及基于時(shí)間維度的文本語(yǔ)義相似度計(jì)算。實(shí)驗(yàn)結(jié)果表明,本研究能較好地生成文獻(xiàn)隱含時(shí)間信息,也能更有效地幫助用戶(hù)提高弱信息檢索結(jié)果的相關(guān)性。
[Abstract]:In order to better reflect the temporal relevance of literature, a method for analyzing and mining temporal information of text content is proposed in this study, aiming at the weak information retrieval needs of users who lack the time range of retrieval objects and accurate semantic expressions.This paper sums up the time words commonly used in academic literature, and completes the extraction of text time words based on the information of library and information science inscription.On this basis, the label topic model (1abe1ed-LDA) is used to realize the generation of text implicit time label and the text semantic similarity calculation based on time dimension.The experimental results show that this study can not only generate the implicit time information of literature, but also help users to improve the correlation of weak information retrieval results.
【作者單位】: 南京理工大學(xué);武漢理工大學(xué)中國(guó)應(yīng)急管理研究中心;
【基金】:國(guó)家自然科學(xué)基金青年項(xiàng)目“基于時(shí)間感知模型的學(xué)術(shù)主題檢索與演化挖掘研究”(71503124);國(guó)家自然科學(xué)基金項(xiàng)目“突發(fā)事件網(wǎng)絡(luò)輿情演變過(guò)程中的人群仿真研究”(71273132)
【分類(lèi)號(hào)】:G353.1
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 劉劍蘭;用信息萃取進(jìn)行文本挖掘的方法[J];情報(bào)雜志;2004年12期
2 夏詠梅;基于文本挖掘的分類(lèi)與聚類(lèi)技術(shù)[J];情報(bào)探索;2005年03期
3 劉春艷;;基于信息可視化的文本挖掘研究領(lǐng)域前沿與演化分析[J];圖書(shū)情報(bào)工作;2011年S2期
4 范并思;;組織者的話[J];圖書(shū)情報(bào)工作;2012年08期
5 肖建國(guó);;試論文本挖掘及其應(yīng)用[J];圖書(shū)館學(xué)研究;2008年04期
6 徐海霞;聚類(lèi)分析在Web文本挖掘中的應(yīng)用[J];情報(bào)雜志;2004年12期
7 王連軍;Web文本挖掘淺析[J];現(xiàn)代圖書(shū)情報(bào)技術(shù);2002年06期
8 韓客松,王永成;文本挖掘、數(shù)據(jù)挖掘和知識(shí)管理——二十一世紀(jì)的智能信息處理[J];情報(bào)學(xué)報(bào);2001年01期
9 諶志群;張國(guó)煊;;文本挖掘與中文文本挖掘模型研究[J];情報(bào)科學(xué);2007年07期
10 劉進(jìn)鋒;榮岡;;Web文本挖掘在輔助研究中的應(yīng)用[J];情報(bào)科學(xué);2006年03期
,本文編號(hào):1694891
本文鏈接:http://sikaile.net/tushudanganlunwen/1694891.html