基于引文的科技文獻(xiàn)主題抽取研究
本文關(guān)鍵詞:基于引文的科技文獻(xiàn)主題抽取研究 出處:《情報(bào)理論與實(shí)踐》2017年06期 論文類型:期刊論文
更多相關(guān)文章: 科技文獻(xiàn) 引文 主題抽取 關(guān)鍵詞
【摘要】:[目的/意義]主題抽取的效果對(duì)于信息檢索、自動(dòng)標(biāo)引、自然語(yǔ)言處理具有重要的價(jià)值,提高主題抽取的效果,既能改善檢索系統(tǒng)主題檢索準(zhǔn)確性,又能夠幫助學(xué)者更加高效地了解文獻(xiàn)的主要思想。文章研究并探討了從引用內(nèi)容中抽取文獻(xiàn)主題的有效性。[方法/過(guò)程]選取自然語(yǔ)言處理領(lǐng)域文獻(xiàn)為研究對(duì)象,利用文獻(xiàn)之間的引用與被引用關(guān)系抽取引用內(nèi)容,進(jìn)行分詞并計(jì)算權(quán)重;將引用內(nèi)容、全文抽取的候選詞進(jìn)行專家打分評(píng)價(jià)效果并將其與關(guān)鍵詞對(duì)比,使用F值評(píng)價(jià)兩種語(yǔ)料庫(kù)抽取候選詞的優(yōu)劣。[結(jié)果/結(jié)論]通過(guò)專家打分及計(jì)算F值,發(fā)現(xiàn)引用內(nèi)容在抽取候選詞方面具有明顯優(yōu)勢(shì)。
[Abstract]:[Objective / meaning] the effect of topic extraction is of great value to information retrieval, automatic indexing and natural language processing. It can improve the accuracy of topic retrieval in retrieval system. It can also help scholars to understand the main ideas of literature more efficiently. [Methods: the natural language processing literature was chosen as the research object. The citation content was extracted from the citation and the citation relation between the references, and the word segmentation was carried out and the weight was calculated. The candidate words extracted in full text are evaluated by experts and compared with the key words, and the advantages and disadvantages of the two kinds of corpus extraction are evaluated by using F value. [Results / conclusion] by scoring and calculating F value of experts, it is found that citation has obvious advantages in extracting candidate words.
【作者單位】: 華中師范大學(xué)信息管理學(xué)院;
【基金】:國(guó)家社會(huì)科學(xué)基金項(xiàng)目“基于語(yǔ)義理解的多模態(tài)信息融合與集成服務(wù)研究”(項(xiàng)目編號(hào):11CTQ017) 中央高校基本科研業(yè)務(wù)費(fèi)專項(xiàng)資金項(xiàng)目“社交化問(wèn)答平臺(tái)信息質(zhì)量感知模型及推薦算法研究”(項(xiàng)目編號(hào):CCNU16A02035)的成果
【分類號(hào)】:G353.1
【正文快照】: 主題是對(duì)文獻(xiàn)中心思想的概括,有了主題就基本了解了文獻(xiàn)闡述的主要內(nèi)容。從檢索系統(tǒng)來(lái)看,篇名、關(guān)鍵詞、主題、摘要、全文都是文獻(xiàn)的檢索入口,但是這些入口對(duì)于文獻(xiàn)主題的反映準(zhǔn)確性參差不齊,降低了檢索人員效率。引用內(nèi)容通常是學(xué)者對(duì)文獻(xiàn)觀點(diǎn)、主張高度凝練的概括,具有觀點(diǎn)
【參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 宋宇;羅準(zhǔn)辰;真溱;;基于引用背景信息的關(guān)鍵詞自動(dòng)抽取方法研究[J];情報(bào)理論與實(shí)踐;2016年11期
2 王曰芬;傅柱;陳必坤;;基于LDA主題模型的科學(xué)文獻(xiàn)主題識(shí)別:全局和學(xué)科兩個(gè)視角的對(duì)比分析[J];情報(bào)理論與實(shí)踐;2016年07期
3 黃魯成;張璐;吳菲菲;唐月強(qiáng);;基于突現(xiàn)文獻(xiàn)和SAO相似度的新興主題識(shí)別研究[J];科學(xué)學(xué)研究;2016年06期
4 關(guān)鵬;王曰芬;傅柱;;不同語(yǔ)料下基于LDA主題模型的科學(xué)文獻(xiàn)主題抽取效果分析[J];圖書情報(bào)工作;2016年02期
5 關(guān)鵬;王曰芬;;基于LDA主題模型和生命周期理論的科學(xué)文獻(xiàn)主題挖掘[J];情報(bào)學(xué)報(bào);2015年03期
6 張斯龍;程衛(wèi)萍;;基于共詞分析的2003-2012年全國(guó)核心期刊會(huì)議論文主題可視化[J];中國(guó)科技期刊研究;2014年07期
7 祝清松;冷伏海;;基于引文內(nèi)容分析的高被引論文主題識(shí)別研究[J];中國(guó)圖書館學(xué)報(bào);2014年01期
8 陳,
本文編號(hào):1369136
本文鏈接:http://sikaile.net/tushudanganlunwen/1369136.html