基于hLDA的科技文獻(xiàn)主題摘要生成算法與實(shí)現(xiàn)——以電力行業(yè)論文為例
發(fā)布時(shí)間:2018-01-17 21:36
本文關(guān)鍵詞:基于hLDA的科技文獻(xiàn)主題摘要生成算法與實(shí)現(xiàn)——以電力行業(yè)論文為例 出處:《圖書(shū)情報(bào)知識(shí)》2014年04期 論文類型:期刊論文
更多相關(guān)文章: 科技文獻(xiàn) 主題摘要 生成算法 hLDA
【摘要】:隨著信息爆炸時(shí)代的到來(lái),科技文獻(xiàn)數(shù)量的快速增長(zhǎng),科技工作者對(duì)于科技文獻(xiàn)有效信息獲取的要求也越來(lái)越高。本文提出了一種科技文獻(xiàn)主題自動(dòng)摘要生成算法。利用hLDA模型對(duì)科技文獻(xiàn)數(shù)據(jù)集進(jìn)行主題建模,并通過(guò)摘要候選句的選擇,綜合多個(gè)因素的句子打分策略,自動(dòng)為科技文獻(xiàn)中潛在的主題生成摘要。在實(shí)驗(yàn)中,提出基于主題覆蓋度的摘要評(píng)價(jià)方法。實(shí)驗(yàn)結(jié)果驗(yàn)證了本文提出的主題摘要生成算法的有效性。
[Abstract]:With the arrival of the era of information explosion, the number of scientific and technological documents is growing rapidly. In this paper, we propose an automatic summarization algorithm for scientific and technological literature. We use hLDA model to model the subject of sci-tech literature data set. . And through the selection of summary candidate sentences, synthesizing the sentence scoring strategy of multiple factors, automatically generating abstracts for potential topics in the scientific and technological literature. In the experiment. A summary evaluation method based on topic coverage is proposed, and the experimental results demonstrate the effectiveness of the proposed algorithm.
【作者單位】: 南方電網(wǎng)科學(xué)研究院;武漢大學(xué)信息管理學(xué)院;
【基金】:國(guó)家自然科學(xué)基金項(xiàng)目“多因素融合下的微博話題可信度評(píng)估模型及實(shí)證研究”(71303179)的成果之一
【分類號(hào)】:TP391.1;F426.61
【正文快照】: 1引言近年來(lái),隨著互聯(lián)網(wǎng)的迅速發(fā)展以及科學(xué)技術(shù)的巨大進(jìn)步,網(wǎng)絡(luò)信息資源成為人們生活中不可缺少的部分?萍嘉墨I(xiàn)數(shù)量呈指數(shù)型增長(zhǎng)?萍脊ぷ髡咴絹(lái)越陷入到信息的海洋中。為了讓科技工作者在海量的文獻(xiàn)信息資源中快速地獲取有效的信息,必須對(duì)信息的篩選和濃縮等問(wèn)題進(jìn)行認(rèn)真
【相似文獻(xiàn)】
相關(guān)碩士學(xué)位論文 前2條
1 劉平安;基于HLDA模型的中文多文檔摘要技術(shù)研究[D];北京郵電大學(xué);2013年
2 劉紅艷;基于hLDA層次主題模型的多文檔摘要技術(shù)研究[D];北京郵電大學(xué);2012年
,本文編號(hào):1438109
本文鏈接:http://sikaile.net/wenshubaike/qiuzhijiqiao/1438109.html
最近更新
教材專著