基于hLDA的科技文獻主題摘要生成算法與實現(xiàn)——以電力行業(yè)論文為例
發(fā)布時間:2018-01-17 21:36
本文關鍵詞:基于hLDA的科技文獻主題摘要生成算法與實現(xiàn)——以電力行業(yè)論文為例 出處:《圖書情報知識》2014年04期 論文類型:期刊論文
【摘要】:隨著信息爆炸時代的到來,科技文獻數(shù)量的快速增長,科技工作者對于科技文獻有效信息獲取的要求也越來越高。本文提出了一種科技文獻主題自動摘要生成算法。利用hLDA模型對科技文獻數(shù)據(jù)集進行主題建模,并通過摘要候選句的選擇,綜合多個因素的句子打分策略,自動為科技文獻中潛在的主題生成摘要。在實驗中,提出基于主題覆蓋度的摘要評價方法。實驗結(jié)果驗證了本文提出的主題摘要生成算法的有效性。
[Abstract]:With the arrival of the era of information explosion, the number of scientific and technological documents is growing rapidly. In this paper, we propose an automatic summarization algorithm for scientific and technological literature. We use hLDA model to model the subject of sci-tech literature data set. . And through the selection of summary candidate sentences, synthesizing the sentence scoring strategy of multiple factors, automatically generating abstracts for potential topics in the scientific and technological literature. In the experiment. A summary evaluation method based on topic coverage is proposed, and the experimental results demonstrate the effectiveness of the proposed algorithm.
【作者單位】: 南方電網(wǎng)科學研究院;武漢大學信息管理學院;
【基金】:國家自然科學基金項目“多因素融合下的微博話題可信度評估模型及實證研究”(71303179)的成果之一
【分類號】:TP391.1;F426.61
【正文快照】: 1引言近年來,隨著互聯(lián)網(wǎng)的迅速發(fā)展以及科學技術(shù)的巨大進步,網(wǎng)絡信息資源成為人們生活中不可缺少的部分。科技文獻數(shù)量呈指數(shù)型增長?萍脊ぷ髡咴絹碓较萑氲叫畔⒌暮Q笾小榱俗尶萍脊ぷ髡咴诤A康奈墨I信息資源中快速地獲取有效的信息,必須對信息的篩選和濃縮等問題進行認真
【相似文獻】
相關碩士學位論文 前2條
1 劉平安;基于HLDA模型的中文多文檔摘要技術(shù)研究[D];北京郵電大學;2013年
2 劉紅艷;基于hLDA層次主題模型的多文檔摘要技術(shù)研究[D];北京郵電大學;2012年
,本文編號:1438109
本文鏈接:http://sikaile.net/wenshubaike/qiuzhijiqiao/1438109.html
最近更新
教材專著