基于BiLSTM-CRF的體育新聞主題詞抽取方法
發(fā)布時間:2021-07-23 01:25
針對典型的循環(huán)神經(jīng)網(wǎng)絡(luò)方法在抽取主題詞時因缺少上下文相關(guān)的句子級信息而導(dǎo)致識別準(zhǔn)確率較低的問題,提出了一種基于雙向長短期記憶網(wǎng)絡(luò)條件隨機(jī)場(BiLSTM-CRF)模型聯(lián)合TextRank的主題詞抽取方法。首先,利用TextRank對新聞文本進(jìn)行主題句抽取,再使用雙向長短期記憶(BiLSTM)模型獲取文本的前后特征,最后使用條件隨機(jī)場(CRF)完成句子級序列標(biāo)注,得到主題詞。在多組體育類新聞數(shù)據(jù)集上進(jìn)行實驗,該方法較對照組BiLSTM方法F1值提高約0.8%~5.1%,且用時更短。因此,改進(jìn)的BiLSTM-CRF方法可顯著提升主題詞的抽取準(zhǔn)確率和效率。
【文章來源】:武漢工程大學(xué)學(xué)報. 2020,42(01)
【文章頁數(shù)】:6 頁
【文章目錄】:
1 體育新聞主題詞抽取方法
1.1 抽取流程
1.2 TextRank提取新聞主題句
1.3 BiLSTM模型
1.4 BiLSTM-CRF模型
2 實驗部分
2.1 數(shù)據(jù)集
2.2 評價標(biāo)準(zhǔn)
2.3 結(jié)果及分析
3 結(jié)論
本文編號:3298304
【文章來源】:武漢工程大學(xué)學(xué)報. 2020,42(01)
【文章頁數(shù)】:6 頁
【文章目錄】:
1 體育新聞主題詞抽取方法
1.1 抽取流程
1.2 TextRank提取新聞主題句
1.3 BiLSTM模型
1.4 BiLSTM-CRF模型
2 實驗部分
2.1 數(shù)據(jù)集
2.2 評價標(biāo)準(zhǔn)
2.3 結(jié)果及分析
3 結(jié)論
本文編號:3298304
本文鏈接:http://sikaile.net/jiaoyulunwen/tylw/3298304.html
最近更新
教材專著