基于Bi-LSTM-CRF的商業(yè)領(lǐng)域命名實體識別
發(fā)布時間:2021-07-03 03:11
[目的/意義]為解決目前網(wǎng)絡(luò)公開平臺的多源異構(gòu)的企業(yè)數(shù)據(jù)的散亂、無序、碎片化問題,提出Bi-LSTM-CRF深度學(xué)習(xí)模型進(jìn)行商業(yè)領(lǐng)域中的命名實體識別工作。[方法/過程]該方法包括對企業(yè)全稱實體、企業(yè)簡稱實體與人名實體3類命名實體識別。[結(jié)果/結(jié)論]實驗結(jié)果顯示對企業(yè)全稱實體、企業(yè)簡稱實體與人名實體3類命名實體識別的識別率平均F值為90.85%,驗證了所提方法的有效性,證明了本研究有效地改善了商業(yè)領(lǐng)域中的命名實體識別效率。
【文章來源】:現(xiàn)代情報. 2020,40(03)CSSCI
【文章頁數(shù)】:8 頁
【部分圖文】:
Bi-LSTM-CRF命名實體識別模型
1)遺忘門的計算。選擇需要丟棄的信息。其輸入為前一時間的隱層狀態(tài)ht-1和當(dāng)前輸入詞Xt,輸出結(jié)果為遺忘門的值ft,計算過程可表示為:ft=σ(Wf·[ht-1,xt]+bf) (1)
通過LSTM運算,最終可以得到一個與句子有相同長度的隱層裝填序列(h0,h1,…,hn-1)。相比于傳統(tǒng)的RNN模型,LSTM在大多數(shù)任務(wù)中都能取得更好的效果。2.3.2 BI-LSTM
【參考文獻(xiàn)】:
期刊論文
[1]基于LSTM-CRF的中醫(yī)醫(yī)案癥狀術(shù)語識別[J]. 李明浩,劉忠,姚遠(yuǎn)哲. 計算機應(yīng)用. 2018(S2)
[2]基于大數(shù)據(jù)平臺的企業(yè)畫像研究綜述[J]. 田娟,朱定局,楊文翰. 計算機科學(xué). 2018(S2)
[3]基于深度學(xué)習(xí)的中文機構(gòu)名識別研究——一種漢字級別的循環(huán)神經(jīng)網(wǎng)絡(luò)方法[J]. 朱丹浩,楊蕾,王東波. 現(xiàn)代圖書情報技術(shù). 2016(12)
[4]命名實體識別研究進(jìn)展綜述[J]. 孫鎮(zhèn),王惠臨. 現(xiàn)代圖書情報技術(shù). 2010(06)
本文編號:3261745
【文章來源】:現(xiàn)代情報. 2020,40(03)CSSCI
【文章頁數(shù)】:8 頁
【部分圖文】:
Bi-LSTM-CRF命名實體識別模型
1)遺忘門的計算。選擇需要丟棄的信息。其輸入為前一時間的隱層狀態(tài)ht-1和當(dāng)前輸入詞Xt,輸出結(jié)果為遺忘門的值ft,計算過程可表示為:ft=σ(Wf·[ht-1,xt]+bf) (1)
通過LSTM運算,最終可以得到一個與句子有相同長度的隱層裝填序列(h0,h1,…,hn-1)。相比于傳統(tǒng)的RNN模型,LSTM在大多數(shù)任務(wù)中都能取得更好的效果。2.3.2 BI-LSTM
【參考文獻(xiàn)】:
期刊論文
[1]基于LSTM-CRF的中醫(yī)醫(yī)案癥狀術(shù)語識別[J]. 李明浩,劉忠,姚遠(yuǎn)哲. 計算機應(yīng)用. 2018(S2)
[2]基于大數(shù)據(jù)平臺的企業(yè)畫像研究綜述[J]. 田娟,朱定局,楊文翰. 計算機科學(xué). 2018(S2)
[3]基于深度學(xué)習(xí)的中文機構(gòu)名識別研究——一種漢字級別的循環(huán)神經(jīng)網(wǎng)絡(luò)方法[J]. 朱丹浩,楊蕾,王東波. 現(xiàn)代圖書情報技術(shù). 2016(12)
[4]命名實體識別研究進(jìn)展綜述[J]. 孫鎮(zhèn),王惠臨. 現(xiàn)代圖書情報技術(shù). 2010(06)
本文編號:3261745
本文鏈接:http://sikaile.net/jingjilunwen/guojimaoyilunwen/3261745.html
最近更新
教材專著