天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 電力論文 >

增強(qiáng)領(lǐng)域特征的電力審計文本分類方法

發(fā)布時間:2021-06-01 01:44
  針對電力審計領(lǐng)域的文本具有行業(yè)特征明顯、文本特征相似度高、分類邊界模糊的特性,提出了增強(qiáng)領(lǐng)域特征的電力審計文本分類方法。首先構(gòu)建面向電力審計的專業(yè)詞典,提出EF-Doc2VecC模型再聯(lián)合專業(yè)詞典增強(qiáng)文本的特征,最后送入BiLSTM分類器實現(xiàn)專業(yè)領(lǐng)域的文本分類。實驗結(jié)果表明,針對專業(yè)性顯著的電力審計類文本分類,EF-Doc2Vec模型,在召回率、特異性、準(zhǔn)確率和F1值分類指標(biāo)上比對照模型Doc2VecC分別高出4,2,2,2個百分點(diǎn);針對通用領(lǐng)域文本分類,EF-Doc2VecC模型在召回率、差異性、準(zhǔn)確率和F1值分類指標(biāo)上比對照模型Doc2VecC高出3,3,4,4個百分點(diǎn)。另外,EF-Doc2VecC模型在電力審計類的文本分類性能分別比通用領(lǐng)域高出4,5,3,3個百分點(diǎn)。因此,提出的文本向量表示方法及文本分類方法,不僅能提升通用領(lǐng)域的文本分類性能,還能顯著提升垂直領(lǐng)域的文本細(xì)粒度分類性能。 

【文章來源】:計算機(jī)應(yīng)用. 2020,40(S1)北大核心CSCD

【文章頁數(shù)】:4 頁

【部分圖文】:

增強(qiáng)領(lǐng)域特征的電力審計文本分類方法


增強(qiáng)特征的EF-Doc2VecC模型

單元,特征向量,文本,文本分類


EF-Doc2VecC聯(lián)合BiLSTM文本分類結(jié)構(gòu)如圖3所示。本文將每個輸入文本映射成固定維度的特征向量,在與電力審計詞相似性比較并篩選后得到增強(qiáng)的向量,將該特征向量送入BiLSTM模型中訓(xùn)練,可實現(xiàn)專業(yè)領(lǐng)域文本的分類任務(wù)。流程見圖4所示。

文本分類,特征向量,文本


本文將每個輸入文本映射成固定維度的特征向量,在與電力審計詞相似性比較并篩選后得到增強(qiáng)的向量,將該特征向量送入BiLSTM模型中訓(xùn)練,可實現(xiàn)專業(yè)領(lǐng)域文本的分類任務(wù)。流程見圖4所示。圖4 EF-Doc2VecC聯(lián)合BiLSTM文本分類過程

【參考文獻(xiàn)】:
期刊論文
[1]基于混合神經(jīng)網(wǎng)絡(luò)的電力短文本分類方法研究[J]. 曹湘,李譽(yù)坤,錢葉,閆晨陽,楊忠光.  計算機(jī)與數(shù)字工程. 2019(05)
[2]電力行業(yè)數(shù)據(jù)式審計模式研究[J]. 余從容,盧利娟,梁東貴.  現(xiàn)代信息科技. 2018(04)
[3]基于Word2Vec的一種文檔向量表示[J]. 唐明,朱磊,鄒顯春.  計算機(jī)科學(xué). 2016(06)



本文編號:3209409

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/dianlilw/3209409.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶a9987***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com