天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 電力論文 >

基于文本識(shí)別技術(shù)的電氣設(shè)備監(jiān)測(cè)數(shù)據(jù)處理

發(fā)布時(shí)間:2020-07-22 08:44
【摘要】:隨著社會(huì)經(jīng)濟(jì)的不斷進(jìn)步,對(duì)電氣設(shè)備的工作要求越來(lái)越高。電力系統(tǒng)作為當(dāng)今能源產(chǎn)業(yè)的重要組成部分,在生產(chǎn)過程中產(chǎn)生了海量的故障文本數(shù)據(jù)。如何有效處理電力系統(tǒng)中積累的大量中文文本故障數(shù)據(jù),對(duì)電氣設(shè)備監(jiān)測(cè)數(shù)據(jù)領(lǐng)域的研究具有重要意義。目前,電力系統(tǒng)故障文本大多使用單一模型進(jìn)行分類,且精確度有待進(jìn)一步提高。針對(duì)這一情況,構(gòu)建多種文本分類模型并比較分析,有利于提高電力設(shè)備故障文本分類的準(zhǔn)確性。電力設(shè)備故障文本在分類之前需要專業(yè)人士進(jìn)行人工篩選,傳統(tǒng)的機(jī)器學(xué)習(xí)模型需要對(duì)篩選后的數(shù)據(jù)做特征提取、空間向量表示和模型訓(xùn)練等工作,深度學(xué)習(xí)模型進(jìn)行人工標(biāo)注處理文本序列,直接將篩選后的文本投放到分類器中訓(xùn)練。本文針對(duì)機(jī)器學(xué)習(xí)分類模型和深度學(xué)習(xí)分類模型對(duì)文本分類準(zhǔn)確率高低為出發(fā)點(diǎn),構(gòu)建了多種分類模型比較分析,得出分類準(zhǔn)確率較高的模型。針對(duì)電氣設(shè)備故障文本分類研究,構(gòu)建了五種傳統(tǒng)的機(jī)器學(xué)習(xí)分類模型(支持向量機(jī)模型、K-最近鄰模型、樸素貝葉斯模型、Logistic回歸模型、Gradient Boosting模型),研究這些模型的故障數(shù)據(jù)分類準(zhǔn)確率。研究過程包括對(duì)篩選后的故障數(shù)據(jù)通過隱馬爾科夫模型的維特比算法進(jìn)行文本分詞和去除停用詞處理,接著對(duì)預(yù)處理后的數(shù)據(jù)通過卡方統(tǒng)計(jì)量和互信息法以及融合卡方統(tǒng)計(jì)量和互信息法改進(jìn)的M-CHI法對(duì)文本數(shù)據(jù)進(jìn)行特征提取,并通過空間向量模型進(jìn)行文本表示得到詞向量矩陣,接下來(lái)將詞向量矩陣分別投放到構(gòu)建的五種機(jī)器學(xué)習(xí)訓(xùn)練模型中。實(shí)驗(yàn)結(jié)果表明,改進(jìn)的M-CHI特征提取方法提高了故障數(shù)據(jù)的特征提取值,支持向量機(jī)模型在采用該方法的基礎(chǔ)上是五種機(jī)器學(xué)習(xí)模型中分類準(zhǔn)確率最高的。針對(duì)深度學(xué)習(xí)對(duì)文本分類研究,在LSTM模型基礎(chǔ)上,為了加強(qiáng)故障文本上下文信息關(guān)聯(lián),改善信息不連續(xù)導(dǎo)致分類錯(cuò)誤的情況,構(gòu)建了雙層雙向LSTM模型,接著采用Word2vec詞向量模型的Skip-Gram架構(gòu)對(duì)詞向量進(jìn)行訓(xùn)練,并融合深層注意力機(jī)制關(guān)注文本數(shù)據(jù)中不同詞向量的權(quán)重,構(gòu)建了基于深層注意力機(jī)制的DA-BiLSTM模型,并與機(jī)器學(xué)習(xí)模型進(jìn)行分類效果對(duì)比分析。實(shí)驗(yàn)結(jié)果表明,通過對(duì)該模型性能做綜合訓(xùn)練測(cè)試,驗(yàn)證了該模型的分類準(zhǔn)確率優(yōu)于機(jī)器學(xué)習(xí)分類模型,為電氣設(shè)備監(jiān)測(cè)數(shù)據(jù)分類提供了有價(jià)值的參考。
【學(xué)位授予單位】:華北電力大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2019
【分類號(hào)】:TM507;TP391.1
【圖文】:

準(zhǔn)確率,華北電力大學(xué),碩士學(xué)位論文,預(yù)期效果


華北電力大學(xué)碩士學(xué)位論文0 個(gè)之后,3 種方法的準(zhǔn)確率都較高,基本都在 0.8 以上,并且趨其是經(jīng)過融合的 M-CHI 法的分類準(zhǔn)確率高于其他 2 個(gè)方法,且預(yù)期效果。

準(zhǔn)確率,準(zhǔn)確性,特征項(xiàng),平穩(wěn)狀態(tài)


29圖 4-2 三種特征選擇方法在 KNN 上的分類準(zhǔn)確率4-2 刻畫的是 CHI 法、MI 法和 M-CHI 法在 KNN 分類器上對(duì)變壓準(zhǔn)確性。從選取不同數(shù)量的特征項(xiàng)進(jìn)行分類實(shí)驗(yàn)可以看出,當(dāng)特時(shí),CHI 法和 M-CHI 法的準(zhǔn)確率基本處于增長(zhǎng)的趨勢(shì),而 MI 法的相對(duì)于其他幾個(gè)模型來(lái)說(shuō),穩(wěn)定性較差。當(dāng)數(shù)據(jù)集大于 1700 個(gè)確率都趨于平穩(wěn)狀態(tài),M-CHI 方法的準(zhǔn)確性要優(yōu)于其他兩種方法準(zhǔn)確率均在 0.7 左右。

準(zhǔn)確率,特征項(xiàng),電氣設(shè)備故障


圖 4-3 三種特征選擇方法在 NB 上的分類準(zhǔn)確率-3 刻畫的是 CHI 法、MI 法和 M-CHI 法在 NB 分類器上對(duì)變壓器確性。從選取不同數(shù)量的特征項(xiàng)進(jìn)行的分類實(shí)驗(yàn)可以看出,三種隨著數(shù)據(jù)集的增加而增長(zhǎng),M-CHI 法的準(zhǔn)確率一直高于其他兩確率依舊是最低的。選取從 100 個(gè)到 1900 個(gè)特征項(xiàng)時(shí)三種特征類模型的分類準(zhǔn)確率都處于不斷增長(zhǎng)的趨勢(shì),MI 法的準(zhǔn)確率一直增長(zhǎng)速率依舊保持最大,M-CHI 法和 CHI 法的增長(zhǎng)幅度基本相相對(duì)于 CHI 法一直保持優(yōu)勢(shì)。當(dāng)特征項(xiàng)大于 1900 個(gè)時(shí),三種特率都趨于平穩(wěn)的狀態(tài),M-CHI 法的準(zhǔn)確率要高于其他兩種方法確率都不足 0.75。M 算法在電氣設(shè)備故障文本中的應(yīng)用

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 汪明霓;BASIC文本系統(tǒng)[J];計(jì)算機(jī)應(yīng)用研究;1988年01期

2 易樹鴻;張為群;;一種基于粗集的文本數(shù)據(jù)特征信息的挖掘方法[J];計(jì)算機(jī)科學(xué);2002年08期

3 婁道國(guó);李若斌;劉冰;張冬冬;;云計(jì)算下各分散文本數(shù)據(jù)的全方位集成融合方法[J];科技通報(bào);2019年02期

4 潘大勝;;不確定噪聲下海量文本數(shù)據(jù)的模糊挖掘算法研究[J];微電子學(xué)與計(jì)算機(jī);2017年09期

5 王珊珊;馮利鑫;;基于新詞識(shí)別的大數(shù)據(jù)聊天文本輿情熱點(diǎn)挖掘[J];電子商務(wù);2018年01期

6 陳曉峰;如何在flash中讀入外部文本數(shù)據(jù)[J];電腦知識(shí)與技術(shù);2004年13期

7 馬欣欣;林克;;大文本數(shù)據(jù)快速分析統(tǒng)計(jì)理論與算法[J];電子元器件與信息技術(shù);2019年01期

8 施瑞朗;;基于社交平臺(tái)數(shù)據(jù)的文本分類算法研究[J];電子科技;2018年10期

9 張玉紅;陳偉;胡學(xué)鋼;;一種面向不完全標(biāo)記的文本數(shù)據(jù)流自適應(yīng)分類方法[J];計(jì)算機(jī)科學(xué);2016年12期

10 袁鵬;江媛媛;;多元化文本數(shù)據(jù)的智能提取[J];測(cè)繪與空間地理信息;2015年09期

相關(guān)會(huì)議論文 前10條

1 易天元;葉春生;;工業(yè)鍋爐圖紙輸入的文本數(shù)據(jù)處理[A];1997中國(guó)控制與決策學(xué)術(shù)年會(huì)論文集[C];1997年

2 陳光強(qiáng);楊樹強(qiáng);張曉輝;李潤(rùn)恒;賈焰;;面向海量文本數(shù)據(jù)的多任務(wù)并行調(diào)度加載技術(shù)研究與實(shí)現(xiàn)[A];第15屆全國(guó)信息存儲(chǔ)技術(shù)學(xué)術(shù)會(huì)議論文集[C];2008年

3 周純潔;黎]

本文編號(hào):2765583


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/dianlilw/2765583.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶f4d5e***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com