基于詞典擴充的電力客服工單情感傾向性分析
發(fā)布時間:2020-02-19 00:23
【摘要】:為了有效提高電力企業(yè)客戶滿意度及主動服務(wù)意識,結(jié)合電力客服工單文本特征,構(gòu)建了電力客服工單情感分析模型。先通過TF-IDF思想進行工單關(guān)鍵詞提取,采用word2vec訓(xùn)練得出每個詞語的詞向量,通過計算余弦相似度將高相似領(lǐng)域詞匯擴充到情感詞典,再進行工單傾向性分析及文本分類。通過實驗分析驗證該方法的有效性,實驗結(jié)果表明,相較于原始情感詞典,進行詞典擴充及工單情感傾向性分析方法更具優(yōu)勢,準確率更高,可為電力企業(yè)客戶關(guān)系管理提供一定的參考。
【圖文】:
肭?N-1個詞相關(guān),其原理示意圖如圖1所示。圖1中,最下方的wt-1,wt-2,,wt-n+1為前N-1個輸入詞,并根據(jù)其預(yù)測下一個詞wt,每個輸入詞被映射為一個向量,C(wt-1)為詞語wt-1的詞向量。網(wǎng)絡(luò)的第一層(輸入層)為輸入詞語組成的(n-1)m維向量x;網(wǎng)絡(luò)第二層(隱藏層)計算Hx+d,d為偏置因子,使用激活函數(shù)tanh;網(wǎng)絡(luò)第三層(輸出層)包含|V|個節(jié)點,每個節(jié)點yi表示下一詞i的未歸一化log概率,并使用softmax激活函數(shù)將輸出值y歸一化,最后使用隨機梯度下降法對模型進行優(yōu)化。圖1NNLM原理模型圖模型的目標函數(shù)為:f(w)t,wt-1,,wt-n+2,wt-n+1=p(|)wtwt-11需要滿足的約束條件為:f(w)t,wt-1,,wt-n+2,wt-n+1>0∑i=1|V|f(i,w)t-1,,wt-n+2,wt-n+1=12電力客服工單情感分析模型本文以某電力公司客服工單數(shù)據(jù)為研究對象,在深入理解電力業(yè)務(wù)及工單文本語義特點的基礎(chǔ)上,建立了一種電力客服工單情感分析模型。首先,在進行文本預(yù)處理的基礎(chǔ)上,對文本進行分詞處理并且完成關(guān)鍵詞提。蝗缓,采用word2vec訓(xùn)練工單數(shù)據(jù),并基于關(guān)鍵詞進行情感詞典擴充,構(gòu)建電力客服領(lǐng)域?qū)S们楦性~典;最后,進行工單情感傾向性分析。2.1工單文本預(yù)處理由于工單文本數(shù)據(jù)中存在大量價值含量較低甚至沒有價值意義的數(shù)據(jù),在進行分詞、情感分析中會對結(jié)果產(chǎn)生較大的影響,那么在文本挖掘之前就必須先進行文本預(yù)處理,去除大量沒有挖掘意義的工單數(shù)據(jù)。工單文本預(yù)處理工作主要包括:刪除未標注業(yè)務(wù)類型數(shù)據(jù)、分句處理、文本去重、短句刪除等。分句處理:將工單數(shù)據(jù)處理成以句子為最小單位,以句尾標點符號為標志分割,包括“,”,“!?
第11期吳和海,等:一種適用于機組組合優(yōu)化的改進整數(shù)編碼粒子群算法右。這是由于本文采用修復(fù)策略對不可行粒子進行修復(fù),使算法只在可行解區(qū)域內(nèi)搜索最優(yōu)解,有效提高收斂速度;同時相比二進制編碼,本文的整數(shù)編碼方式能有效提高粒子群算法的搜索效率。因此本文提出的整數(shù)編碼粒子群算法更適用于求解大規(guī)模機組組合問題。圖4不同機組規(guī)模的執(zhí)行時間曲線4結(jié)語本文采用整數(shù)編碼粒子群算法來求解機組組合問題。通過整數(shù)編碼方式,用正負整數(shù)分別表示機組開停機時間長度,相比于二進制編碼它能有效減少待優(yōu)化變量個數(shù)。求解過程中針對機組組合問題的特點,采用修補策略處理不滿足約束條件的粒子,使算法只在可行解區(qū)域內(nèi)搜索,通過切除冗余機組提高解的精度。仿真算例表明,相比rICGA,IPSO,SEP,本文提出的ICPSO算法求解大規(guī)模機組組合優(yōu)化問題具有更高的精度,求解時間大幅度減少。參考文獻[1]KAZARLISSA,BAKIRTZISAG,PETRIDISV.Ageneticalgorithmsolutiontotheunitcommitmentproblem[J].IEEEtransactionsonpowersystems,1996,11(1):8392.[2]黎靜華,蘭飛.機組組合問題的模型及算法綜述[J].現(xiàn)代電力,2011,28(6):110.[3]李丹,高立群,王珂,等.電力系統(tǒng)機組組合問題的動態(tài)雙種群粒子群算法[J].計算機應(yīng)用,2008,28(1):104107.[4]張濤,史蘇怡,徐雪琴.基于二進制量子粒子群算法的含分布式電源配電網(wǎng)重構(gòu)[J].電力系統(tǒng)保護與控制,2016,44(4):2228.[5]方源,章桐,陳霏霏,,等.電動車動力總成噪聲品質(zhì)粒子群向量機預(yù)測模型[J].西安交通大學(xué)學(xué)報,2016,50(1):4146.[6]
本文編號:2580854
【圖文】:
肭?N-1個詞相關(guān),其原理示意圖如圖1所示。圖1中,最下方的wt-1,wt-2,,wt-n+1為前N-1個輸入詞,并根據(jù)其預(yù)測下一個詞wt,每個輸入詞被映射為一個向量,C(wt-1)為詞語wt-1的詞向量。網(wǎng)絡(luò)的第一層(輸入層)為輸入詞語組成的(n-1)m維向量x;網(wǎng)絡(luò)第二層(隱藏層)計算Hx+d,d為偏置因子,使用激活函數(shù)tanh;網(wǎng)絡(luò)第三層(輸出層)包含|V|個節(jié)點,每個節(jié)點yi表示下一詞i的未歸一化log概率,并使用softmax激活函數(shù)將輸出值y歸一化,最后使用隨機梯度下降法對模型進行優(yōu)化。圖1NNLM原理模型圖模型的目標函數(shù)為:f(w)t,wt-1,,wt-n+2,wt-n+1=p(|)wtwt-11需要滿足的約束條件為:f(w)t,wt-1,,wt-n+2,wt-n+1>0∑i=1|V|f(i,w)t-1,,wt-n+2,wt-n+1=12電力客服工單情感分析模型本文以某電力公司客服工單數(shù)據(jù)為研究對象,在深入理解電力業(yè)務(wù)及工單文本語義特點的基礎(chǔ)上,建立了一種電力客服工單情感分析模型。首先,在進行文本預(yù)處理的基礎(chǔ)上,對文本進行分詞處理并且完成關(guān)鍵詞提。蝗缓,采用word2vec訓(xùn)練工單數(shù)據(jù),并基于關(guān)鍵詞進行情感詞典擴充,構(gòu)建電力客服領(lǐng)域?qū)S们楦性~典;最后,進行工單情感傾向性分析。2.1工單文本預(yù)處理由于工單文本數(shù)據(jù)中存在大量價值含量較低甚至沒有價值意義的數(shù)據(jù),在進行分詞、情感分析中會對結(jié)果產(chǎn)生較大的影響,那么在文本挖掘之前就必須先進行文本預(yù)處理,去除大量沒有挖掘意義的工單數(shù)據(jù)。工單文本預(yù)處理工作主要包括:刪除未標注業(yè)務(wù)類型數(shù)據(jù)、分句處理、文本去重、短句刪除等。分句處理:將工單數(shù)據(jù)處理成以句子為最小單位,以句尾標點符號為標志分割,包括“,”,“!?
第11期吳和海,等:一種適用于機組組合優(yōu)化的改進整數(shù)編碼粒子群算法右。這是由于本文采用修復(fù)策略對不可行粒子進行修復(fù),使算法只在可行解區(qū)域內(nèi)搜索最優(yōu)解,有效提高收斂速度;同時相比二進制編碼,本文的整數(shù)編碼方式能有效提高粒子群算法的搜索效率。因此本文提出的整數(shù)編碼粒子群算法更適用于求解大規(guī)模機組組合問題。圖4不同機組規(guī)模的執(zhí)行時間曲線4結(jié)語本文采用整數(shù)編碼粒子群算法來求解機組組合問題。通過整數(shù)編碼方式,用正負整數(shù)分別表示機組開停機時間長度,相比于二進制編碼它能有效減少待優(yōu)化變量個數(shù)。求解過程中針對機組組合問題的特點,采用修補策略處理不滿足約束條件的粒子,使算法只在可行解區(qū)域內(nèi)搜索,通過切除冗余機組提高解的精度。仿真算例表明,相比rICGA,IPSO,SEP,本文提出的ICPSO算法求解大規(guī)模機組組合優(yōu)化問題具有更高的精度,求解時間大幅度減少。參考文獻[1]KAZARLISSA,BAKIRTZISAG,PETRIDISV.Ageneticalgorithmsolutiontotheunitcommitmentproblem[J].IEEEtransactionsonpowersystems,1996,11(1):8392.[2]黎靜華,蘭飛.機組組合問題的模型及算法綜述[J].現(xiàn)代電力,2011,28(6):110.[3]李丹,高立群,王珂,等.電力系統(tǒng)機組組合問題的動態(tài)雙種群粒子群算法[J].計算機應(yīng)用,2008,28(1):104107.[4]張濤,史蘇怡,徐雪琴.基于二進制量子粒子群算法的含分布式電源配電網(wǎng)重構(gòu)[J].電力系統(tǒng)保護與控制,2016,44(4):2228.[5]方源,章桐,陳霏霏,,等.電動車動力總成噪聲品質(zhì)粒子群向量機預(yù)測模型[J].西安交通大學(xué)學(xué)報,2016,50(1):4146.[6]
本文編號:2580854
本文鏈接:http://sikaile.net/guanlilunwen/kehuguanxiguanli/2580854.html
最近更新
教材專著