天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于深度學(xué)習(xí)的中文網(wǎng)購評論中產(chǎn)品特征挖掘

發(fā)布時間:2020-05-04 18:02
【摘要】:隨著電子商務(wù)系統(tǒng)評價體系的完善,網(wǎng)購評論的內(nèi)容對消費者的購物行為起到越來越重要的指導(dǎo)作用。網(wǎng)購評論客觀體現(xiàn)了消費者對商家服務(wù)態(tài)度、售后服務(wù)和商品質(zhì)量、外觀、尺寸等方面的評價。消費者可以根據(jù)評論總體把握商品以及商家的優(yōu)點和缺點,并能通過評論數(shù)據(jù)根據(jù)自己的喜好挑選商品;同時商家可以根據(jù)評論改善自己在店鋪運營上存在的問題及時發(fā)現(xiàn)商品中存在的瑕疵,并根據(jù)消費者的喜好及時補充口碑好的商品。本文主要實現(xiàn)自動化抽取商品評論中的商品特征以及特征對應(yīng)的評價,這樣可以更加直觀的體現(xiàn)商品各方面的優(yōu)劣以及用戶的偏好。對于文本序列中重要信息的抽取屬于自然語言處理領(lǐng)域的信息抽取任務(wù);谏疃葘W(xué)習(xí)實現(xiàn)序列預(yù)測模型對文本評論中的商品特征和特征對應(yīng)的評價進行抽取,從而避免人工總結(jié)復(fù)雜的特征規(guī)則,模型同時具有商品領(lǐng)域普適性,可以適用于多種商品類別。據(jù)此本文具體做了以下幾項工作:(1)由于自注意力(Self-Attention)機制在序列建模過程之中可以捕捉任意絕對位置和相對位置的依賴關(guān)系,所以本文提出利用Transformer模型的編碼器模塊構(gòu)造LSTM-ATT-CRF信息抽取模型,在LSTM-CRF模型中加入自注意力機制彌補循環(huán)神經(jīng)網(wǎng)絡(luò)中梯度消失帶來的文本上下文依賴信息的損失,增強模型對上下文信息記憶能力。(2)本文從基于字符級別的字向量和詞匯級別的詞向量兩個方面進行建模,探究在商品特征及其評價信息抽取的最好實現(xiàn)方式。由實驗可得基于字符級和詞匯級的模型在商品特征抽取上存在差異,由于特征對應(yīng)的評價表達方式多樣,基于字符級別模型表現(xiàn)優(yōu)于基于詞匯級的模型,這主要是由于特征對應(yīng)評價的表達方式多樣,基于詞匯級別模型中在進行中文分詞階段遇到了瓶頸。(3)在評論中商品特征多為名詞,特征對應(yīng)的評價多為形容詞,在此背景下本文首次提出將詞性等類別特征通過二進制編碼和線性變換的方式轉(zhuǎn)化成分布式向量表示,并在基于詞匯級別建模中起到了提高名詞和形容詞識別率的作用。
【圖文】:

原理圖,隱馬爾可夫模型,原理圖,齊次


隱馬爾可夫模型由出初始化概率71,各狀態(tài)之間的概率轉(zhuǎn)移矩陣兒有當(dāng)前逡逑狀態(tài)生成當(dāng)前觀測[41]的發(fā)射概率矩陣B決定。隱馬爾可夫模型人可以由71、4、S三逡逑元組表示,即A邋=邋01,5,?0,圖2.1展示了隱馬爾可夫模型的原理。逡逑h邐h邐h邐h+i邐h+2逡逑V邐>邋r邐>邋r邐V邐>邋r逡逑圖2.邋1隱馬爾可夫模型原理圖逡逑隱馬爾可夫模型服從齊次馬爾可夫性和觀測獨立性兩個基本假設(shè)[41],齊次馬逡逑爾科夫性表示為當(dāng)前時刻的狀態(tài)只由前一時刻的狀態(tài)有關(guān)和更早時刻的狀態(tài)無逡逑8逡逑

原理圖,隨機場模型,條件,原理圖


X邋=邋(x1(x2,-,xn)逡逑圖2.3線性鏈條件隨機場逡逑由于概率無向圖中最大團上勢函數(shù)的乘積可以表示無向圖的聯(lián)合概率分布,逡逑線性鏈條件隨機場中相鄰的兩個節(jié)點恰巧構(gòu)成了最大團,所以Y的概率可由逡逑的兩個節(jié)點是勢函數(shù)乘積表示。逡逑P(y\x)邋=邋-^exp^khtkQyi-vyuXA)+邋1,1,1^邋(y£,,A:,0)邋(2.19)逡逑,逡逑Z(.x)邋=邋Y.y邋ex邋p0,i邋h邋h(yi-i.邋y0邋X,邋0邋+邋Sy邋liiSiiyi,x,邋0)邋(2.20)逡逑為i邋-邋1到i之間的標(biāo)記轉(zhuǎn)移特征函數(shù), ̄為序列當(dāng)前時刻的狀態(tài)特征函數(shù),逡逑N戲直鷂卣魅ㄖ兀

本文編號:2648780

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/jingjilunwen/guojimaoyilunwen/2648780.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶a2a7e***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com