基于BERT的在線評(píng)論隱性特征識(shí)別方法研究
【文章頁數(shù)】:62 頁
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖1.1文章組織架構(gòu)圖
下圖1.1為本文的文章組織結(jié)構(gòu)圖。第一節(jié)特征級(jí)別觀點(diǎn)挖掘研究現(xiàn)狀
圖3.1模型整體流程圖
本文中構(gòu)建的隱性特征識(shí)別模型,主要是由數(shù)據(jù)預(yù)處理、基于BERT和CRF的觀點(diǎn)內(nèi)容提取、構(gòu)建特征類指示詞表、基于BERT-AV(BERT-AspectVector)的隱性特征類識(shí)別四部分構(gòu)成,模型的框架如圖3.1所示。在線評(píng)論通過數(shù)據(jù)預(yù)處理后,輸入到BERT-CRF的觀點(diǎn)提取模型....
圖3.2基于BERT-CRF的觀點(diǎn)提取
本節(jié)中介紹的觀點(diǎn)內(nèi)容抽取,是通過序列標(biāo)注識(shí)別出評(píng)論中所包含的一個(gè)或多個(gè)觀點(diǎn)內(nèi)容。在BERT最后輸出上加入CRF層,CRF能夠約束標(biāo)簽之間的關(guān)系,統(tǒng)計(jì)類別轉(zhuǎn)移概率能夠保證預(yù)測的序列標(biāo)簽符合規(guī)則。CRF層可以在訓(xùn)練過程中學(xué)習(xí)到標(biāo)簽內(nèi)的約束關(guān)系,減少錯(cuò)誤的預(yù)測序列出現(xiàn)。圖3.2描述的即....
圖3.3BERT模型結(jié)構(gòu)圖
輸出層位于多層隱藏層的后一層,其主要作用是獲取[CLS]標(biāo)記對(duì)應(yīng)的表示作為整個(gè)序列的表示,并且返回多層隱藏層所獲得的所有標(biāo)記表示。在BERT的輸出中,通常是根據(jù)下游任務(wù)的需要選取輸出的表示。由于BERT具有多層Transformer層,每層都可以捕獲到不同的特征信息,在不同任務(wù)下....
本文編號(hào):3894208
本文鏈接:http://sikaile.net/jingjilunwen/gongyejingjilunwen/3894208.html