基于fastText的股票咨詢(xún)案例中文短文本分類(lèi)技術(shù)
發(fā)布時(shí)間:2021-09-24 01:15
目的利用詞向量與文本分類(lèi)模型fastText來(lái)提高股票咨詢(xún)短文本的分類(lèi)質(zhì)量。方法首先在輸入層上通過(guò)fastText將輸入的詞序列轉(zhuǎn)化為詞向量進(jìn)行輸入,然后在隱藏層上通過(guò)單層神經(jīng)網(wǎng)絡(luò)學(xué)習(xí),最后在輸出層上使用層次softmax對(duì)標(biāo)簽進(jìn)行編碼,計(jì)算詞序列與每個(gè)標(biāo)簽的對(duì)應(yīng)概率,輸出詞序列屬于不同標(biāo)簽的概率值。結(jié)果實(shí)驗(yàn)結(jié)果表明,基于fastText的股票咨詢(xún)案例的短文本分類(lèi)準(zhǔn)確率高于傳統(tǒng)的基于樸素貝葉斯(Naive Bayesian)的短文本分類(lèi)技術(shù)。結(jié)論將fastText用于股票咨詢(xún)案例中文短文本分類(lèi)可以有效地提高案例短文本分類(lèi)結(jié)果的質(zhì)量。
【文章來(lái)源】:寶雞文理學(xué)院學(xué)報(bào)(自然科學(xué)版). 2020,40(03)
【文章頁(yè)數(shù)】:5 頁(yè)
【部分圖文】:
fastText模型體系結(jié)構(gòu)圖
圖2給出了基于fastText的股票咨詢(xún)案例中文短文本分類(lèi)的流程圖。從圖2中可以看出,分類(lèi)過(guò)程主要可分為4個(gè)步驟:(1)文本預(yù)處理;(2)fastText分類(lèi)器訓(xùn)練;(3)fastText文本類(lèi)別預(yù)測(cè);(4)案例歸類(lèi)。(1)文本預(yù)處理
本文編號(hào):3406803
【文章來(lái)源】:寶雞文理學(xué)院學(xué)報(bào)(自然科學(xué)版). 2020,40(03)
【文章頁(yè)數(shù)】:5 頁(yè)
【部分圖文】:
fastText模型體系結(jié)構(gòu)圖
圖2給出了基于fastText的股票咨詢(xún)案例中文短文本分類(lèi)的流程圖。從圖2中可以看出,分類(lèi)過(guò)程主要可分為4個(gè)步驟:(1)文本預(yù)處理;(2)fastText分類(lèi)器訓(xùn)練;(3)fastText文本類(lèi)別預(yù)測(cè);(4)案例歸類(lèi)。(1)文本預(yù)處理
本文編號(hào):3406803
本文鏈接:http://sikaile.net/jingjilunwen/touziyanjiulunwen/3406803.html
最近更新
教材專(zhuān)著