基于卷積神經(jīng)網(wǎng)絡(luò)結(jié)合詞向量的中文短文本分類(lèi)研究
發(fā)布時(shí)間:2021-12-09 10:36
文本分類(lèi)是自然語(yǔ)言處理領(lǐng)域里用于文本信息處理的關(guān)鍵性技術(shù),主要由文本表示和分類(lèi)模型(算法)組成。在當(dāng)今文本信息極速增長(zhǎng)的時(shí)代,文本分類(lèi)為人們有效、便捷、快速地獲取所需信息發(fā)揮著重大作用。短文本作為文本信息的主要載體之一,具有長(zhǎng)度短、特征稀疏、實(shí)時(shí)性強(qiáng)、格式不規(guī)則等特點(diǎn),從而基于詞袋特征或向量空間的傳統(tǒng)機(jī)器學(xué)習(xí)算法不能有效的提取短文本特征,進(jìn)而影響分類(lèi)效果。深度學(xué)習(xí)算法強(qiáng)大的特征提取能力在文本分類(lèi)中具有獨(dú)特的優(yōu)勢(shì),因此,利用深度學(xué)習(xí)進(jìn)行文本分類(lèi)建模成為當(dāng)前的研究熱點(diǎn)。本文基于卷積神經(jīng)網(wǎng)絡(luò)模型并結(jié)合詞向量的文本表示方法,針對(duì)中文短文本分類(lèi)的相關(guān)技術(shù)點(diǎn)進(jìn)行研究工作,取得的相關(guān)研究成果如下:1、提出一種應(yīng)用于卷積神經(jīng)網(wǎng)絡(luò)文本分類(lèi)的詞向量模型。文本特征提取(文本輸入表示)作為文本分類(lèi)技術(shù)的要點(diǎn),其構(gòu)建質(zhì)量直接影響著分類(lèi)系統(tǒng)的分類(lèi)效果,F(xiàn)在最流行的文本輸入表示——詞向量(Word Vector)雖然考慮了詞語(yǔ)之間的關(guān)聯(lián)性和相似性,但忽略了上下文局部詞序特征,在一些情況下造成文本語(yǔ)義上的缺失和歪曲。為此,本文提出了一種結(jié)合N-Gram特征與Word2vec的詞向量模型WordNG-Vec,其提取出的...
【文章來(lái)源】:重慶理工大學(xué)重慶市
【文章頁(yè)數(shù)】:45 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
向量空間模型
CBOW模型架構(gòu)
Skip-gram模型架構(gòu)
【參考文獻(xiàn)】:
期刊論文
[1]基于吸引子傳播聚類(lèi)的改進(jìn)雙通道CNN短文本分類(lèi)算法[J]. 王儒,劉培玉,王培培. 小型微型計(jì)算機(jī)系統(tǒng). 2017(08)
[2]卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J]. 周飛燕,金林鵬,董軍. 計(jì)算機(jī)學(xué)報(bào). 2017(06)
[3]深度學(xué)習(xí)研究進(jìn)展[J]. 劉建偉,劉媛,羅雄麟. 計(jì)算機(jī)應(yīng)用研究. 2014(07)
[4]深度學(xué)習(xí)的昨天、今天和明天[J]. 余凱,賈磊,陳雨強(qiáng),徐偉. 計(jì)算機(jī)研究與發(fā)展. 2013(09)
[5]文本分類(lèi)綜述[J]. 靳小波. 自動(dòng)化博覽. 2006(S1)
[6]基于機(jī)器學(xué)習(xí)的文本分類(lèi)技術(shù)研究進(jìn)展[J]. 蘇金樹(shù),張博鋒,徐昕. 軟件學(xué)報(bào). 2006(09)
博士論文
[1]基于深度學(xué)習(xí)的文本表示與分類(lèi)方法研究[D]. 閆琰.北京科技大學(xué) 2016
碩士論文
[1]文本分類(lèi)系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D]. 張琛馨.中山大學(xué) 2015
[2]基于機(jī)器學(xué)習(xí)的中文文本分類(lèi)方法研究[D]. 劉依璐.西安電子科技大學(xué) 2009
本文編號(hào):3530493
【文章來(lái)源】:重慶理工大學(xué)重慶市
【文章頁(yè)數(shù)】:45 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
向量空間模型
CBOW模型架構(gòu)
Skip-gram模型架構(gòu)
【參考文獻(xiàn)】:
期刊論文
[1]基于吸引子傳播聚類(lèi)的改進(jìn)雙通道CNN短文本分類(lèi)算法[J]. 王儒,劉培玉,王培培. 小型微型計(jì)算機(jī)系統(tǒng). 2017(08)
[2]卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J]. 周飛燕,金林鵬,董軍. 計(jì)算機(jī)學(xué)報(bào). 2017(06)
[3]深度學(xué)習(xí)研究進(jìn)展[J]. 劉建偉,劉媛,羅雄麟. 計(jì)算機(jī)應(yīng)用研究. 2014(07)
[4]深度學(xué)習(xí)的昨天、今天和明天[J]. 余凱,賈磊,陳雨強(qiáng),徐偉. 計(jì)算機(jī)研究與發(fā)展. 2013(09)
[5]文本分類(lèi)綜述[J]. 靳小波. 自動(dòng)化博覽. 2006(S1)
[6]基于機(jī)器學(xué)習(xí)的文本分類(lèi)技術(shù)研究進(jìn)展[J]. 蘇金樹(shù),張博鋒,徐昕. 軟件學(xué)報(bào). 2006(09)
博士論文
[1]基于深度學(xué)習(xí)的文本表示與分類(lèi)方法研究[D]. 閆琰.北京科技大學(xué) 2016
碩士論文
[1]文本分類(lèi)系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D]. 張琛馨.中山大學(xué) 2015
[2]基于機(jī)器學(xué)習(xí)的中文文本分類(lèi)方法研究[D]. 劉依璐.西安電子科技大學(xué) 2009
本文編號(hào):3530493
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3530493.html
最近更新
教材專(zhuān)著