基于卷積神經(jīng)網(wǎng)絡(luò)的短文本表示與分類研究
發(fā)布時(shí)間:2021-12-10 05:55
隨著互聯(lián)網(wǎng)的高速發(fā)展,文本數(shù)據(jù)的產(chǎn)生量也呈急劇增加的趨勢(shì),尤其是社交和購(gòu)物等終端產(chǎn)生的短文本更是量多類雜,海量的短文本數(shù)據(jù)給自然語(yǔ)言處理研究方向提供了大量的數(shù)據(jù),同時(shí)也給文本分類等研究帶來(lái)了巨大挑戰(zhàn)。本文致力于研究自然語(yǔ)言處理中的短文本分類任務(wù),力圖提高短文本分類的準(zhǔn)確度。文本分類任務(wù)主要分為長(zhǎng)文本分類和短文本分類。在處理短文本分類任務(wù)時(shí),由于文本具有文本長(zhǎng)度短、特征高稀疏、句子語(yǔ)義表達(dá)較差等特點(diǎn),所以運(yùn)用傳統(tǒng)的基于統(tǒng)計(jì)語(yǔ)言學(xué)技術(shù)處理短文本遇到了很多困難,例如受短文本開(kāi)放性強(qiáng)的影響,傳統(tǒng)的詞語(yǔ)編碼不能有效的進(jìn)行高質(zhì)量編碼;由于短文本語(yǔ)義性較差,所以在通過(guò)傳統(tǒng)的文檔表示模型處理短文本時(shí)往往效果欠佳等。針對(duì)短文本分類的諸多困難,本文主要從以下三個(gè)方面進(jìn)行研究:(1)研究詞向量編碼方式,分別采用密度峰值聚類算法和吸引子傳播聚類算法對(duì)詞向量進(jìn)行聚類。首先采用人工神經(jīng)網(wǎng)絡(luò)對(duì)詞語(yǔ)通過(guò)詞嵌入的方式進(jìn)行編碼,進(jìn)而對(duì)文本詞語(yǔ)編碼方式進(jìn)行改進(jìn);然后對(duì)訓(xùn)練好的詞向量進(jìn)行聚類處理,聚類處理旨在減少噪聲干擾對(duì)分類模型的影響;最終通過(guò)聚類得到的詞典庫(kù)具有更佳的編碼規(guī)范性。(2)研究卷積神經(jīng)網(wǎng)絡(luò)分類模型,提出一種新...
【文章來(lái)源】:山東師范大學(xué)山東省
【文章頁(yè)數(shù)】:40 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
NNLM模型結(jié)構(gòu)示意圖
決策圖
【參考文獻(xiàn)】:
期刊論文
[1]基于類別特征改進(jìn)的KNN短文本分類算法[J]. 黃賢英,熊李媛,劉英濤,李沁東. 計(jì)算機(jī)工程與科學(xué). 2018(01)
[2]基于詞向量和情感本體的短文本情感分類[J]. 王正成,李丹丹. 浙江理工大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版). 2018(01)
[3]基于深度學(xué)習(xí)的短文本評(píng)論產(chǎn)品特征提取及情感分類研究[J]. 李杰,李歡. 情報(bào)理論與實(shí)踐. 2018(02)
[4]基于SVM的高維混合特征短文本情感分類[J]. 王義真,鄭嘯,后盾,胡昊. 計(jì)算機(jī)技術(shù)與發(fā)展. 2018(02)
[5]基于word embedding的短文本特征擴(kuò)展與分類[J]. 孟欣,左萬(wàn)利. 小型微型計(jì)算機(jī)系統(tǒng). 2017(08)
[6]短文本理解研究[J]. 王仲遠(yuǎn),程健鵬,王海勛,文繼榮. 計(jì)算機(jī)研究與發(fā)展. 2016(02)
[7]基于聚類改進(jìn)的KNN文本分類算法[J]. 周慶平,譚長(zhǎng)庚,王宏君,湛淼湘. 計(jì)算機(jī)應(yīng)用研究. 2016(11)
[8]一種改進(jìn)的短文本層次聚類算法[J]. 李天彩,席耀一,王波,張佳明. 信息工程大學(xué)學(xué)報(bào). 2015(06)
[9]基于卷積神經(jīng)網(wǎng)絡(luò)的微博情感傾向性分析[J]. 劉龍飛,楊亮,張紹武,林鴻飛. 中文信息學(xué)報(bào). 2015(06)
[10]Word2vec的工作原理及應(yīng)用探究[J]. 周練. 科技情報(bào)開(kāi)發(fā)與經(jīng)濟(jì). 2015(02)
博士論文
[1]基于深度學(xué)習(xí)的文本表示與分類方法研究[D]. 閆琰.北京科技大學(xué) 2016
[2]基于深度學(xué)習(xí)的短文本分析與計(jì)算方法研究[D]. 李巖.北京科技大學(xué) 2016
[3]文本分類關(guān)鍵技術(shù)及應(yīng)用研究[D]. 鳳麗洲.吉林大學(xué) 2015
碩士論文
[1]中文文本聚類關(guān)鍵技術(shù)研究[D]. 邵明來(lái).廣西大學(xué) 2015
[2]基于密度的層次聚類算法研究[D]. 張文開(kāi).中國(guó)科學(xué)技術(shù)大學(xué) 2015
[3]基于詞向量的短文本分類方法研究[D]. 江大鵬.浙江大學(xué) 2015
[4]中文短文本分類技術(shù)的研究與實(shí)現(xiàn)[D]. 熊大康.安徽大學(xué) 2014
[5]基于復(fù)雜網(wǎng)絡(luò)的中文文本分類研究[D]. 趙輝.西安電子科技大學(xué) 2014
[6]面向文本分類的特征提取算法研究[D]. 彭君睿.北京郵電大學(xué) 2014
[7]基于聽(tīng)覺(jué)圖像的音樂(lè)流派自動(dòng)分類系統(tǒng)研究[D]. 李秋穎.天津大學(xué) 2012
本文編號(hào):3532031
【文章來(lái)源】:山東師范大學(xué)山東省
【文章頁(yè)數(shù)】:40 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
NNLM模型結(jié)構(gòu)示意圖
決策圖
【參考文獻(xiàn)】:
期刊論文
[1]基于類別特征改進(jìn)的KNN短文本分類算法[J]. 黃賢英,熊李媛,劉英濤,李沁東. 計(jì)算機(jī)工程與科學(xué). 2018(01)
[2]基于詞向量和情感本體的短文本情感分類[J]. 王正成,李丹丹. 浙江理工大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版). 2018(01)
[3]基于深度學(xué)習(xí)的短文本評(píng)論產(chǎn)品特征提取及情感分類研究[J]. 李杰,李歡. 情報(bào)理論與實(shí)踐. 2018(02)
[4]基于SVM的高維混合特征短文本情感分類[J]. 王義真,鄭嘯,后盾,胡昊. 計(jì)算機(jī)技術(shù)與發(fā)展. 2018(02)
[5]基于word embedding的短文本特征擴(kuò)展與分類[J]. 孟欣,左萬(wàn)利. 小型微型計(jì)算機(jī)系統(tǒng). 2017(08)
[6]短文本理解研究[J]. 王仲遠(yuǎn),程健鵬,王海勛,文繼榮. 計(jì)算機(jī)研究與發(fā)展. 2016(02)
[7]基于聚類改進(jìn)的KNN文本分類算法[J]. 周慶平,譚長(zhǎng)庚,王宏君,湛淼湘. 計(jì)算機(jī)應(yīng)用研究. 2016(11)
[8]一種改進(jìn)的短文本層次聚類算法[J]. 李天彩,席耀一,王波,張佳明. 信息工程大學(xué)學(xué)報(bào). 2015(06)
[9]基于卷積神經(jīng)網(wǎng)絡(luò)的微博情感傾向性分析[J]. 劉龍飛,楊亮,張紹武,林鴻飛. 中文信息學(xué)報(bào). 2015(06)
[10]Word2vec的工作原理及應(yīng)用探究[J]. 周練. 科技情報(bào)開(kāi)發(fā)與經(jīng)濟(jì). 2015(02)
博士論文
[1]基于深度學(xué)習(xí)的文本表示與分類方法研究[D]. 閆琰.北京科技大學(xué) 2016
[2]基于深度學(xué)習(xí)的短文本分析與計(jì)算方法研究[D]. 李巖.北京科技大學(xué) 2016
[3]文本分類關(guān)鍵技術(shù)及應(yīng)用研究[D]. 鳳麗洲.吉林大學(xué) 2015
碩士論文
[1]中文文本聚類關(guān)鍵技術(shù)研究[D]. 邵明來(lái).廣西大學(xué) 2015
[2]基于密度的層次聚類算法研究[D]. 張文開(kāi).中國(guó)科學(xué)技術(shù)大學(xué) 2015
[3]基于詞向量的短文本分類方法研究[D]. 江大鵬.浙江大學(xué) 2015
[4]中文短文本分類技術(shù)的研究與實(shí)現(xiàn)[D]. 熊大康.安徽大學(xué) 2014
[5]基于復(fù)雜網(wǎng)絡(luò)的中文文本分類研究[D]. 趙輝.西安電子科技大學(xué) 2014
[6]面向文本分類的特征提取算法研究[D]. 彭君睿.北京郵電大學(xué) 2014
[7]基于聽(tīng)覺(jué)圖像的音樂(lè)流派自動(dòng)分類系統(tǒng)研究[D]. 李秋穎.天津大學(xué) 2012
本文編號(hào):3532031
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3532031.html
最近更新
教材專著