天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 計算機應(yīng)用論文 >

基于卷積神經(jīng)網(wǎng)絡(luò)的文本分類算法研究

發(fā)布時間:2024-03-06 06:17
  隨著信息技術(shù)的發(fā)展,互聯(lián)網(wǎng)數(shù)據(jù)及資源呈現(xiàn)海量特征,文本信息也正爆炸式的增長。如何快速準(zhǔn)確的從海量的數(shù)據(jù)中篩選出所需的資料和信息,文本分類在內(nèi)容信息過濾篩選和自然語言處理等領(lǐng)域都發(fā)揮著非常重要的作用。本文基于CNN文本分類模型做了大量的研究與改進探索,提出了兩種切實可行的改進算法,并進行了大量的實驗分析。首先,針對互聯(lián)網(wǎng)短文本具有長度短、特征稀疏以及上下文依賴性強等特點,提出了一種基于字符級嵌入的卷積神經(jīng)網(wǎng)絡(luò)和長短時記憶網(wǎng)絡(luò)相結(jié)合的神經(jīng)網(wǎng)絡(luò)模型進行短文本的分類。該模型集成了高速公路網(wǎng)絡(luò)框架,用于緩解深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練時的困難,提高分類的準(zhǔn)確性。通過對幾種數(shù)據(jù)集的測試,結(jié)果表明提出的模型在短文本分類任務(wù)中優(yōu)于傳統(tǒng)模型和其他基于CNN的分類模型。其次,針對經(jīng)典CNN句子分類模型在處理較長文本任務(wù)中的缺陷,保存CNN模型并行化的優(yōu)勢,借助LSTM的門控機制,改進了多層神經(jīng)網(wǎng)絡(luò)中層與層之間的聯(lián)系,進一步優(yōu)化文本的語義表示。提出一種基于門控卷積神經(jīng)網(wǎng)絡(luò)的文本分類算法。實驗表明,該算法在中英文數(shù)據(jù)集上都能有效提升其在文本分類任務(wù)中的性能。最后,在上述字符級嵌入文本分類算法研究的基礎(chǔ)上,本文進一步研究了...

【文章頁數(shù)】:84 頁

【學(xué)位級別】:碩士

【部分圖文】:

圖3準(zhǔn)確率對比情況

圖3準(zhǔn)確率對比情況

第44卷第7期殷亞博,楊文忠,楊慧婷,等:基于卷積神經(jīng)網(wǎng)絡(luò)和KNN的短文本分類算法研究圖3準(zhǔn)確率對比情況圖4召回率對比情況圖5F1值對比情況由表5可知,從分類準(zhǔn)確率上來看,CNN算法除了在數(shù)據(jù)集DBMC-1上分類效果比CKNN算法的分類效果明顯好之外,在剩下的數(shù)據(jù)集中兩者的分類效....


圖4召回率對比情況

圖4召回率對比情況

第44卷第7期殷亞博,楊文忠,楊慧婷,等:基于卷積神經(jīng)網(wǎng)絡(luò)和KNN的短文本分類算法研究圖3準(zhǔn)確率對比情況圖4召回率對比情況圖5F1值對比情況由表5可知,從分類準(zhǔn)確率上來看,CNN算法除了在數(shù)據(jù)集DBMC-1上分類效果比CKNN算法的分類效果明顯好之外,在剩下的數(shù)據(jù)集中兩者的分類效....


圖2.4支持向量機??Fi2.4?Suort?vector?machines??

圖2.4支持向量機??Fi2.4?Suort?vector?machines??

?基于多粒度特征表示及循環(huán)卷積神經(jīng)網(wǎng)絡(luò)的短文本分類研究??圖2.3反向傳播算法圖??Fig?2.3?Back?propagation?algorithm?diagram??2.3.6支持向量機??支持向量機最初是由Vapnik等人提出的學(xué)習(xí)模型KIWI,?JoachimsNl于1....


圖2-3向量空間模型

圖2-3向量空間模型

圖2-3向量空間模型Figure2-3Vectorspacemode,VSM空間模型如圖2-3所示。設(shè)D為一個包含m個文的特征向量,則有D=,T=區(qū)間,(==)為文檔....



本文編號:3920681

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3920681.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶88cc1***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com