天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 軟件論文 >

基于注意力和殘差連接的BiLSTM-CNN文本分類

發(fā)布時間:2024-06-29 00:09
  互聯(lián)網(wǎng)和移動互聯(lián)網(wǎng)應用的快速發(fā)展帶來了文本數(shù)據(jù)的爆炸式增長,使用人工方式分類和整理文本已經(jīng)成為了不可能。如何在海量的文本數(shù)據(jù)中實現(xiàn)對文本的快速分類并應用于后續(xù)的文章推薦、語義分析、信息檢索、信息抽取和機器翻譯一直是業(yè)界研究的熱點。隨著深度學習技術(shù)的不斷發(fā)展,越來越多的學者將深度學習技術(shù)應用到自然語言領域中,也取得了非常不錯的效果。但是,現(xiàn)有的算法往往無法準確的表達文本信息以及在深層網(wǎng)絡時會出現(xiàn)網(wǎng)絡退化問題。本文在分析已有文本分類算法基礎上,主要研究工作如下:本文針對在文本分類中使用高維度的文本詞向量在訓練中難以收斂。對預處理后的文本語料使用word2vec算法進行預訓練。將得到的向量化文本數(shù)據(jù)作為整個分類模型的輸入,避免了出現(xiàn)維度災難,也加快了模型的收斂。本文針對基于深度學習技術(shù)的文本分類算法中卷積神經(jīng)網(wǎng)絡(CNN)無法獲取文本全局特征、雙向循環(huán)神經(jīng)網(wǎng)絡(BiLSTM)無法聚焦文本局部特征的問題,本文將CNN與BiLSTM進行結(jié)合,在提取文本特征信息時,既可以通過CNN網(wǎng)絡提取文本局部特征,又可以通過BiLSTM網(wǎng)絡提取文本全局特征,解決了文本分類中特征提取問題。本文針對文本中不同單詞...

【文章頁數(shù)】:68 頁

【學位級別】:碩士

【部分圖文】:

圖2-1文本分類一般流程

圖2-1文本分類一般流程

圖2-1文本分類一般流程-1Textclassificationgeneralp用中,由于文本信息的非包括非法字符去除、特殊處理后的文本信息轉(zhuǎn)換成向量化后的文本矩陣和文續(xù)訓練和學習。型在測試文本數(shù)據(jù)集的表化,需要對用于實驗的語預處理方法,主要包括非


圖2-2決策樹實例Fig.2-2Decisiontreeinstance

圖2-2決策樹實例Fig.2-2Decisiontreeinstance

第二章預處理和相關理論基礎算法等。然后,將該樣本對所用的樣本進行相似度計算,找到計算結(jié)果最。最后,這K個文本數(shù)據(jù)通過等權(quán)投票的方法來決定該文本的類別。由上述可知,使用KNN算法對文本分類的核心是計算文本之間的相似度和設置。因此,KNN算法不適合樣本量過大的情形,并且在....


圖2-3支持向量機Fig.2-3SupportVectorMachines

圖2-3支持向量機Fig.2-3SupportVectorMachines

1()1()ikiginiDD1212(,)()()DDginiDAginiDginiDDD向量機算法理二分類問題的支持向量機(SVM)算法[48],在分類問題上是在樣本空間中找到一個分隔最大的分類超平面,通過分類。后來的學者在....


圖2-4非監(jiān)督的深度學習模型結(jié)構(gòu)

圖2-4非監(jiān)督的深度學習模型結(jié)構(gòu)

訓練的樣本數(shù)據(jù)是沒有進行標注的。其結(jié)構(gòu)如圖2-4所示,常見的如,自編碼機和玻爾茲曼機等。圖2-4非監(jiān)督的深度學習模型結(jié)構(gòu)Fig.2-4Unsuperviseddeeplearningmodelstructure在監(jiān)督的深度學習模型中,使用低層次的網(wǎng)絡來構(gòu)造更高層次....



本文編號:3996868

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3996868.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶50100***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com