天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于深度神經網絡的長文本分類算法的設計與實現

發(fā)布時間:2023-04-06 23:14
  文本分類是自然語言處理中的基本技術之一,許多研究都與文本分類有關,例如新聞主題分類、問答系統(tǒng)分類和電影評論分類等。如果依靠人工進行文本分類,不僅耗時長,而且效率低下,所以利用現有的計算機技術進行自動文本分類是非常重要的研究方向。本文主要研究了兩大類文本分類的方法,一類是利用傳統(tǒng)的機器學習方法進行文本分類,另一類是使用深度學習方法進行文本分類。首先本文基于傳統(tǒng)的機器學習方法設計了兩種分類器,一種是樸素貝葉斯分類器,另一種是支持向量機分類器。計算機不能處理文本,因此需要把文本表示成向量后才可以進行分類。這兩種分類器采用的是基于詞袋的詞頻映射方法和詞頻-逆文檔頻率特征表示的方法。在搜狗數據集和搜狐數據集上進行了實驗驗證,最終發(fā)現使用SVM分類器與TF-IDF特征相結合的文本分類器效果最好,在兩個數據集上都達到了89%的準確率。接下來使用深度神經網絡設計了兩種文本分類模型,一種是使用標準的雙向長短時記憶網絡進行文本分類,另一種是將其與attention機制相結合進行文本分類。文本表示方法采用的是one-hot表示方法和基于skip-gram的詞嵌入方法。最終在兩個數據集上進行實驗發(fā)現,Bi L...

【文章頁數】:70 頁

【學位級別】:碩士

【文章目錄】:
摘要
Abstract
專用術語注釋表
第一章 緒論
    1.1 研究背景與意義
    1.2 研究現狀
        1.2.1 文本表示發(fā)展史
        1.2.2 文本分類的發(fā)展史
    1.3 論文的主要研究內容
    1.4 論文的組織架構
第二章 相關背景知識介紹
    2.1 文本預處理
        2.1.1 中文分詞
        2.1.2 去除停用詞
        2.1.3 文本表示
    2.2 樸素貝葉斯原理
    2.3 支持向量機
        2.3.1 線性分類
        2.3.2 線性不可分
        2.3.3 支持向量機輸出概率
    2.4 循環(huán)神經網絡
        2.4.1 循環(huán)神經網絡概念模型
        2.4.2 數學模型
        2.4.3 長短時記憶網絡
    2.5 卷積神經網絡
        2.5.1 輸入層
        2.5.2 卷積層
        2.5.3 池化層
        2.5.4 激活層
        2.5.5 全連接層
    2.6 本章總結
第三章 基于傳統(tǒng)機器學習方法進行文本分類
    3.1 文本分詞與去除停用詞
    3.2 詞向量表示
        3.2.1 詞頻映射
        3.2.2 詞頻-逆文檔特征
    3.3 樸素貝葉斯分類
    3.4 支持向量機分類
        3.4.1 一對多支持向量機分類
        3.4.2 一對一支持向量機分類
        3.4.3 支持向量機分類模型
    3.5 實驗結果分析
        3.5.1 實驗數據
        3.5.2 實驗評測標準
        3.5.3 實驗結果
    3.6 本章總結
第四章 基于循環(huán)神經網絡的文本分類
    4.1 文本表示
        4.1.1 One-Hot表示
        4.1.2 分布式詞向量
    4.2 雙向長短時記憶網絡
    4.3 Attention機制
    4.4 文本分類模型
        4.4.1 基于雙向長短時記憶網絡的文本分類算法
        4.4.2 基于雙向長短時記憶網絡與Attention機制相結合的文本分類算法
    4.5 實驗結果
        4.5.1 詞向量表示
        4.5.2 分類結果
    4.6 本章總結
第五章 基于卷積神經網絡的文本分類
    5.1 雙向編碼器模型
        5.1.1 預測掩蓋詞
        5.1.2 語句對預測
    5.2 卷積神經網絡分類模型
    5.3 實驗結果
    5.4 本章小結
第六章 總結與展望
    6.1 總結
    6.2 展望
參考文獻
附錄1 程序清單
附錄2 攻讀碩士學位期間撰寫的論文
附錄3 攻讀碩士學位期間申請的專利
附錄4 攻讀碩士學位期間參加的科研項目
致謝



本文編號:3784601

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3784601.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶1080f***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com