天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 自動化論文 >

基于字符級卷積神經(jīng)網(wǎng)絡的中文文本分類研究

發(fā)布時間:2022-07-20 15:52
  隨著移動互聯(lián)網(wǎng)迅猛發(fā)展,移動端網(wǎng)民的爆發(fā)式增長使得每一個人都可以成為一個小型的自媒體,其內(nèi)容也主要以文本的形式而傳播,形成了一個以內(nèi)容為主的新信息時代。每天都有數(shù)億計的內(nèi)容在各個平臺上產(chǎn)生,如新聞內(nèi)容、自媒體文章、產(chǎn)品評論等,如何將這些內(nèi)容利用起來,挖掘出其潛在價值是自然語言處理的重要任務目標。文本分類作為其中首要的一個任務,在于將這些文本分類到預先指定的類別之中,使得減輕工作人員的負擔。但是現(xiàn)如今的文本內(nèi)容中或多或少的會出現(xiàn)內(nèi)容不規(guī)范、出現(xiàn)錯別字等拼寫錯誤的情況,使得基于使用詞語作為文本的特征的模型出現(xiàn)分類效果降低。使用基于詞語作為特征的模型同樣會受到分詞步驟的影響,分詞的好壞在一定程度上決定了最終分類結(jié)果的好壞。同樣隨著移動端設備數(shù)量的增長,移動設備存在各方面諸如內(nèi)存的限制,如何將其實際應用落地到移動端也是一個亟待解決的問題。基于以上考慮,在本文中對基于字符級別的卷積神經(jīng)網(wǎng)絡模型做了研究,概括如下:用于中文字符表示的編碼方式特點分析。用于中文字符表示的編碼方式有拼音編碼、UTF-8編碼、圖片編碼、隨機字符嵌入向量以及預訓練字符嵌入向量五種方式。文中對這五種字符的表示方式進行了全方位... 

【文章頁數(shù)】:52 頁

【學位級別】:碩士

【文章目錄】:
摘要
Abstract
第1章 緒論
    1.1 研究背景及意義
    1.2 文本分類研究現(xiàn)狀
    1.3 論文的研究內(nèi)容
    1.4 論文的結(jié)構安排
第2章 相關理論介紹
    2.1 文本特征的向量表示方式
        2.1.1 布爾模型
        2.1.2 向量空間模型
        2.1.3 嵌入向量模型
    2.2 傳統(tǒng)文本分類方法
        2.2.1 樸素貝葉斯分類器
        2.2.2 k近鄰學習
        2.2.3 支持向量機方法
    2.3 深度學習中的文本分類方法
        2.3.1 M-P神經(jīng)元
        2.3.2 多層感知機
        2.3.3 循環(huán)神經(jīng)網(wǎng)絡
        2.3.4 卷積神經(jīng)網(wǎng)絡
    2.4 本章小結(jié)
第3章 中文表示方法與字符級卷積神經(jīng)網(wǎng)絡
    3.1 詞級別表示方法
    3.2 字級別表示方法
        3.2.1 拼音編碼方式
        3.2.2 UTF-8編碼方式
        3.2.3 圖片編碼方式
        3.2.4 隨機字符嵌入向量
    3.3 預訓練中文字符嵌入向量
        3.3.1 Skip-gram模型
        3.3.2 單獨學習漢字嵌入向量的預訓練方式
        3.3.3 共同學習漢字與詞語嵌入向量的預訓練方式
    3.4 字符嵌入向量學習結(jié)果展示
    3.5 不同字符表示方式的映射層
    3.6 字符級卷積神經(jīng)網(wǎng)絡模型設計
    3.7 本章小結(jié)
第4章 實驗與結(jié)果分析
    4.1 實驗環(huán)境
    4.2 數(shù)據(jù)集與預處理
    4.3 實驗結(jié)果及分析
        4.3.1 實驗結(jié)果
        4.3.2 結(jié)果分析
    4.4 本章小結(jié)
第5章 結(jié)論
參考文獻
在學研究成果
致謝


【參考文獻】:
期刊論文
[1]基于卷積神經(jīng)網(wǎng)絡的互聯(lián)網(wǎng)短文本分類方法[J]. 郭東亮,劉小明,鄭秋生.  計算機與現(xiàn)代化. 2017(04)
[2]分段卷積神經(jīng)網(wǎng)絡在文本情感分析中的應用[J]. 杜昌順,黃磊.  計算機工程與科學. 2017(01)



本文編號:3664283

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3664283.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶68c08***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com