天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 計算機應(yīng)用論文 >

基于深度學(xué)習(xí)的新聞文本分類系統(tǒng)研究與實現(xiàn)

發(fā)布時間:2023-04-26 19:11
  隨著互聯(lián)網(wǎng)科技的迅猛發(fā)展和社交媒體的爆炸式增長,持續(xù)不斷地產(chǎn)生海量信息,其中文本信息數(shù)量最大。新聞標(biāo)題和即時消息等各種中文短文本信息的主要特點是稀疏性,僅由幾個到幾十個單詞組成,有效信息包含量非常少,導(dǎo)致特征稀疏和特征集維度很高的樣本很難為文本分類學(xué)習(xí)提供關(guān)鍵和準(zhǔn)確的特征。本文主要研究深度學(xué)習(xí)在中文文本分類領(lǐng)域的應(yīng)用,提出了基于單詞級和字符級混合特征的文本分類模型。根據(jù)中文文本分析流程,結(jié)合改進(jìn)的文本分類模型,設(shè)計了一套新聞文本分類原型系統(tǒng),開發(fā)了新聞短文本分類系統(tǒng)平臺。具體工作內(nèi)容如下:1.提出了基于單詞級和字符級混合特征的文本分類模型。針對中文短文本具有長度短、稀疏性和上下文依賴強等特點,本文分別使用以單詞級向量和字符級向量作為輸入的兩個長短時記憶網(wǎng)絡(luò)或雙向長短時記憶網(wǎng)絡(luò)對句子語義進(jìn)行編碼,然后將兩個輸出向量相加結(jié)合作為整個句子向量表示。利用NLPCC 2017中文新聞標(biāo)題分類數(shù)據(jù)集進(jìn)行實驗,結(jié)果表明,對于中文短文本分類,單詞嵌入和字符嵌入的結(jié)合使用可以在中文短文本的句子語義表示中相互補充,有助于提高中文短文本的分類性能。2.根據(jù)中文文本分析流程,結(jié)合本文提出的改進(jìn)文本分類模型,設(shè)...

【文章頁數(shù)】:78 頁

【學(xué)位級別】:碩士

【文章目錄】:
摘要
ABSTRACT
第一章 緒論
    1.1 研究背景和意義
    1.2 國內(nèi)外研究現(xiàn)狀
    1.3 本文的主要工作
    1.4 本文的組織結(jié)構(gòu)
第二章 文本分類相關(guān)基礎(chǔ)
    2.1 深度學(xué)習(xí)概述
    2.2 文本分類
        2.2.1 文本表示方法
        2.2.2 文本預(yù)處理
        2.2.3 文本分類算法
    2.3 性能評價指標(biāo)
    2.4 TORNADO框架概述
第三章 基于單詞級和字符級混合特征的文本分類模型
    3.1 模型結(jié)構(gòu)設(shè)計
    3.2 實驗環(huán)境與數(shù)據(jù)集
        3.2.1 實驗環(huán)境配置
        3.2.2 數(shù)據(jù)集
    3.3 模型訓(xùn)練及參數(shù)設(shè)置
        3.3.1 文本特征表示
        3.3.2 模型訓(xùn)練
        3.3.3 模型參數(shù)設(shè)置
    3.4 結(jié)果分析
        3.4.1 對比模型介紹
        3.4.2 結(jié)果分析
    3.5 本章小結(jié)
第四章 新聞文本分類系統(tǒng)需求分析與設(shè)計
    4.1 系統(tǒng)需求概述
    4.2 系統(tǒng)設(shè)計目標(biāo)
    4.3 業(yè)務(wù)需求分析
        4.3.1 新聞采集模塊業(yè)務(wù)需求分析
        4.3.2 新聞處理模塊業(yè)務(wù)需求分析
        4.3.3 新聞?wù)故灸0鍢I(yè)務(wù)需求分析
    4.4 功能需求分析
    4.5 系統(tǒng)用例描述
    4.6 概要設(shè)計
        4.6.1 系統(tǒng)總體框架
        4.6.2 系統(tǒng)行為描述
    4.7 詳細(xì)設(shè)計
        4.7.1 新聞采集模塊設(shè)計
        4.7.2 新聞存儲模塊設(shè)計
        4.7.3 新聞分類模塊設(shè)計
    4.8 本章小結(jié)
第五章 新聞文本分類系統(tǒng)實現(xiàn)與測試
    5.1 系統(tǒng)環(huán)境搭建
    5.2 功能模塊實現(xiàn)
        5.2.1 新聞采集模塊實現(xiàn)
        5.2.2 新聞存儲模塊實現(xiàn)
        5.2.3 新聞分類模塊實現(xiàn)
    5.3 功能模塊展示
        5.3.1 新聞采集和存儲
        5.3.2 系統(tǒng)整體運行效果
    5.4 系統(tǒng)測試
    5.5 本章小結(jié)
第六章 總結(jié)與展望
    6.1 總結(jié)
    6.2 展望
參考文獻(xiàn)
致謝
攻讀學(xué)位期間發(fā)表的學(xué)術(shù)論文



本文編號:3802056

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3802056.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶5125c***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com