天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 自動化論文 >

基于深度學習的文本關(guān)鍵詞生成研究

發(fā)布時間:2023-01-26 08:30
  隨著互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,現(xiàn)在的社會已經(jīng)步入了大數(shù)據(jù)時代,其中文本數(shù)據(jù)更是呈指數(shù)形式增長,人們難以快速地從海量的文本信息中甄別出符合需求的信息。關(guān)鍵詞作為文本主題信息的高度凝結(jié),可以幫助人們快速地了解文本的核心內(nèi)容。同時,關(guān)鍵詞也可以應(yīng)用于文本分類、文獻檢索、自動摘要、推薦系統(tǒng)等自然語言處理任務(wù)。因此,關(guān)鍵詞抽取技術(shù)變得尤為重要,但是傳統(tǒng)的關(guān)鍵詞抽取模型存在兩點不足:1)大多只能抽取出現(xiàn)在原文中的詞語;2)主要依賴文本淺層特征抽取重要的詞語,因此難以挖掘并充分利用文本背后的潛在語義信息。近年來,基于神經(jīng)網(wǎng)絡(luò)的關(guān)鍵詞生成模型能夠較好地克服上述抽取模型的局限性,但現(xiàn)有的關(guān)鍵詞生成模型得到的關(guān)鍵詞依然存在偏離原文內(nèi)容的問題。為了緩解上述問題,本文將關(guān)鍵詞抽取模型和關(guān)鍵詞生成模型相結(jié)合,快速聚焦于原文核心內(nèi)容,并嘗試多種的融合方式來提高模型生成關(guān)鍵詞的質(zhì)量,本文的主要研究工作如下:第一,當生成文本關(guān)鍵詞時,人們通常會從文本中提取重要信息,然后再基于對重要信息的理解來生成關(guān)鍵詞,基于此,本文提出通過TextRank算法抽取出文本當中包含重要信息的詞語和句子,然后將抽取的重要信息與深度學習模型相結(jié)... 

【文章頁數(shù)】:49 頁

【學位級別】:碩士

【文章目錄】:
摘要
ABSTRACT
第一章 緒論
    1.1 研究背景及意義
    1.2 國內(nèi)外研究現(xiàn)狀
    1.3 本文的主要研究工作
    1.4 論文的組織結(jié)構(gòu)
第二章 文本關(guān)鍵詞抽取與生成研究綜述
    2.1 文本關(guān)鍵詞抽取方法
        2.1.1 基于統(tǒng)計的關(guān)鍵詞抽取
        2.1.2 基于圖模型的關(guān)鍵詞抽取
        2.1.3 基于主題模型的關(guān)鍵詞抽取
        2.1.4 基于神經(jīng)網(wǎng)絡(luò)模型的關(guān)鍵詞抽取
    2.2 文本關(guān)鍵詞生成方法
        2.2.1 基本序列到序列模型
        2.2.2 注意力機制
        2.2.3 復(fù)制機制
    2.3 文本關(guān)鍵詞評價方法
第三章 融合重要信息抽取的關(guān)鍵詞生成模型
    3.1 引言
    3.2 融合重要信息的注意力機制
    3.3 融合重要信息抽取的關(guān)鍵詞生成模型
    3.4 實驗
        3.4.1 實驗數(shù)據(jù)
        3.4.2 實驗設(shè)置
        3.4.3 對比模型
        3.4.4 實驗結(jié)果
    3.5 本章小結(jié)
第四章 基于多粒度重要信息引導(dǎo)的關(guān)鍵詞生成模型
    4.1 引言
    4.2 基于多粒度重要信息引導(dǎo)的關(guān)鍵詞生成模型
    4.3 實驗
        4.3.1 實驗數(shù)據(jù)
        4.3.2 實驗設(shè)置
        4.3.3 對比模型
        4.3.4 實驗結(jié)果
    4.4 本章小結(jié)
第五章 總結(jié)與展望
    5.1 總結(jié)
    5.2 展望
參考文獻
攻讀碩士期間發(fā)表的學術(shù)成果
致謝



本文編號:3732356

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3732356.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶73a42***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com