天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

面向汽車(chē)領(lǐng)域的命名實(shí)體識(shí)別研究

發(fā)布時(shí)間:2023-02-14 16:33
  隨著互聯(lián)網(wǎng)的飛速發(fā)展,結(jié)構(gòu)化和非結(jié)構(gòu)化的文本數(shù)據(jù)增長(zhǎng)速度迅猛,如何從海量的文本數(shù)據(jù)中抽取有用信息已經(jīng)成為當(dāng)前的研究重點(diǎn)。命名實(shí)體識(shí)別是信息抽取的子任務(wù)之一,是從無(wú)規(guī)則的非結(jié)構(gòu)化文本中抽取有用信息的底層技術(shù),命名實(shí)體識(shí)別的效果直接影響很多自然語(yǔ)言處理領(lǐng)域的任務(wù),F(xiàn)代社會(huì)汽車(chē)已經(jīng)普及,從汽車(chē)文本數(shù)據(jù)中抽取命名實(shí)體信息也變得越來(lái)越重要。因此,面向汽車(chē)領(lǐng)域的命名實(shí)體識(shí)別研究具有重要的意義。近二十年來(lái),以深度學(xué)習(xí)為首的人工智能再度成為時(shí)代的潮流。在自然語(yǔ)言處理領(lǐng)域,循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)逐漸成為主流方法,尤其是門(mén)控循環(huán)單元(Gated Recurrent Unit,GRU)的提出,能夠更好地捕捉時(shí)間序列中時(shí)間步距離較大的依賴(lài)關(guān)系,在自然語(yǔ)言處理領(lǐng)域得到了廣泛應(yīng)用。隨著Attention機(jī)制在自然語(yǔ)言處理領(lǐng)域的成功運(yùn)用,學(xué)術(shù)界已經(jīng)將Attention機(jī)制與深度學(xué)習(xí)巧妙地融合在一起,從而讓深度學(xué)習(xí)擁有了更加強(qiáng)大的特征抽取能力。本文首先重點(diǎn)介紹了命名實(shí)體識(shí)別的研究背景和重要意義,介紹了國(guó)外和國(guó)內(nèi)命名實(shí)體識(shí)別的研究現(xiàn)狀,并對(duì)中文命名實(shí)體識(shí)別過(guò)程中應(yīng)用到的...

【文章頁(yè)數(shù)】:77 頁(yè)

【學(xué)位級(jí)別】:碩士

【文章目錄】:
摘要
Abstract
第1章 緒論
    1.1 研究背景及意義
    1.2 國(guó)內(nèi)外研究現(xiàn)狀
        1.2.1 國(guó)外研究現(xiàn)狀
        1.2.2 國(guó)內(nèi)研究現(xiàn)狀
    1.3 本文的主要工作
    1.4 本文組織結(jié)構(gòu)
第2章 相關(guān)技術(shù)與方法概述
    2.1 詞匯語(yǔ)義表示
        2.1.1 基于分布的表示方法
        2.1.2 基于神經(jīng)網(wǎng)絡(luò)的表示方法
    2.2 人工神經(jīng)網(wǎng)絡(luò)
    2.3 文本去重
    2.4 命名實(shí)體識(shí)別介紹
        2.4.1 中文命名實(shí)體識(shí)別概述
        2.4.2 汽車(chē)領(lǐng)域命名實(shí)體識(shí)別概述
    2.5 相關(guān)工具
        2.5.1 Py Torch
        2.5.2 scrapy
        2.5.3 YEDDA
    2.6 本章小結(jié)
第3章 基于BLattice GRU的命名實(shí)體識(shí)別
    3.1 深度神經(jīng)網(wǎng)絡(luò)
        3.1.1 循環(huán)神經(jīng)網(wǎng)絡(luò)
        3.1.2 特殊的循環(huán)神經(jīng)網(wǎng)絡(luò)
    3.2 Lattice LSTM概述
    3.3 構(gòu)建基于BLattice GRU的命名實(shí)體識(shí)別模型
        3.3.1 模型結(jié)構(gòu)
        3.3.2 BLattice GRU
        3.3.3 加入Dropout
    3.4 汽車(chē)領(lǐng)域命名實(shí)體標(biāo)注數(shù)據(jù)集的構(gòu)建
        3.4.1 汽車(chē)領(lǐng)域命名實(shí)體標(biāo)注規(guī)范
        3.4.2 原始語(yǔ)料爬取
        3.4.3 數(shù)據(jù)預(yù)處理
        3.4.4 數(shù)據(jù)集標(biāo)注
        3.4.5 構(gòu)建數(shù)據(jù)集
        3.4.6 詞典構(gòu)建
    3.5 實(shí)驗(yàn)設(shè)計(jì)與結(jié)果分析
        3.5.1 實(shí)驗(yàn)環(huán)境
        3.5.2 評(píng)測(cè)指標(biāo)
        3.5.3 不同參數(shù)下的實(shí)驗(yàn)
        3.5.4 與基線模型的對(duì)比實(shí)驗(yàn)
    3.6 本章小結(jié)
第4章 基于BLatticeGRU-Attention的命名實(shí)體識(shí)別
    4.1 Attention機(jī)制
        4.1.1 Attention機(jī)制概述
        4.1.2 Scaled Dot-Product Attention
    4.2 構(gòu)建基于BLatticeGRU-Attention的命名實(shí)體識(shí)別模型
        4.2.1 模型結(jié)構(gòu)
        4.2.2 Self-Attention子層
        4.2.3 Feed-Forward子層
        4.2.4 殘差連接
        4.2.5 位置編碼
    4.3 實(shí)驗(yàn)結(jié)果分析
        4.3.1 biword對(duì)結(jié)果的影響
        4.3.2 Transformer層數(shù)對(duì)結(jié)果的影響
        4.3.3 BLatticeGRU與BLatticeGRU-Attention模型的對(duì)比實(shí)驗(yàn)
    4.4 本章小結(jié)
第5章 基于BLatticeGRU-Attention-CRF的命名實(shí)體識(shí)別
    5.1 條件隨機(jī)場(chǎng)
    5.2 維特比算法
    5.3 構(gòu)建基于BLatticeGRU-Attention-CRF的命名實(shí)體識(shí)別模型
    5.4 實(shí)驗(yàn)設(shè)計(jì)與結(jié)果分析
        5.4.1 參數(shù)初始化
        5.4.2 優(yōu)化算法
        5.4.3 預(yù)訓(xùn)練字向量對(duì)結(jié)果的影響
        5.4.4 Dropout對(duì)結(jié)果的影響
        5.4.5 不同模型的對(duì)比實(shí)驗(yàn)
    5.5 本章小結(jié)
第6章 總結(jié)與展望
    6.1 工作總結(jié)
    6.2 未來(lái)展望
參考文獻(xiàn)
作者簡(jiǎn)介及在學(xué)期間所取得的科研成果
致謝



本文編號(hào):3742622

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3742622.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)e8113***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com