天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 自動化論文 >

中文命名實體識別技術(shù)研究及檢驗檢疫領(lǐng)域應(yīng)用

發(fā)布時間:2021-02-23 04:40
  隨著經(jīng)濟(jì)的全球化發(fā)展和互聯(lián)網(wǎng)的快速普及,大量的貨物流動、疫情疾病的防控、食品及衛(wèi)生安全等信息上傳到互聯(lián)網(wǎng)平臺中,檢驗檢疫部門需要通過這些信息來抽取關(guān)鍵內(nèi)容,采取對應(yīng)的行動。命名實體識別是信息抽取的重要組成部分,在檢驗檢疫信息抽取領(lǐng)域,產(chǎn)品實體名稱作為信息的主要對象,也是實際應(yīng)用中命名實體識別的重點。中文產(chǎn)品實體自身無明顯詞語分界且結(jié)構(gòu)復(fù)雜、包含范圍廣泛,這些特點都增加了識別產(chǎn)品實體的難度。因此,在檢驗檢疫領(lǐng)域中如何快速準(zhǔn)確地識別出中文產(chǎn)品實體,具有重要的研究意義和實際應(yīng)用價值。針對中文命名實體識別技術(shù),本文進(jìn)行了以下幾個方面的研究:提出了一個特定領(lǐng)域的中文命名實體識別的框架。該框架包含半自動化語料庫構(gòu)建和中文命名實體識別模型兩大模塊。半自動化的語料庫構(gòu)建基于互信息和左右熵的短語提取算法來進(jìn)行無監(jiān)督的短語識別,建立候選實體集。中文命名實體識別模型模塊基于神經(jīng)網(wǎng)絡(luò)與條件隨機(jī)場模型的框架進(jìn)行實體識別。提出了基于詞格長短時記憶網(wǎng)絡(luò)結(jié)合條件隨機(jī)場模型進(jìn)行中文產(chǎn)品實體識別的方法。本文結(jié)合不同的神經(jīng)網(wǎng)絡(luò)和條件隨機(jī)場組成混合模型,將IDCNN+CRF,BiLSTM + CRF和Lattice LSTM... 

【文章來源】:浙江大學(xué)浙江省 211工程院校 985工程院校 教育部直屬院校

【文章頁數(shù)】:77 頁

【學(xué)位級別】:碩士

【文章目錄】:
摘要
Abstract
第1章 緒論
    1.1 課題背景
    1.2 命名實體識別研究現(xiàn)狀
        1.2.1 國外研究現(xiàn)狀
        1.2.2 國內(nèi)研究現(xiàn)狀
    1.3 中文產(chǎn)品命名實體識別任務(wù)
        1.3.1 難點分析
        1.3.2 主要工作
    1.4 本文的組織結(jié)構(gòu)
第2章 命名實體識別相關(guān)技術(shù)
    2.1 命名實體識別概述
        2.1.1 序列標(biāo)注問題
        2.1.2 命名實體識別的傳統(tǒng)方法
        2.1.3 命名實體識別技術(shù)的應(yīng)用
    2.2 基于概率圖模型的實體識別方法
        2.2.1 概率圖模型
        2.2.2 條件隨機(jī)場模型
    2.3 基于神經(jīng)網(wǎng)絡(luò)模型的實體識別方法
        2.3.1 詞嵌入
        2.3.2 循環(huán)神經(jīng)網(wǎng)絡(luò)模型
        2.3.3 長短時記憶網(wǎng)絡(luò)
        2.3.4 卷積神經(jīng)網(wǎng)絡(luò)模型
    2.4 本章小結(jié)
第3章 特定領(lǐng)域的中文命名實體識別框架
    3.1 半自動化的語料庫構(gòu)建
        3.1.1 互信息和左右熵
        3.1.2 基于互信息和左右熵的短語提取算法
    3.2 中文命名實體識別模型
        3.2.1 詞格長短時記憶網(wǎng)絡(luò)結(jié)合條件隨機(jī)場模型
            3.2.1.1 基于字向量的長短時記憶網(wǎng)絡(luò)模型
            3.2.1.2 基于詞向量的長短時記憶網(wǎng)絡(luò)模型
            3.2.1.3 基于詞格的長短時記憶網(wǎng)絡(luò)模型
        3.2.2 實驗設(shè)計
    3.3 本章小結(jié)
第4章 基于神經(jīng)網(wǎng)絡(luò)與條件隨機(jī)場的實體識別模型
    4.1 空洞卷積神經(jīng)網(wǎng)絡(luò)結(jié)合條件隨機(jī)場模型
    4.2 雙向長短時記憶網(wǎng)絡(luò)結(jié)合條件隨機(jī)場模型
    4.3 多模型對比實驗
        4.3.1 實驗數(shù)據(jù)
        4.3.2 實驗環(huán)境
        4.3.3 評價指標(biāo)
        4.3.4 多模型對比實驗
    4.4 本章小結(jié)
第5章 檢驗檢疫領(lǐng)域的中文產(chǎn)品命名實體識別
    5.1 項目背景
    5.2 數(shù)據(jù)準(zhǔn)備
        5.2.1 數(shù)據(jù)預(yù)處理
        5.2.2 語料標(biāo)注
        5.2.3 識別及標(biāo)注機(jī)制
    5.3 模型構(gòu)建
        5.3.1 模型整體結(jié)構(gòu)
        5.3.2 防止過擬合
        5.3.3 參數(shù)設(shè)置
        5.3.4 實驗結(jié)果
    5.4 對比實驗
    5.5 本章小結(jié)
第6章 總結(jié)與展望
    6.1 全文總結(jié)
    6.2 未來研究方向
參考文獻(xiàn)
攻讀碩士學(xué)位期間主要的研究成果
致謝


【參考文獻(xiàn)】:
期刊論文
[1]信息抽取研究與發(fā)展綜述[J]. 周玉新.  才智. 2016(27)
[2]概率圖模型研究進(jìn)展綜述[J]. 張宏毅,王立威,陳瑜希.  軟件學(xué)報. 2013(11)
[3]生物醫(yī)學(xué)命名實體識別的研究與進(jìn)展[J]. 鄭強(qiáng),劉齊軍,王正華,朱云平.  計算機(jī)應(yīng)用研究. 2010(03)
[4]基于層疊隱馬爾可夫模型的中文命名實體識別[J]. 俞鴻魁,張華平,劉群,呂學(xué)強(qiáng),施水才.  通信學(xué)報. 2006(02)
[5]中文機(jī)構(gòu)名稱的識別與分析[J]. 張小衡,王玲玲.  中文信息學(xué)報. 1997(04)
[6]中文姓名的自動辨識[J]. 孫茂松,黃昌寧,高海燕,方捷.  中文信息學(xué)報. 1995(02)

碩士論文
[1]基于條件隨機(jī)場的中文命名實體識別研究[D]. 張佳寶.國防科學(xué)技術(shù)大學(xué) 2010
[2]規(guī)則與統(tǒng)計相結(jié)合的中文命名實體識別[D]. 喬永波.山東大學(xué) 2007



本文編號:3047033

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3047033.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶0fda4***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com