天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

面向工業(yè)領域的數(shù)值信息抽取與應用

發(fā)布時間:2022-07-13 15:53
  隨著大數(shù)據(jù)時代的到來,網(wǎng)絡中每天產生著大量的數(shù)據(jù)。無論是企業(yè)還是個人,對網(wǎng)絡資源的依賴都顯得尤為凸出。在工業(yè)領域,數(shù)值作為一種直觀的表達方式,能夠反映出工業(yè)相關信息,一直被企業(yè)和個人所需要。因為目前缺少一種有效的工業(yè)領域的數(shù)值信息抽取方法,所以本文對其抽取方法進行研究。首先本文對數(shù)值信息的表示形式做出改進,將工業(yè)領域的數(shù)值信息定義為七元組形式(主體、屬性、屬性值、比較詞、比較對象、時間、地點),并將數(shù)值信息抽取分為數(shù)值信息元素識別和數(shù)值信息元素關系識別兩個步驟。在數(shù)值信息元素識別方面,采取一種階段性數(shù)值信息元素識別方法。即根據(jù)各個數(shù)值信息元素的特點,在不同階段采用不同方法對相應的數(shù)值信息元素進行識別。并將當前階段的識別結果輸入給下一階段使用。對于屬性值來說,由于其表達比較固定,故采用了基于模板的方法;對于比較詞來說,其數(shù)量有限,因此本文采用字典和規(guī)則相結合的方法進行識別;對于主體、屬性則采用了序列標注算法;比較對象的識別則通過規(guī)則在之前數(shù)值信息元素中進行識別。實驗結果表明,該方法融合了規(guī)則、Bi-LSTM-CRF模型的優(yōu)勢,對數(shù)值信息元素的識別取得了比較滿意的效果。在數(shù)值信息元素關系識... 

【文章頁數(shù)】:55 頁

【學位級別】:碩士

【文章目錄】:
摘要
ABSTRACT
第1章 緒論
    1.1 研究背景與意義
    1.2 工業(yè)領域的數(shù)值信息
        1.2.1 數(shù)值信息
        1.2.2 工業(yè)領域數(shù)值信息的特征
        1.2.3 工業(yè)數(shù)值信息的存儲形式
    1.3 數(shù)值信息抽取的難點
    1.4 本文主要工作
    1.5 論文結構
第2章 相關研究
    2.1 數(shù)值信息
        2.1.1 單一數(shù)值信息的抽取
        2.1.2 復合數(shù)值信息的抽取
    2.2 命名實體識別
        2.2.1 實體識別發(fā)展歷史
        2.2.2 基于規(guī)則的實體識別
        2.2.3 基于統(tǒng)計機器學習的實體識別
        2.2.4 基于深度學習的實體識別
        2.2.5 工業(yè)領域的實體識別
    2.3 關系識別
        2.3.1 關系識別任務介紹
        2.3.2 關系識別相關研究
    2.4 本章小結
第3章 數(shù)值信息元素識別
    3.1 數(shù)值信息元素識別概述
    3.2 基于模板的屬性值識別
    3.3 基于字典和規(guī)則的比較詞識別
    3.4 基于Bi-LSTM-CRF模型的主體、屬性識別
        3.4.1 分布式表示
        3.4.2 標注體系
    3.5 比較對象識別
    3.6 實驗設計及分析
        3.6.1 實驗設置與語料介紹
        3.6.2 評價標準
        3.6.3 實驗結果及分析
    3.7 本章小結
第4章 基于規(guī)則的數(shù)值信息元素關系識別
    4.1 數(shù)值信息抽取
    4.2 基于規(guī)則的數(shù)值信息元素關系識別
    4.3 實驗設計及分析
        4.3.1 實驗語料
        4.3.2 評價標準
        4.3.3 實驗結果與分析
    4.4 本章小結
第5章 系統(tǒng)的設計與實現(xiàn)
    5.1 系統(tǒng)整體架構和總圖流程
    5.2 系統(tǒng)模塊實現(xiàn)與效果展示
        5.2.1 文本信息的獲取和輸入模塊
        5.2.2 數(shù)值信息抽取模塊
    5.3 數(shù)值信息抽取在數(shù)值信息可視化的應用
    5.4 本章小結
結論
參考文獻
致謝
攻讀碩士期間發(fā)表(含錄用)的學術論文


【參考文獻】:
期刊論文
[1]面向化學資源文本的命名實體識別[J]. 馬建紅,王立芹,姚爽.  鄭州大學學報(理學版). 2018(04)
[2]面向問答的數(shù)值信息抽取[J]. 張桂平,張寧,白宇.  鄭州大學學報(理學版). 2018(04)
[3]海量法律文書中基于CNN的實體關系抽取技術[J]. 高丹,彭敦陸,劉叢.  小型微型計算機系統(tǒng). 2018(05)
[4]命名實體識別研究綜述[J]. 劉瀏,王東波.  情報學報. 2018(03)
[5]使用深度長短時記憶模型對于評價詞和評價對象的聯(lián)合抽取[J]. 沈亞田,黃萱菁,曹均闊.  中文信息學報. 2018(02)
[6]微博客蘊含交通事件信息抽取的自動標注方法[J]. 仇培元,張恒才,余麗,陸鋒.  中文信息學報. 2017(02)
[7]MBNER:面向生物醫(yī)學領域的多種實體識別系統(tǒng)[J]. 楊婭,楊志豪,林鴻飛,宮本東,王健.  中文信息學報. 2016(01)
[8]基于先秦語料庫的古漢語地名自動識別模型構建研究[J]. 黃水清,王東波,何琳.  圖書情報工作. 2015(12)
[9]中文文本中時間信息解析方法[J]. 張春菊,張雪英,李明,王曙.  地理與地理信息科學. 2014(06)
[10]煤制橡膠產業(yè)發(fā)展新情況[J].   蘇鹽科技. 2012(03)

碩士論文
[1]面向數(shù)值問題的答案抽取與生成[D]. 張寧.沈陽航空航天大學 2018
[2]基于web的工業(yè)產品知識圖譜構建及應用[D]. 邵元新.沈陽航空航天大學 2017
[3]基于非結構化文檔數(shù)據(jù)的抽取與分析系統(tǒng)的信息抽取[D]. 霍焰.天津大學 2012
[4]數(shù)值信息的抽取方法研究[D]. 毋菲.山西大學 2010
[5]基于CRF的中文命名實體識別研究[D]. 史海峰.蘇州大學 2010



本文編號:3660326

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3660326.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶722d4***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com