天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于語義向量融合的中文命名實體識別

發(fā)布時間:2021-10-30 12:38
  隨著信息技術的快速發(fā)展,人們生活中充斥著海量的文本數(shù)據(jù),命名實體識別任務就是對這些數(shù)據(jù)中有意義的實體進行提取。它是自然語言處理中一個關鍵任務,是輿情監(jiān)測、信息提取任務的基礎,其效果的好壞對后續(xù)任務研究有著巨大的影響。本文中引入的命名實體識別任務是對文本中的人名,地名,機構名進行抽取。由于傳統(tǒng)方法會導致代價大、泛化性差的結果,本文采用了基于語義向量融合的方法對中文實體進行識別。首先利用雙向長短時記憶網(wǎng)絡(BiLSTMs)進行建模,通過引入條件隨機場(CRF)增加規(guī)則來提高模型識別效率構建BiLSTMs+CRF模型。以字為單位進行輸入,解決了中文分詞錯誤導致識別效果不好的問題。在模型中將經(jīng)過預訓練模型的詞向量和字向量進行拼接,得到一組語義向量融合的新特征。然后構建了 CNN-BiLSTMs+CRF的模型,其中卷積神經(jīng)網(wǎng)絡(CNN)用來提取細粒度的特征。為了解決序列模型計算速度慢的缺點,將融合好語義的向量輸入到構建的迭代膨脹卷積網(wǎng)絡(ID-CNN)。該模型在沒有增加參數(shù)的情況下使得覆蓋的文本和提取的特征變得更多了。在BiLSTM、BiLSTM+CRF、BiLSTMs、BiLSTMs+CRF模... 

【文章來源】:云南大學云南省 211工程院校

【文章頁數(shù)】:66 頁

【學位級別】:碩士

【部分圖文】:

基于語義向量融合的中文命名實體識別


圖2.1前饋神經(jīng)網(wǎng)絡結構??

過程圖,圖像卷積,過程,卷積


卷積提取出特征圖(Feature?Map)。池化層作用是對卷積后的特征進行降維,壓??縮數(shù)據(jù)量,減小過擬合。其中最常用的是最大池化(Max?Pooling),即在每個區(qū)??域中找到最大值。圖像的卷積過程如圖2.2所示。??involution???max?pooling?v^c???V??nonlinearity?〇?\〇?...??;????.......????—??? ̄ ̄? ̄ ̄??convolution?pooling?layers?fully?ccsinected?layers?Nk?binary?clcesffication??圖2.2圖像卷積過程??對于CNN來說并不是所有的上下層神經(jīng)元都互相連接,而是通過filter作為??中介。再通過池化層進一步提高網(wǎng)絡的魯棒性。??CNN不僅可以用于圖像領域,在自然語言處理領域也取得不錯的成果。在2014??年Yoon?Kim[44l首先將CNN用于文本分類問題,并且得到了很好的效果。讓人們??看到CNN在自然語言處理方面的前景。相比于圖像,文本處理則是一維卷積,卷??積過程是整行整行的進行,filter的大小就是卷積行數(shù),有多少filter就有多少feature??map,也等于最后經(jīng)過池化后的向量的維度。其卷積的原理如圖2.3所示。??wait?|?T;?p?-、?|??for?:丨丨丨?—?????-?-?Z_p—]??*e?rp' ̄—-—lZtz??video???:?一?..

特征圖,文本分類,卷積


卷積提取出特征圖(Feature?Map)。池化層作用是對卷積后的特征進行降維,壓??縮數(shù)據(jù)量,減小過擬合。其中最常用的是最大池化(Max?Pooling),即在每個區(qū)??域中找到最大值。圖像的卷積過程如圖2.2所示。??involution???max?pooling?v^c???V??nonlinearity?〇?\〇?...??;????.......????—??? ̄ ̄? ̄ ̄??convolution?pooling?layers?fully?ccsinected?layers?Nk?binary?clcesffication??圖2.2圖像卷積過程??對于CNN來說并不是所有的上下層神經(jīng)元都互相連接,而是通過filter作為??中介。再通過池化層進一步提高網(wǎng)絡的魯棒性。??CNN不僅可以用于圖像領域,在自然語言處理領域也取得不錯的成果。在2014??年Yoon?Kim[44l首先將CNN用于文本分類問題,并且得到了很好的效果。讓人們??看到CNN在自然語言處理方面的前景。相比于圖像,文本處理則是一維卷積,卷??積過程是整行整行的進行,filter的大小就是卷積行數(shù),有多少filter就有多少feature??map,也等于最后經(jīng)過池化后的向量的維度。其卷積的原理如圖2.3所示。??wait?|?T;?p?-、?|??for?:丨丨丨?—?????-?-?Z_p—]??*e?rp' ̄—-—lZtz??video???:?一?..

【參考文獻】:
期刊論文
[1]基于深度信念網(wǎng)絡的地質(zhì)實體識別方法[J]. 張雪英,葉鵬,王曙,杜咪.  巖石學報. 2018(02)
[2]基于深度神經(jīng)網(wǎng)絡的命名實體識別方法研究[J]. GUL Khan Safi Qamas,尹繼澤,潘麗敏,羅森林.  信息網(wǎng)絡安全. 2017(10)
[3]基于BLSTM的命名實體識別方法[J]. 馮艷紅,于紅,孫庚,孫娟娟.  計算機科學. 2018(02)
[4]基于Word2Vec的一種文檔向量表示[J]. 唐明,朱磊,鄒顯春.  計算機科學. 2016(06)
[5]基于位置敏感Embedding的中文命名實體識別[J]. 魯亞楠,孫銳,姬東鴻.  計算機應用研究. 2017(02)
[6]命名實體識別綜述[J]. 陳基.  現(xiàn)代計算機(專業(yè)版). 2016(03)
[7]問答系統(tǒng)綜述[J]. 李沛晏,朱露,吳多勝.  數(shù)字技術與應用. 2015(04)
[8]ICTCLAS中文詞法分析的Delphi調(diào)用研究[J]. 郭曉云.  電腦編程技巧與維護. 2011(24)
[9]基于規(guī)則和概率統(tǒng)計相結合的中文命名實體識別研究[J]. 閆萍.  計算機與數(shù)字工程. 2011(09)
[10]科學知識圖譜的發(fā)展歷程[J]. 陳悅,劉則淵,陳勁,侯劍華.  科學學研究. 2008(03)

碩士論文
[1]基于詞表示方法的生物醫(yī)學命名實體識別[D]. 何紅磊.大連理工大學 2015
[2]基于自主推理的中文命名實體識別方法研究[D]. 李波.西北大學 2012



本文編號:3466745

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3466745.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶32dbf***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
国产又粗又深又猛又爽又黄| 亚洲欧洲精品一区二区三区| 亚洲一区二区三区中文久久 | 激情五月综五月综合网| 91国自产精品中文字幕亚洲| 91人妻人人揉人人澡人| 亚洲国产成人一区二区在线观看| 青青操视频在线播放免费| 久久偷拍视频免费观看| 老司机精品视频在线免费看| 亚洲一区二区三区在线免费| 久久久精品日韩欧美丰满| 亚洲精品深夜福利视频| 日韩美成人免费在线视频| 中文字幕人妻一区二区免费| 91超频在线视频中文字幕| 激情五月天免费在线观看| 国产精品久久久久久久久久久痴汉| 麻豆果冻传媒一二三区| 国产目拍亚洲精品区一区| 黑鬼糟蹋少妇资源在线观看| 欧美一区二区黑人在线| 又色又爽又黄的三级视频| 国产精品大秀视频日韩精品| 大香蕉大香蕉手机在线视频| 精品欧美一区二区三久久| 日本午夜精品视频在线观看| 在线观看欧美视频一区| 国产精品99一区二区三区| 国产精品欧美激情在线| 在线九月婷婷丁香伊人| 东京热一二三区在线免| 亚洲做性视频在线播放| 色婷婷人妻av毛片一区二区三区| 丁香六月啪啪激情综合区| 国产又粗又猛又长又大| 国产精品国产亚洲区久久| 色偷偷偷拍视频在线观看| 国产综合一区二区三区av| 91超精品碰国产在线观看| 又色又爽又黄的三级视频|