天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 自動化論文 >

面向醫(yī)療領(lǐng)域的中文命名實體識別

發(fā)布時間:2018-10-29 12:00
【摘要】:隨著近幾年文本數(shù)據(jù)量的爆炸式增長、大規(guī)模知識庫的建立和普及,命名實體識別研究已經(jīng)逐漸成為自然語言處理領(lǐng)域的一大研究熱點。然而,傳統(tǒng)的基于有監(jiān)督學(xué)習(xí)的方法,需要大規(guī)模的標(biāo)注語料。在標(biāo)注語料稀缺的醫(yī)療領(lǐng)域,傳統(tǒng)的命名實體識別方法并不能夠達到理想的效果。隨著深度學(xué)習(xí)的火熱發(fā)展和普及,循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN,Recurrent Ne ural Network),尤其是長短期存儲單元LSTM(Long-Short Term Memory)被廣泛應(yīng)用于自然語言處理領(lǐng)域,并在多個研究方向上取得顯著高于傳統(tǒng)方法的成績。因此,我們首先利用LSTM模型進行醫(yī)療領(lǐng)域的命名實體識別的研究,并證明其無論是在研究效果評價還是實際應(yīng)用層面,都能夠達到比傳統(tǒng)的條件隨機場模型(CRF,Conditional Random Fields)更好的效果。由于醫(yī)療領(lǐng)域的規(guī)范的標(biāo)注語料相對稀少,我們在LSTM模型已經(jīng)取得比CRF模型更好的效果的基礎(chǔ)上,還希望它能夠通過融合外部信息,同時學(xué)習(xí)到新聞領(lǐng)域的語言學(xué)特征和醫(yī)療領(lǐng)域的無監(jiān)督語義信息,達到更好的效果。我們利用了深度學(xué)習(xí)中遷移學(xué)習(xí)和預(yù)訓(xùn)練的相關(guān)知識,對醫(yī)療領(lǐng)域的模型進行了參數(shù)融合和模型調(diào)優(yōu),使得模型的效果進一步提升。最后,由于LSTM模型在實際應(yīng)用中的缺陷,我們希望能夠利用另一種方法進行領(lǐng)域自適應(yīng)的命名實體識別。為了找尋不同知識域的領(lǐng)域差異,我們進行了多組混合不同領(lǐng)域語料的對比實驗進行分析和探究。并通過GB DT模型集成領(lǐng)域差異和無監(jiān)督的醫(yī)療領(lǐng)域的語義向量進行命名實體識別的研究,取得了較好的研究效果。
[Abstract]:With the explosive growth of text data in recent years and the establishment and popularization of large-scale knowledge base, the research of named entity recognition has gradually become a research hotspot in the field of natural language processing. However, traditional methods based on supervised learning require large scale tagging corpus. In the medical field where tagging data is scarce, the traditional naming entity recognition method can not achieve the desired results. With the development and popularization of deep learning, cyclic neural network (RNN,Recurrent Ne ural Network), especially LSTM (long and short term memory unit) (Long-Short Term Memory), has been widely used in the field of natural language processing. And in many research directions, the results are significantly higher than the traditional methods. Therefore, we first use the LSTM model to study the named entity recognition in medical field, and prove that it can achieve more than the traditional conditional random field model (CRF,), both in the evaluation of the research effect and in the practical application level. Conditional Random Fields) works better. Because the standard annotated corpus in the medical field is relatively scarce, we hope that LSTM model can integrate external information on the basis that the LSTM model has achieved better results than the CRF model. At the same time, we learn the linguistic features of the news field and the unsupervised semantic information in the medical field to achieve better results. We make use of the knowledge of transfer learning and pre-training in deep learning to fuse the parameters and optimize the models in the medical field, so that the effectiveness of the model can be further improved. Finally, due to the defects of LSTM model in practical application, we hope to use another method for domain adaptive named entity recognition. In order to find out the domain differences of different knowledge domains, we conducted a comparative experiment of mixing different domain corpus to analyze and explore. The named entity recognition is studied by integrating the semantic vectors of domain difference and unsupervised medical field with GB DT model, and good results are obtained.
【學(xué)位授予單位】:哈爾濱工業(yè)大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2017
【分類號】:TP391.1;TP18

【參考文獻】

相關(guān)期刊論文 前6條

1 王鵬遠(yuǎn);姬東鴻;;基于多標(biāo)簽CRF的疾病名稱抽取[J];計算機應(yīng)用研究;2017年01期

2 蘇婭;劉杰;黃亞樓;;在線醫(yī)療文本中的實體識別研究[J];北京大學(xué)學(xué)報(自然科學(xué)版);2016年01期

3 曲春燕;關(guān)毅;楊錦鋒;趙永杰;劉雅欣;;中文電子病歷命名實體標(biāo)注語料庫構(gòu)建[J];高技術(shù)通訊;2015年02期

4 栗偉;趙大哲;李博;彭新茗;劉積仁;;CRF與規(guī)則相結(jié)合的醫(yī)學(xué)病歷實體識別[J];計算機應(yīng)用研究;2015年04期

5 張金龍;王石;錢存發(fā);;基于CRF和規(guī)則的中文醫(yī)療機構(gòu)名稱識別[J];計算機應(yīng)用與軟件;2014年03期

6 邱莎;段玻;申浩如;丁海燕;;基于條件隨機場的中文人名識別研究[J];昆明學(xué)院學(xué)報;2011年06期

相關(guān)會議論文 前1條

1 張祝玉;任飛亮;朱靖波;;基于條件隨機場的中文命名實體識別特征比較研究[A];第四屆全國信息檢索與內(nèi)容安全學(xué)術(shù)會議論文集(上)[C];2008年

相關(guān)碩士學(xué)位論文 前1條

1 段超群;面向缺乏標(biāo)注數(shù)據(jù)領(lǐng)域的命名實體識別的研究[D];哈爾濱工業(yè)大學(xué);2015年

,

本文編號:2297637

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/2297637.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶7cf92***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com
免费观看一区二区三区黄片| 国产精品激情对白一区二区| 久久久免费精品人妻一区二区三区| 99国产高清不卡视频| 午夜午夜精品一区二区| 精品一区二区三区乱码中文| 国产成人午夜av一区二区| 日韩在线欧美一区二区| 一区二区在线激情视频| 免费人妻精品一区二区三区久久久 | 狠狠干狠狠操在线播放| 国产av天堂一区二区三区粉嫩| 欧洲偷拍视频中文字幕| 亚洲精品成人午夜久久| 大尺度剧情国产在线视频| 国产午夜福利一区二区| 亚洲国产av一二三区| 欧美日韩国产另类一区二区 | 亚洲午夜av一区二区| 九九热这里有精品20| 国产女性精品一区二区三区| 在线观看免费午夜福利| 日韩欧美国产亚洲一区| 91日韩在线视频观看| 激情综合网俺也狠狠地| 久久黄片免费播放大全| 狠狠干狠狠操亚洲综合| 邻居人妻人公侵犯人妻视频| 绝望的校花花间淫事2| 国产一区欧美一区日韩一区| 日韩成人午夜福利免费视频 | 日本加勒比系列在线播放| 丰满人妻熟妇乱又乱精品古代| 成人欧美精品一区二区三区| 国产精欧美一区二区三区久久| 久久综合九色综合欧美| 日本婷婷色大香蕉视频在线观看| 国产免费成人激情视频| 中文文精品字幕一区二区| 国产成人精品一区二区在线看| 香港国产三级久久精品三级|