基于深度學(xué)習(xí)的中文特定領(lǐng)域命名實體識別方法研究
發(fā)布時間:2023-05-07 18:23
互聯(lián)網(wǎng)信息化社會的高速發(fā)展,帶給了我們越來越多的便利,隨之也產(chǎn)生了海量文本信息,如何對這些非結(jié)構(gòu)化的信息進行分析挖掘,將自然語言解析為計算機可處理、可理解的語言形式以實現(xiàn)知識的獲取和表示,是自然語言處理(Natural Language Processing,NLP)研究的一個核心目標,同時也是人工智能的主題之一,對于實現(xiàn)機器認知智能具有重要意義。命名實體識別(Named Entity Recognition,NER)作為自然語言處理研究的重要組成,要求對各式各樣文本數(shù)據(jù)中具有特定含義的諸如人物名、地名、組織機構(gòu)名等實體語言成分進行識別,是對話交互系統(tǒng)(Dialogue and Interactive Systems)、自動問答(Automatic Question and Answering)等高層自然語言處理技術(shù)中必不可少的一部分。以往的研究主要關(guān)注于上述幾種常見類型的實體,相對已經(jīng)成熟,而在特定領(lǐng)域,尤其是針對中文特定領(lǐng)域的實體識別仍處于發(fā)展階段,相關(guān)研究較少。由于標注語料稀少、專有術(shù)語和稀有詞較多,中文特定領(lǐng)域的文本更難以建模和表示,極具挑戰(zhàn)性,因而本文的研究重點將集中于此。對...
【文章頁數(shù)】:81 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
英文摘要
1 緒論
1.1 課題研究背景和意義
1.2 國內(nèi)外相關(guān)研究現(xiàn)狀
1.2.1 傳統(tǒng)基于規(guī)則的命名實體識別方法
1.2.2 基于統(tǒng)計機器學(xué)習(xí)的命名實體識別方法
1.2.3 基于深度學(xué)習(xí)的命名實體識別方法
1.3 論文主要工作內(nèi)容及章節(jié)安排
2 相關(guān)理論與技術(shù)基礎(chǔ)
2.1 自然語言的數(shù)值化
2.1.1 獨熱編碼表示
2.1.2 分布式編碼表示
2.2 基于統(tǒng)計機器學(xué)習(xí)的模型
2.2.1 條件隨機場
2.2.2 維特比算法
2.3 深度學(xué)習(xí)相關(guān)理論與模型
2.3.1 激活函數(shù)
2.3.2 循環(huán)神經(jīng)網(wǎng)絡(luò)
2.3.3 長短期記憶網(wǎng)絡(luò)
2.3.4 注意力機制模型Transformer
2.3.5 正則化方法Dropout
2.4 本章小結(jié)
3 基于循環(huán)神經(jīng)網(wǎng)絡(luò)的實體識別方法
3.1 基于BiLSTM-CRF模型的實體識別方法
3.1.1 BiLSTM模型
3.1.2 BiLSTM-CRF模型
3.2 基于Hierarchical BiLSTM-CRF模型的實體識別方法
3.3 實驗語料及其預(yù)處理
3.3.1 數(shù)據(jù)集介紹
3.3.2 數(shù)據(jù)預(yù)處理及其統(tǒng)計
3.4 相關(guān)實驗
3.4.1 實驗評價指標
3.4.2 基于BiLSTM-CRF模型的實體識別實驗結(jié)果及分析
3.4.3 基于Hierarchical BiLSTM-CRF模型的實體識別實驗結(jié)果及分析
3.5 本章小結(jié)
4 基于深層語境語言模型的實體識別方法
4.1 深層語境語言模型BERT
4.1.1 輸入表示
4.1.2 特征編碼
4.1.3 預(yù)訓(xùn)練策略
4.1.4 相關(guān)總結(jié)
4.2 基于BERT語言模型融合CRF的實體識別方法
4.2.1 相關(guān)原理
4.2.2 實驗結(jié)果
4.3 基于BERT語言模型融合Bi LSTM-CRF的實體識別方法
4.3.1 相關(guān)原理
4.3.2 實驗對比及分析
4.4 本章小結(jié)
5 總結(jié)與展望
5.1 全文總結(jié)
5.2 下一步工作展望
參考文獻
附錄
A 學(xué)位論文數(shù)據(jù)集
致謝
本文編號:3811094
【文章頁數(shù)】:81 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
英文摘要
1 緒論
1.1 課題研究背景和意義
1.2 國內(nèi)外相關(guān)研究現(xiàn)狀
1.2.1 傳統(tǒng)基于規(guī)則的命名實體識別方法
1.2.2 基于統(tǒng)計機器學(xué)習(xí)的命名實體識別方法
1.2.3 基于深度學(xué)習(xí)的命名實體識別方法
1.3 論文主要工作內(nèi)容及章節(jié)安排
2 相關(guān)理論與技術(shù)基礎(chǔ)
2.1 自然語言的數(shù)值化
2.1.1 獨熱編碼表示
2.1.2 分布式編碼表示
2.2 基于統(tǒng)計機器學(xué)習(xí)的模型
2.2.1 條件隨機場
2.2.2 維特比算法
2.3 深度學(xué)習(xí)相關(guān)理論與模型
2.3.1 激活函數(shù)
2.3.2 循環(huán)神經(jīng)網(wǎng)絡(luò)
2.3.3 長短期記憶網(wǎng)絡(luò)
2.3.4 注意力機制模型Transformer
2.3.5 正則化方法Dropout
2.4 本章小結(jié)
3 基于循環(huán)神經(jīng)網(wǎng)絡(luò)的實體識別方法
3.1 基于BiLSTM-CRF模型的實體識別方法
3.1.1 BiLSTM模型
3.1.2 BiLSTM-CRF模型
3.2 基于Hierarchical BiLSTM-CRF模型的實體識別方法
3.3 實驗語料及其預(yù)處理
3.3.1 數(shù)據(jù)集介紹
3.3.2 數(shù)據(jù)預(yù)處理及其統(tǒng)計
3.4 相關(guān)實驗
3.4.1 實驗評價指標
3.4.2 基于BiLSTM-CRF模型的實體識別實驗結(jié)果及分析
3.4.3 基于Hierarchical BiLSTM-CRF模型的實體識別實驗結(jié)果及分析
3.5 本章小結(jié)
4 基于深層語境語言模型的實體識別方法
4.1 深層語境語言模型BERT
4.1.1 輸入表示
4.1.2 特征編碼
4.1.3 預(yù)訓(xùn)練策略
4.1.4 相關(guān)總結(jié)
4.2 基于BERT語言模型融合CRF的實體識別方法
4.2.1 相關(guān)原理
4.2.2 實驗結(jié)果
4.3 基于BERT語言模型融合Bi LSTM-CRF的實體識別方法
4.3.1 相關(guān)原理
4.3.2 實驗對比及分析
4.4 本章小結(jié)
5 總結(jié)與展望
5.1 全文總結(jié)
5.2 下一步工作展望
參考文獻
附錄
A 學(xué)位論文數(shù)據(jù)集
致謝
本文編號:3811094
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3811094.html
最近更新
教材專著