深度學(xué)習(xí)在簡歷解析中的應(yīng)用研究
發(fā)布時間:2023-10-14 07:02
隨著文本數(shù)據(jù)在互聯(lián)網(wǎng)上的快速增長,海量格式自由的文本簡歷雖然在工作中給人們帶來了便利,但也產(chǎn)生了信息過載的困擾。為了提升非結(jié)構(gòu)化文本簡歷的解析性能,本文將深度學(xué)習(xí)技術(shù)應(yīng)用于簡歷解析中。主要工作如下:1.基于字序列的中文簡歷解析方法研究。針對淺層神經(jīng)網(wǎng)絡(luò)生成詞表示的缺陷,構(gòu)建雙向長短時記憶模型(Bidirectional Long Short-Term Memory,BLSTM)對字序列進(jìn)行建模,獲得包含詞內(nèi)部信息的詞表示;然后結(jié)合BLSTM和條件隨機(jī)場(Conditional Random Fields,CRF)(BLSTM-CRF)對生成的詞表示進(jìn)行建模并對模型調(diào)優(yōu);最后使用訓(xùn)練好的模型對非結(jié)構(gòu)化文本簡歷進(jìn)行解析。實驗結(jié)果顯示,與傳統(tǒng)詞向量方案的簡歷解析模型相比,該方法的F1-score提升了2.31%。2.基于特征融合的中文簡歷解析方法研究。針對簡歷解析模型使用單一特征難以提高模型性能的局限性,提出融合多種有效特征來提升簡歷解析模型性能的方案。本文融合的是傳統(tǒng)淺層神經(jīng)網(wǎng)絡(luò)生成的語義特征和BLSTM對字序列建模生成的特征。(1)采用concat的方式對這兩種特征進(jìn)行融合,然后使用BL...
【文章頁數(shù)】:85 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 研究背景和意義
1.1.1 研究背景
1.1.2 研究意義
1.2 簡歷解析的發(fā)展與現(xiàn)狀
1.3 中文簡歷解析的技術(shù)難點
1.4 研究內(nèi)容與論文結(jié)構(gòu)
第2章 簡歷解析相關(guān)理論基礎(chǔ)
2.1 基于規(guī)則的簡歷解析方法
2.2 基于條件隨機(jī)場的簡歷解析方法
2.3 深度學(xué)習(xí)理論基礎(chǔ)
2.3.1 深度學(xué)習(xí)概述
2.3.2 深度神經(jīng)網(wǎng)絡(luò)基礎(chǔ)理論
2.4 評價方法
2.5 本章小結(jié)
第3章 基于字序列的中文簡歷解析方法
3.1 命名實體識別技術(shù)概述
3.2 基于CBLSTMs-CRF的中文簡歷解析方法
3.2.1 字序列信息的詞表示
3.2.2 基于BLSTM-CRF的中文簡歷解析
3.2.3 算法流程總結(jié)
3.3 實驗結(jié)果與分析
3.3.1 數(shù)據(jù)集與實驗環(huán)境
3.3.2 數(shù)據(jù)預(yù)處理
3.3.3 實驗設(shè)置
3.3.4 CBLSTMs-CRF模型有效性驗證
3.3.5 字序列詞表示在不同模型中的有效性驗證
3.4 本章小結(jié)
第4章 基于多特征融合的中文簡歷解析方法
4.1 引言
4.2 基于CWBLSTMs-CRF的中文簡歷解析方法
4.2.1 詞向量模型
4.2.2 聯(lián)合字序列信息的詞表示
4.2.3 算法流程總結(jié)
4.2.4 實驗設(shè)置
4.2.5 CWBLSTMs-CRF方法有效性驗證
4.2.6 融合字序列特征方法在不同模型中的有效性驗證
4.3 基于注意力機(jī)制的中文簡歷解析方法
4.3.1 注意力機(jī)制概述
4.3.2 基于Att-BLSTMs-CRF的中文簡歷解析方法
4.3.3 算法流程總結(jié)
4.3.4 實驗設(shè)置
4.3.5 注意力機(jī)制有效性驗證
4.4 本章小結(jié)
第5章 基于深度學(xué)習(xí)的簡歷解析系統(tǒng)設(shè)計
5.1 系統(tǒng)需求分析
5.2 基于深度學(xué)習(xí)的簡歷解析系統(tǒng)設(shè)計
5.2.1 獲取文本簡歷模塊
5.2.2 實體標(biāo)注抽取模塊
5.2.3 數(shù)據(jù)存儲模塊
5.2.4 前端輸出模塊
5.3 本章小結(jié)
第6章 總結(jié)與展望
6.1 工作總結(jié)
6.2 工作展望
參考文獻(xiàn)
致謝
附錄 攻讀碩士學(xué)位期間從事的科研工作及取得的成果
本文編號:3853829
【文章頁數(shù)】:85 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 研究背景和意義
1.1.1 研究背景
1.1.2 研究意義
1.2 簡歷解析的發(fā)展與現(xiàn)狀
1.3 中文簡歷解析的技術(shù)難點
1.4 研究內(nèi)容與論文結(jié)構(gòu)
第2章 簡歷解析相關(guān)理論基礎(chǔ)
2.1 基于規(guī)則的簡歷解析方法
2.2 基于條件隨機(jī)場的簡歷解析方法
2.3 深度學(xué)習(xí)理論基礎(chǔ)
2.3.1 深度學(xué)習(xí)概述
2.3.2 深度神經(jīng)網(wǎng)絡(luò)基礎(chǔ)理論
2.4 評價方法
2.5 本章小結(jié)
第3章 基于字序列的中文簡歷解析方法
3.1 命名實體識別技術(shù)概述
3.2 基于CBLSTMs-CRF的中文簡歷解析方法
3.2.1 字序列信息的詞表示
3.2.2 基于BLSTM-CRF的中文簡歷解析
3.2.3 算法流程總結(jié)
3.3 實驗結(jié)果與分析
3.3.1 數(shù)據(jù)集與實驗環(huán)境
3.3.2 數(shù)據(jù)預(yù)處理
3.3.3 實驗設(shè)置
3.3.4 CBLSTMs-CRF模型有效性驗證
3.3.5 字序列詞表示在不同模型中的有效性驗證
3.4 本章小結(jié)
第4章 基于多特征融合的中文簡歷解析方法
4.1 引言
4.2 基于CWBLSTMs-CRF的中文簡歷解析方法
4.2.1 詞向量模型
4.2.2 聯(lián)合字序列信息的詞表示
4.2.3 算法流程總結(jié)
4.2.4 實驗設(shè)置
4.2.5 CWBLSTMs-CRF方法有效性驗證
4.2.6 融合字序列特征方法在不同模型中的有效性驗證
4.3 基于注意力機(jī)制的中文簡歷解析方法
4.3.1 注意力機(jī)制概述
4.3.2 基于Att-BLSTMs-CRF的中文簡歷解析方法
4.3.3 算法流程總結(jié)
4.3.4 實驗設(shè)置
4.3.5 注意力機(jī)制有效性驗證
4.4 本章小結(jié)
第5章 基于深度學(xué)習(xí)的簡歷解析系統(tǒng)設(shè)計
5.1 系統(tǒng)需求分析
5.2 基于深度學(xué)習(xí)的簡歷解析系統(tǒng)設(shè)計
5.2.1 獲取文本簡歷模塊
5.2.2 實體標(biāo)注抽取模塊
5.2.3 數(shù)據(jù)存儲模塊
5.2.4 前端輸出模塊
5.3 本章小結(jié)
第6章 總結(jié)與展望
6.1 工作總結(jié)
6.2 工作展望
參考文獻(xiàn)
致謝
附錄 攻讀碩士學(xué)位期間從事的科研工作及取得的成果
本文編號:3853829
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3853829.html
最近更新
教材專著