基于循環(huán)神經(jīng)網(wǎng)絡(luò)的中文影像報(bào)告命名實(shí)體識(shí)別研究
發(fā)布時(shí)間:2023-08-06 19:21
快速發(fā)展的醫(yī)療信息系統(tǒng)產(chǎn)生了海量的臨床文本,它們用文本形式記錄了大量的健康信息,是改善臨床護(hù)理和支持研究的寶貴信息來(lái)源,同時(shí)這些海量、非結(jié)構(gòu)化數(shù)據(jù)也給自動(dòng)管理和高效利用提出了巨大的挑戰(zhàn)。影像報(bào)告是一種典型的臨床文本,從非結(jié)構(gòu)化的影像報(bào)告中抽取醫(yī)療概念,可以為病歷分類(lèi)、精細(xì)患者分群以及自動(dòng)問(wèn)答系統(tǒng)等提供支持。中文影像報(bào)告作為一種專(zhuān)業(yè)臨床文本,具有鮮明的語(yǔ)言特點(diǎn)和更為復(fù)雜的語(yǔ)言形式,同時(shí)中文臨床文本缺少公開(kāi)標(biāo)注語(yǔ)料,所以相比較通用領(lǐng)域文本,中文影像報(bào)告的分析應(yīng)用面臨更大的困難。本文針對(duì)中文影像報(bào)告,研究命名實(shí)體識(shí)別的方法,主要工作包括以下幾個(gè)方面:第一,參考I2B2標(biāo)注體系,結(jié)合中文影像報(bào)告的特點(diǎn),在醫(yī)務(wù)人員的指導(dǎo)下,本文制定了影像報(bào)告命名實(shí)體識(shí)別的標(biāo)注方案,分別建立了規(guī)模為39954個(gè)字符的分詞標(biāo)注與分字標(biāo)注的影像報(bào)告語(yǔ)料庫(kù)。第二,根據(jù)手工創(chuàng)建的影像報(bào)告標(biāo)注語(yǔ)料庫(kù),以雙向循環(huán)神經(jīng)網(wǎng)絡(luò)為基本框架,本文基于LSTM單元、GRU單元和條件隨機(jī)場(chǎng)設(shè)計(jì)了三種不同的中文影像報(bào)告命名實(shí)體識(shí)別模型。第三,本文通過(guò)影像報(bào)告語(yǔ)料庫(kù)訓(xùn)練構(gòu)建的中文影像報(bào)告命名實(shí)體識(shí)別模型,并通過(guò)實(shí)驗(yàn)對(duì)模型的性能進(jìn)行評(píng)估和分析;...
【文章頁(yè)數(shù)】:62 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景及意義
1.2 研究現(xiàn)狀
1.2.1 命名實(shí)體識(shí)別
1.2.2 醫(yī)療領(lǐng)域的命名實(shí)體識(shí)別
1.2.3 電子病歷語(yǔ)料庫(kù)構(gòu)建
1.3 本文研究
1.4 組織結(jié)構(gòu)
第二章 相關(guān)背景知識(shí)
2.1 隱馬爾可夫模型
2.2 條件隨機(jī)場(chǎng)
2.3 循環(huán)神經(jīng)網(wǎng)絡(luò)
2.4 LSTM單元和GRU單元
2.5 本章小結(jié)
第三章 影像報(bào)告語(yǔ)料庫(kù)構(gòu)建
3.1 影像報(bào)告的標(biāo)注體系和方法
3.1.1 影像報(bào)告的特點(diǎn)
3.1.2 命名實(shí)體分類(lèi)
3.2 影像報(bào)告的語(yǔ)料庫(kù)
3.2.1 影像報(bào)告數(shù)據(jù)
3.2.2 影像報(bào)告分詞標(biāo)注
3.2.3 影像報(bào)告分字標(biāo)注
3.3 本章小結(jié)
第四章 神經(jīng)網(wǎng)絡(luò)的中文影像報(bào)告命名實(shí)體識(shí)別模型
4.1 模型的基本框架
4.2 輸入層
4.3 特征提取層
4.3.1 BLSTM
4.3.2 BGRU
4.3.3 GRU-LSTM
4.4 輸出層
4.5 本章小結(jié)
第五章 實(shí)驗(yàn)與分析
5.1 實(shí)驗(yàn)環(huán)境和評(píng)價(jià)指標(biāo)
5.2 實(shí)驗(yàn)設(shè)計(jì)
5.3 實(shí)驗(yàn)結(jié)果與分析
5.3.1 模型性能和比較
5.3.2 Dropout對(duì)性能的影響
5.3.3 詞向量及優(yōu)化器對(duì)性能的影響
5.3.4 分字標(biāo)注與分詞標(biāo)注對(duì)性能的影響
5.4 本章小結(jié)
第六章 影像報(bào)告命名實(shí)體識(shí)別的原型系統(tǒng)
6.1 系統(tǒng)設(shè)計(jì)
6.2 系統(tǒng)展示
6.3 本章小結(jié)
第七章 總結(jié)與展望
7.1 本文總結(jié)
7.2 不足和展望
參考文獻(xiàn)
致謝
本文編號(hào):3839906
【文章頁(yè)數(shù)】:62 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景及意義
1.2 研究現(xiàn)狀
1.2.1 命名實(shí)體識(shí)別
1.2.2 醫(yī)療領(lǐng)域的命名實(shí)體識(shí)別
1.2.3 電子病歷語(yǔ)料庫(kù)構(gòu)建
1.3 本文研究
1.4 組織結(jié)構(gòu)
第二章 相關(guān)背景知識(shí)
2.1 隱馬爾可夫模型
2.2 條件隨機(jī)場(chǎng)
2.3 循環(huán)神經(jīng)網(wǎng)絡(luò)
2.4 LSTM單元和GRU單元
2.5 本章小結(jié)
第三章 影像報(bào)告語(yǔ)料庫(kù)構(gòu)建
3.1 影像報(bào)告的標(biāo)注體系和方法
3.1.1 影像報(bào)告的特點(diǎn)
3.1.2 命名實(shí)體分類(lèi)
3.2 影像報(bào)告的語(yǔ)料庫(kù)
3.2.1 影像報(bào)告數(shù)據(jù)
3.2.2 影像報(bào)告分詞標(biāo)注
3.2.3 影像報(bào)告分字標(biāo)注
3.3 本章小結(jié)
第四章 神經(jīng)網(wǎng)絡(luò)的中文影像報(bào)告命名實(shí)體識(shí)別模型
4.1 模型的基本框架
4.2 輸入層
4.3 特征提取層
4.3.1 BLSTM
4.3.2 BGRU
4.3.3 GRU-LSTM
4.4 輸出層
4.5 本章小結(jié)
第五章 實(shí)驗(yàn)與分析
5.1 實(shí)驗(yàn)環(huán)境和評(píng)價(jià)指標(biāo)
5.2 實(shí)驗(yàn)設(shè)計(jì)
5.3 實(shí)驗(yàn)結(jié)果與分析
5.3.1 模型性能和比較
5.3.2 Dropout對(duì)性能的影響
5.3.3 詞向量及優(yōu)化器對(duì)性能的影響
5.3.4 分字標(biāo)注與分詞標(biāo)注對(duì)性能的影響
5.4 本章小結(jié)
第六章 影像報(bào)告命名實(shí)體識(shí)別的原型系統(tǒng)
6.1 系統(tǒng)設(shè)計(jì)
6.2 系統(tǒng)展示
6.3 本章小結(jié)
第七章 總結(jié)與展望
7.1 本文總結(jié)
7.2 不足和展望
參考文獻(xiàn)
致謝
本文編號(hào):3839906
本文鏈接:http://sikaile.net/kejilunwen/shengwushengchang/3839906.html
最近更新
教材專(zhuān)著