基于CNKI的中文醫(yī)學(xué)知識(shí)圖譜構(gòu)建與應(yīng)用
發(fā)布時(shí)間:2020-12-10 10:39
隨著人們生活水平的日益提高,大家對(duì)于醫(yī)療健康的關(guān)注度逐年上升,這不僅體現(xiàn)在人們對(duì)于醫(yī)學(xué)知識(shí)需求的不斷增長(zhǎng),也體現(xiàn)在我國(guó)醫(yī)學(xué)研究上的不斷創(chuàng)新。近年來,我國(guó)的醫(yī)學(xué)科研水平持續(xù)提高,醫(yī)學(xué)科研人員每年產(chǎn)出海量的相關(guān)文獻(xiàn)。這些文獻(xiàn)數(shù)量龐大,內(nèi)容繁雜,并且專業(yè)性較強(qiáng),對(duì)于普通讀者來說難以理解論文內(nèi)涵。然而,這些數(shù)據(jù)中蘊(yùn)含豐富的專業(yè)醫(yī)學(xué)知識(shí),使用文本挖掘技術(shù)將這些知識(shí)加工為結(jié)構(gòu)化信息,將為中文醫(yī)療知識(shí)信息化帶來巨大進(jìn)步。自然語言處理的快速發(fā)展,使得從文獻(xiàn)中自動(dòng)抽取醫(yī)學(xué)實(shí)體及實(shí)體間關(guān)系成為可能。抽取到的醫(yī)學(xué)知識(shí)可用來構(gòu)建醫(yī)學(xué)知識(shí)圖譜,推動(dòng)我國(guó)醫(yī)學(xué)智能化發(fā)展。知識(shí)圖譜可以將非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù),促進(jìn)人們對(duì)于知識(shí)單元的理解與應(yīng)用。近年來,知識(shí)圖譜的構(gòu)建與應(yīng)用越來越受到工業(yè)界的關(guān)注,并且大量企業(yè)嘗試將其應(yīng)用在商業(yè)場(chǎng)景中。本文基于中文醫(yī)學(xué)文獻(xiàn)構(gòu)建醫(yī)學(xué)知識(shí)圖譜,其構(gòu)建過程主要分為四部分:醫(yī)學(xué)知識(shí)獲取,醫(yī)學(xué)命名實(shí)體識(shí)別,實(shí)體關(guān)系抽取以及知識(shí)圖譜存儲(chǔ)。本文聚焦于中文醫(yī)學(xué)相關(guān)文獻(xiàn),數(shù)據(jù)主要來源于中國(guó)知網(wǎng)(CNKI)。在醫(yī)學(xué)知識(shí)獲取階段,本文通過模擬人類點(diǎn)擊的行為從CNKI中獲取文獻(xiàn)摘要數(shù)據(jù),并進(jìn)行數(shù)據(jù)預(yù)處理。...
【文章來源】:大連理工大學(xué)遼寧省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:60 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 知識(shí)圖譜
1.2.2 知識(shí)圖譜相關(guān)研究
1.2.3 醫(yī)學(xué)領(lǐng)域知識(shí)圖譜
1.3 本文主要工作
1.4 本文組織結(jié)構(gòu)
2 知識(shí)圖譜構(gòu)建相關(guān)技術(shù)
2.1 知識(shí)圖譜自動(dòng)化構(gòu)建流程
2.2 知識(shí)獲取
2.3 醫(yī)學(xué)命名實(shí)體識(shí)別
2.4 醫(yī)學(xué)實(shí)體關(guān)系抽取
2.5 知識(shí)圖譜存儲(chǔ)
2.6 本章小結(jié)
3 面向CNKI的醫(yī)學(xué)命名實(shí)體識(shí)別
3.1 引言
3.2 醫(yī)學(xué)知識(shí)獲取
3.2.1 醫(yī)學(xué)文獻(xiàn)爬取
3.2.2 醫(yī)學(xué)實(shí)體庫(kù)構(gòu)建
3.3 特征構(gòu)建
3.3.1 字符特征
3.3.2 中文部首特征
3.4 基于Attention機(jī)制的醫(yī)學(xué)命名實(shí)體識(shí)別
3.4.1 BiLSTM模型
3.4.2 Attention機(jī)制
3.4.3 模型整體結(jié)構(gòu)
3.5 實(shí)驗(yàn)結(jié)果與分析
3.5.1 實(shí)驗(yàn)設(shè)置
3.5.2 結(jié)果分析
3.6 本章小結(jié)
4 面向CNKI的醫(yī)學(xué)實(shí)體關(guān)系抽取
4.1 引言
4.2 文本預(yù)處理
4.3 特征構(gòu)建
4.3.1 詞語特征
4.3.2 位置特征
4.4 基于Multihop-Attention機(jī)制的醫(yī)學(xué)實(shí)體關(guān)系抽取
4.4.1 Self-Attention機(jī)制
4.4.2 Multihop-Attention機(jī)制
4.4.3 模型整體結(jié)構(gòu)
4.5 實(shí)驗(yàn)結(jié)果與分析
4.5.1 實(shí)驗(yàn)設(shè)置
4.5.2 結(jié)果分析
4.6 本章小結(jié)
5 基于醫(yī)學(xué)知識(shí)圖譜的中文醫(yī)學(xué)文獻(xiàn)檢索系統(tǒng)
5.1 系統(tǒng)需求分析
5.2 系統(tǒng)詳細(xì)設(shè)計(jì)
5.2.1 全文索引
5.2.2 API構(gòu)建
5.2.3 系統(tǒng)搭建
5.2.4 前端開發(fā)
5.3 系統(tǒng)展示
5.4 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表學(xué)術(shù)論文情況
攻讀碩士學(xué)位期間所獲獎(jiǎng)項(xiàng)情況
攻讀碩士學(xué)位期間參與科研項(xiàng)目情況
致謝
【參考文獻(xiàn)】:
期刊論文
[1]智能家居場(chǎng)景聯(lián)動(dòng)中基于知識(shí)圖譜的隱式?jīng)_突檢測(cè)方法研究[J]. 肖丁,王乾宇,蔡銘,李秀. 計(jì)算機(jī)學(xué)報(bào). 2019(06)
[2]基于知識(shí)圖譜和頻繁序列挖掘的旅游路線推薦[J]. 孫文平,常亮,賓辰忠,古天龍,孫彥鵬. 計(jì)算機(jī)科學(xué). 2019(02)
[3]基于知識(shí)圖譜的網(wǎng)絡(luò)輿情突發(fā)話題內(nèi)容監(jiān)測(cè)研究[J]. 馬哲坤,涂艷. 情報(bào)科學(xué). 2019(02)
[4]基于科學(xué)知識(shí)圖譜的東北三省區(qū)域研究熱點(diǎn)分析[J]. 陳曉玲,劉東亮. 情報(bào)學(xué)報(bào). 2018(12)
[5]醫(yī)學(xué)知識(shí)圖譜構(gòu)建技術(shù)與研究進(jìn)展[J]. 袁凱琦,鄧揚(yáng),陳道源,張冰,雷凱. 計(jì)算機(jī)應(yīng)用研究. 2018(07)
[6]中醫(yī)藥知識(shí)圖譜構(gòu)建與應(yīng)用[J]. 阮彤,孫程琳,王昊奮,方之家,殷亦超. 醫(yī)學(xué)信息學(xué)雜志. 2016(04)
[7]基于文本挖掘的乙型肝炎相關(guān)文獻(xiàn)知識(shí)圖譜分析[J]. 劉俊麗,張秀梅,蔣勇青. 醫(yī)學(xué)信息學(xué)雜志. 2014(01)
[8]基于文獻(xiàn)定量及知識(shí)圖譜方法的醫(yī)學(xué)信息學(xué)研究現(xiàn)狀分析[J]. 李國(guó)棟. 中國(guó)科技信息. 2013(24)
本文編號(hào):2908556
【文章來源】:大連理工大學(xué)遼寧省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:60 頁
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 知識(shí)圖譜
1.2.2 知識(shí)圖譜相關(guān)研究
1.2.3 醫(yī)學(xué)領(lǐng)域知識(shí)圖譜
1.3 本文主要工作
1.4 本文組織結(jié)構(gòu)
2 知識(shí)圖譜構(gòu)建相關(guān)技術(shù)
2.1 知識(shí)圖譜自動(dòng)化構(gòu)建流程
2.2 知識(shí)獲取
2.3 醫(yī)學(xué)命名實(shí)體識(shí)別
2.4 醫(yī)學(xué)實(shí)體關(guān)系抽取
2.5 知識(shí)圖譜存儲(chǔ)
2.6 本章小結(jié)
3 面向CNKI的醫(yī)學(xué)命名實(shí)體識(shí)別
3.1 引言
3.2 醫(yī)學(xué)知識(shí)獲取
3.2.1 醫(yī)學(xué)文獻(xiàn)爬取
3.2.2 醫(yī)學(xué)實(shí)體庫(kù)構(gòu)建
3.3 特征構(gòu)建
3.3.1 字符特征
3.3.2 中文部首特征
3.4 基于Attention機(jī)制的醫(yī)學(xué)命名實(shí)體識(shí)別
3.4.1 BiLSTM模型
3.4.2 Attention機(jī)制
3.4.3 模型整體結(jié)構(gòu)
3.5 實(shí)驗(yàn)結(jié)果與分析
3.5.1 實(shí)驗(yàn)設(shè)置
3.5.2 結(jié)果分析
3.6 本章小結(jié)
4 面向CNKI的醫(yī)學(xué)實(shí)體關(guān)系抽取
4.1 引言
4.2 文本預(yù)處理
4.3 特征構(gòu)建
4.3.1 詞語特征
4.3.2 位置特征
4.4 基于Multihop-Attention機(jī)制的醫(yī)學(xué)實(shí)體關(guān)系抽取
4.4.1 Self-Attention機(jī)制
4.4.2 Multihop-Attention機(jī)制
4.4.3 模型整體結(jié)構(gòu)
4.5 實(shí)驗(yàn)結(jié)果與分析
4.5.1 實(shí)驗(yàn)設(shè)置
4.5.2 結(jié)果分析
4.6 本章小結(jié)
5 基于醫(yī)學(xué)知識(shí)圖譜的中文醫(yī)學(xué)文獻(xiàn)檢索系統(tǒng)
5.1 系統(tǒng)需求分析
5.2 系統(tǒng)詳細(xì)設(shè)計(jì)
5.2.1 全文索引
5.2.2 API構(gòu)建
5.2.3 系統(tǒng)搭建
5.2.4 前端開發(fā)
5.3 系統(tǒng)展示
5.4 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表學(xué)術(shù)論文情況
攻讀碩士學(xué)位期間所獲獎(jiǎng)項(xiàng)情況
攻讀碩士學(xué)位期間參與科研項(xiàng)目情況
致謝
【參考文獻(xiàn)】:
期刊論文
[1]智能家居場(chǎng)景聯(lián)動(dòng)中基于知識(shí)圖譜的隱式?jīng)_突檢測(cè)方法研究[J]. 肖丁,王乾宇,蔡銘,李秀. 計(jì)算機(jī)學(xué)報(bào). 2019(06)
[2]基于知識(shí)圖譜和頻繁序列挖掘的旅游路線推薦[J]. 孫文平,常亮,賓辰忠,古天龍,孫彥鵬. 計(jì)算機(jī)科學(xué). 2019(02)
[3]基于知識(shí)圖譜的網(wǎng)絡(luò)輿情突發(fā)話題內(nèi)容監(jiān)測(cè)研究[J]. 馬哲坤,涂艷. 情報(bào)科學(xué). 2019(02)
[4]基于科學(xué)知識(shí)圖譜的東北三省區(qū)域研究熱點(diǎn)分析[J]. 陳曉玲,劉東亮. 情報(bào)學(xué)報(bào). 2018(12)
[5]醫(yī)學(xué)知識(shí)圖譜構(gòu)建技術(shù)與研究進(jìn)展[J]. 袁凱琦,鄧揚(yáng),陳道源,張冰,雷凱. 計(jì)算機(jī)應(yīng)用研究. 2018(07)
[6]中醫(yī)藥知識(shí)圖譜構(gòu)建與應(yīng)用[J]. 阮彤,孫程琳,王昊奮,方之家,殷亦超. 醫(yī)學(xué)信息學(xué)雜志. 2016(04)
[7]基于文本挖掘的乙型肝炎相關(guān)文獻(xiàn)知識(shí)圖譜分析[J]. 劉俊麗,張秀梅,蔣勇青. 醫(yī)學(xué)信息學(xué)雜志. 2014(01)
[8]基于文獻(xiàn)定量及知識(shí)圖譜方法的醫(yī)學(xué)信息學(xué)研究現(xiàn)狀分析[J]. 李國(guó)棟. 中國(guó)科技信息. 2013(24)
本文編號(hào):2908556
本文鏈接:http://sikaile.net/yixuelunwen/yiyuanguanlilunwen/2908556.html
最近更新
教材專著