基于CNKI的中文醫(yī)學(xué)知識圖譜構(gòu)建與應(yīng)用
發(fā)布時間:2020-12-10 10:39
隨著人們生活水平的日益提高,大家對于醫(yī)療健康的關(guān)注度逐年上升,這不僅體現(xiàn)在人們對于醫(yī)學(xué)知識需求的不斷增長,也體現(xiàn)在我國醫(yī)學(xué)研究上的不斷創(chuàng)新。近年來,我國的醫(yī)學(xué)科研水平持續(xù)提高,醫(yī)學(xué)科研人員每年產(chǎn)出海量的相關(guān)文獻(xiàn)。這些文獻(xiàn)數(shù)量龐大,內(nèi)容繁雜,并且專業(yè)性較強(qiáng),對于普通讀者來說難以理解論文內(nèi)涵。然而,這些數(shù)據(jù)中蘊(yùn)含豐富的專業(yè)醫(yī)學(xué)知識,使用文本挖掘技術(shù)將這些知識加工為結(jié)構(gòu)化信息,將為中文醫(yī)療知識信息化帶來巨大進(jìn)步。自然語言處理的快速發(fā)展,使得從文獻(xiàn)中自動抽取醫(yī)學(xué)實體及實體間關(guān)系成為可能。抽取到的醫(yī)學(xué)知識可用來構(gòu)建醫(yī)學(xué)知識圖譜,推動我國醫(yī)學(xué)智能化發(fā)展。知識圖譜可以將非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù),促進(jìn)人們對于知識單元的理解與應(yīng)用。近年來,知識圖譜的構(gòu)建與應(yīng)用越來越受到工業(yè)界的關(guān)注,并且大量企業(yè)嘗試將其應(yīng)用在商業(yè)場景中。本文基于中文醫(yī)學(xué)文獻(xiàn)構(gòu)建醫(yī)學(xué)知識圖譜,其構(gòu)建過程主要分為四部分:醫(yī)學(xué)知識獲取,醫(yī)學(xué)命名實體識別,實體關(guān)系抽取以及知識圖譜存儲。本文聚焦于中文醫(yī)學(xué)相關(guān)文獻(xiàn),數(shù)據(jù)主要來源于中國知網(wǎng)(CNKI)。在醫(yī)學(xué)知識獲取階段,本文通過模擬人類點(diǎn)擊的行為從CNKI中獲取文獻(xiàn)摘要數(shù)據(jù),并進(jìn)行數(shù)據(jù)預(yù)處理。...
【文章來源】:大連理工大學(xué)遼寧省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:60 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 知識圖譜
1.2.2 知識圖譜相關(guān)研究
1.2.3 醫(yī)學(xué)領(lǐng)域知識圖譜
1.3 本文主要工作
1.4 本文組織結(jié)構(gòu)
2 知識圖譜構(gòu)建相關(guān)技術(shù)
2.1 知識圖譜自動化構(gòu)建流程
2.2 知識獲取
2.3 醫(yī)學(xué)命名實體識別
2.4 醫(yī)學(xué)實體關(guān)系抽取
2.5 知識圖譜存儲
2.6 本章小結(jié)
3 面向CNKI的醫(yī)學(xué)命名實體識別
3.1 引言
3.2 醫(yī)學(xué)知識獲取
3.2.1 醫(yī)學(xué)文獻(xiàn)爬取
3.2.2 醫(yī)學(xué)實體庫構(gòu)建
3.3 特征構(gòu)建
3.3.1 字符特征
3.3.2 中文部首特征
3.4 基于Attention機(jī)制的醫(yī)學(xué)命名實體識別
3.4.1 BiLSTM模型
3.4.2 Attention機(jī)制
3.4.3 模型整體結(jié)構(gòu)
3.5 實驗結(jié)果與分析
3.5.1 實驗設(shè)置
3.5.2 結(jié)果分析
3.6 本章小結(jié)
4 面向CNKI的醫(yī)學(xué)實體關(guān)系抽取
4.1 引言
4.2 文本預(yù)處理
4.3 特征構(gòu)建
4.3.1 詞語特征
4.3.2 位置特征
4.4 基于Multihop-Attention機(jī)制的醫(yī)學(xué)實體關(guān)系抽取
4.4.1 Self-Attention機(jī)制
4.4.2 Multihop-Attention機(jī)制
4.4.3 模型整體結(jié)構(gòu)
4.5 實驗結(jié)果與分析
4.5.1 實驗設(shè)置
4.5.2 結(jié)果分析
4.6 本章小結(jié)
5 基于醫(yī)學(xué)知識圖譜的中文醫(yī)學(xué)文獻(xiàn)檢索系統(tǒng)
5.1 系統(tǒng)需求分析
5.2 系統(tǒng)詳細(xì)設(shè)計
5.2.1 全文索引
5.2.2 API構(gòu)建
5.2.3 系統(tǒng)搭建
5.2.4 前端開發(fā)
5.3 系統(tǒng)展示
5.4 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表學(xué)術(shù)論文情況
攻讀碩士學(xué)位期間所獲獎項情況
攻讀碩士學(xué)位期間參與科研項目情況
致謝
【參考文獻(xiàn)】:
期刊論文
[1]智能家居場景聯(lián)動中基于知識圖譜的隱式?jīng)_突檢測方法研究[J]. 肖丁,王乾宇,蔡銘,李秀. 計算機(jī)學(xué)報. 2019(06)
[2]基于知識圖譜和頻繁序列挖掘的旅游路線推薦[J]. 孫文平,常亮,賓辰忠,古天龍,孫彥鵬. 計算機(jī)科學(xué). 2019(02)
[3]基于知識圖譜的網(wǎng)絡(luò)輿情突發(fā)話題內(nèi)容監(jiān)測研究[J]. 馬哲坤,涂艷. 情報科學(xué). 2019(02)
[4]基于科學(xué)知識圖譜的東北三省區(qū)域研究熱點(diǎn)分析[J]. 陳曉玲,劉東亮. 情報學(xué)報. 2018(12)
[5]醫(yī)學(xué)知識圖譜構(gòu)建技術(shù)與研究進(jìn)展[J]. 袁凱琦,鄧揚(yáng),陳道源,張冰,雷凱. 計算機(jī)應(yīng)用研究. 2018(07)
[6]中醫(yī)藥知識圖譜構(gòu)建與應(yīng)用[J]. 阮彤,孫程琳,王昊奮,方之家,殷亦超. 醫(yī)學(xué)信息學(xué)雜志. 2016(04)
[7]基于文本挖掘的乙型肝炎相關(guān)文獻(xiàn)知識圖譜分析[J]. 劉俊麗,張秀梅,蔣勇青. 醫(yī)學(xué)信息學(xué)雜志. 2014(01)
[8]基于文獻(xiàn)定量及知識圖譜方法的醫(yī)學(xué)信息學(xué)研究現(xiàn)狀分析[J]. 李國棟. 中國科技信息. 2013(24)
本文編號:2908556
【文章來源】:大連理工大學(xué)遼寧省 211工程院校 985工程院校 教育部直屬院校
【文章頁數(shù)】:60 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 知識圖譜
1.2.2 知識圖譜相關(guān)研究
1.2.3 醫(yī)學(xué)領(lǐng)域知識圖譜
1.3 本文主要工作
1.4 本文組織結(jié)構(gòu)
2 知識圖譜構(gòu)建相關(guān)技術(shù)
2.1 知識圖譜自動化構(gòu)建流程
2.2 知識獲取
2.3 醫(yī)學(xué)命名實體識別
2.4 醫(yī)學(xué)實體關(guān)系抽取
2.5 知識圖譜存儲
2.6 本章小結(jié)
3 面向CNKI的醫(yī)學(xué)命名實體識別
3.1 引言
3.2 醫(yī)學(xué)知識獲取
3.2.1 醫(yī)學(xué)文獻(xiàn)爬取
3.2.2 醫(yī)學(xué)實體庫構(gòu)建
3.3 特征構(gòu)建
3.3.1 字符特征
3.3.2 中文部首特征
3.4 基于Attention機(jī)制的醫(yī)學(xué)命名實體識別
3.4.1 BiLSTM模型
3.4.2 Attention機(jī)制
3.4.3 模型整體結(jié)構(gòu)
3.5 實驗結(jié)果與分析
3.5.1 實驗設(shè)置
3.5.2 結(jié)果分析
3.6 本章小結(jié)
4 面向CNKI的醫(yī)學(xué)實體關(guān)系抽取
4.1 引言
4.2 文本預(yù)處理
4.3 特征構(gòu)建
4.3.1 詞語特征
4.3.2 位置特征
4.4 基于Multihop-Attention機(jī)制的醫(yī)學(xué)實體關(guān)系抽取
4.4.1 Self-Attention機(jī)制
4.4.2 Multihop-Attention機(jī)制
4.4.3 模型整體結(jié)構(gòu)
4.5 實驗結(jié)果與分析
4.5.1 實驗設(shè)置
4.5.2 結(jié)果分析
4.6 本章小結(jié)
5 基于醫(yī)學(xué)知識圖譜的中文醫(yī)學(xué)文獻(xiàn)檢索系統(tǒng)
5.1 系統(tǒng)需求分析
5.2 系統(tǒng)詳細(xì)設(shè)計
5.2.1 全文索引
5.2.2 API構(gòu)建
5.2.3 系統(tǒng)搭建
5.2.4 前端開發(fā)
5.3 系統(tǒng)展示
5.4 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表學(xué)術(shù)論文情況
攻讀碩士學(xué)位期間所獲獎項情況
攻讀碩士學(xué)位期間參與科研項目情況
致謝
【參考文獻(xiàn)】:
期刊論文
[1]智能家居場景聯(lián)動中基于知識圖譜的隱式?jīng)_突檢測方法研究[J]. 肖丁,王乾宇,蔡銘,李秀. 計算機(jī)學(xué)報. 2019(06)
[2]基于知識圖譜和頻繁序列挖掘的旅游路線推薦[J]. 孫文平,常亮,賓辰忠,古天龍,孫彥鵬. 計算機(jī)科學(xué). 2019(02)
[3]基于知識圖譜的網(wǎng)絡(luò)輿情突發(fā)話題內(nèi)容監(jiān)測研究[J]. 馬哲坤,涂艷. 情報科學(xué). 2019(02)
[4]基于科學(xué)知識圖譜的東北三省區(qū)域研究熱點(diǎn)分析[J]. 陳曉玲,劉東亮. 情報學(xué)報. 2018(12)
[5]醫(yī)學(xué)知識圖譜構(gòu)建技術(shù)與研究進(jìn)展[J]. 袁凱琦,鄧揚(yáng),陳道源,張冰,雷凱. 計算機(jī)應(yīng)用研究. 2018(07)
[6]中醫(yī)藥知識圖譜構(gòu)建與應(yīng)用[J]. 阮彤,孫程琳,王昊奮,方之家,殷亦超. 醫(yī)學(xué)信息學(xué)雜志. 2016(04)
[7]基于文本挖掘的乙型肝炎相關(guān)文獻(xiàn)知識圖譜分析[J]. 劉俊麗,張秀梅,蔣勇青. 醫(yī)學(xué)信息學(xué)雜志. 2014(01)
[8]基于文獻(xiàn)定量及知識圖譜方法的醫(yī)學(xué)信息學(xué)研究現(xiàn)狀分析[J]. 李國棟. 中國科技信息. 2013(24)
本文編號:2908556
本文鏈接:http://sikaile.net/yixuelunwen/yiyuanguanlilunwen/2908556.html
最近更新
教材專著