大數(shù)據(jù)環(huán)境下高血壓知識(shí)庫(kù)構(gòu)建與系統(tǒng)集成方法研究
發(fā)布時(shí)間:2021-06-17 17:42
針對(duì)多源異構(gòu)數(shù)據(jù)提出一種數(shù)據(jù)驅(qū)動(dòng)、自底向上、啟發(fā)式的知識(shí)庫(kù)構(gòu)建方法。闡述其數(shù)據(jù)采集、本體庫(kù)構(gòu)建、知識(shí)抽取、知識(shí)融合、知識(shí)存儲(chǔ)以及知識(shí)更新等方面,為知識(shí)圖譜相關(guān)研究提供有益參考。
【文章來(lái)源】:醫(yī)學(xué)信息學(xué)雜志. 2020,41(10)
【文章頁(yè)數(shù)】:6 頁(yè)
【部分圖文】:
圖1高血壓知識(shí)庫(kù)構(gòu)建流程??屬件抽取??知識(shí)抽取??知識(shí)繳合????38????
關(guān)系及屬性,其分類(lèi)效果直接影響上層??應(yīng)用準(zhǔn)確性。屬性可視為實(shí)體與屬性值之間一種名??詞性關(guān)系,因此可將屬性抽取任務(wù)轉(zhuǎn)化為關(guān)系抽取??任務(wù)。利用引入注意力機(jī)制的Bi?-LSTM?(Att?-??BiLSTM)模型進(jìn)行關(guān)系分類(lèi)及屬性抽齲基本流程??是:將預(yù)訓(xùn)練的詞向量作為輸入,利用Bi-LSTM??抽取文本中的高層語(yǔ)義特征,注意力層通過(guò)引人權(quán)??重向量將詞級(jí)特征合并為句級(jí)特征,以此捕捉句子??的深層語(yǔ)義特征,利用特征分類(lèi)器得到兩個(gè)實(shí)體之??間的關(guān)系。關(guān)系分類(lèi)及屬性抽取基本流程,見(jiàn)圖3。??5.3半結(jié)構(gòu)化數(shù)據(jù)??面向半結(jié)構(gòu)化數(shù)據(jù)的知識(shí)抽取利用包裝器。包??裝器是一種基于規(guī)則的文本信息抽取模型,其規(guī)則??集合易于建立且抽取精度高,適用于半結(jié)構(gòu)化數(shù)據(jù)??的知識(shí)抽齲包裝器基本工作流程是:首先根據(jù)輸??圖3關(guān)系分類(lèi)及屬性抽取基本流程??人數(shù)據(jù)從規(guī)則庫(kù)中選擇對(duì)應(yīng)的規(guī)則,將規(guī)則傳入規(guī)??則執(zhí)行模塊;然后將規(guī)則執(zhí)行模塊中的規(guī)則應(yīng)用于??輸入數(shù)據(jù),抽取出有用信息;最后將上述信息傳人??信息轉(zhuǎn)換模塊中,將傳人的信息轉(zhuǎn)換為特定格式的??知識(shí)。包裝器工作流程,見(jiàn)圖4。??:?包裝器??!??廠??規(guī)則執(zhí)行模塊??規(guī)則庫(kù)??〕??)??信息轉(zhuǎn)換模塊??〇〇??—??半結(jié)構(gòu)化數(shù)據(jù)?知識(shí)??圖4包裝器工作流程??6知識(shí)融合與知識(shí)存儲(chǔ)??6.?1?知識(shí)融合??6.1.1概述知識(shí)融合是知識(shí)圖譜構(gòu)建過(guò)程中重??要步驟。通過(guò)知識(shí)融合可將知識(shí)圖譜內(nèi)部實(shí)體進(jìn)行??精簡(jiǎn),使知識(shí)圖譜運(yùn)轉(zhuǎn)更加有效。知識(shí)融合包括實(shí)??體對(duì)齊、實(shí)體消歧和重復(fù)知識(shí)合并3方面內(nèi)容。??6.1.2實(shí)體對(duì)齊也稱(chēng)為共指消解、實(shí)體匹配、??實(shí)體同義,用于解決多個(gè)指稱(chēng)對(duì)應(yīng)
本流程,見(jiàn)圖3。??5.3半結(jié)構(gòu)化數(shù)據(jù)??面向半結(jié)構(gòu)化數(shù)據(jù)的知識(shí)抽取利用包裝器。包??裝器是一種基于規(guī)則的文本信息抽取模型,其規(guī)則??集合易于建立且抽取精度高,適用于半結(jié)構(gòu)化數(shù)據(jù)??的知識(shí)抽齲包裝器基本工作流程是:首先根據(jù)輸??圖3關(guān)系分類(lèi)及屬性抽取基本流程??人數(shù)據(jù)從規(guī)則庫(kù)中選擇對(duì)應(yīng)的規(guī)則,將規(guī)則傳入規(guī)??則執(zhí)行模塊;然后將規(guī)則執(zhí)行模塊中的規(guī)則應(yīng)用于??輸入數(shù)據(jù),抽取出有用信息;最后將上述信息傳人??信息轉(zhuǎn)換模塊中,將傳人的信息轉(zhuǎn)換為特定格式的??知識(shí)。包裝器工作流程,見(jiàn)圖4。??:?包裝器??!??廠??規(guī)則執(zhí)行模塊??規(guī)則庫(kù)??〕??)??信息轉(zhuǎn)換模塊??〇〇??—??半結(jié)構(gòu)化數(shù)據(jù)?知識(shí)??圖4包裝器工作流程??6知識(shí)融合與知識(shí)存儲(chǔ)??6.?1?知識(shí)融合??6.1.1概述知識(shí)融合是知識(shí)圖譜構(gòu)建過(guò)程中重??要步驟。通過(guò)知識(shí)融合可將知識(shí)圖譜內(nèi)部實(shí)體進(jìn)行??精簡(jiǎn),使知識(shí)圖譜運(yùn)轉(zhuǎn)更加有效。知識(shí)融合包括實(shí)??體對(duì)齊、實(shí)體消歧和重復(fù)知識(shí)合并3方面內(nèi)容。??6.1.2實(shí)體對(duì)齊也稱(chēng)為共指消解、實(shí)體匹配、??實(shí)體同義,用于解決多個(gè)指稱(chēng)對(duì)應(yīng)同一實(shí)體對(duì)象問(wèn)??題。利用實(shí)體對(duì)齊可將多個(gè)指稱(chēng)項(xiàng)關(guān)聯(lián)到統(tǒng)一實(shí)體??對(duì)象,以便將語(yǔ)義網(wǎng)絡(luò)中的分散實(shí)體互聯(lián)起來(lái)。本??文通過(guò)計(jì)算Word2vec模型的詞間空間距離,以此??代表詞間語(yǔ)義相似度,設(shè)定相似度閾值來(lái)劃分本體??間的關(guān)系,以此得到待對(duì)齊實(shí)體。??6.1.3實(shí)體消歧可以消除同名實(shí)體產(chǎn)生的歧??義。由于目標(biāo)實(shí)體概念集合不確定,采用基于聚類(lèi)??的命名實(shí)體消歧。將指向目標(biāo)實(shí)體的指稱(chēng)項(xiàng)取出并??聚在同一個(gè)類(lèi)別下。每個(gè)類(lèi)別包含某一個(gè)命名實(shí)體??的所有可能指向的指稱(chēng)項(xiàng)。根據(jù)命
【參考文獻(xiàn)】:
期刊論文
[1]詞向量語(yǔ)義表示研究進(jìn)展[J]. 李楓林,柯佳. 情報(bào)科學(xué). 2019(05)
[2]中國(guó)高血壓防治指南(2018年修訂版)[J]. Writing Group of 2018 Chinese Guidelines for the Management of Hypertension, Chinese Hypertension League, Chinese Society of Cardiology, Chinese Medical Doctor Association Hypertension Committee, Hypertension Branch of China International Exchange and Promotive Association for Medical and Health Care, Hypertension Branch of Chinese Geriatric Medical Association;. 中國(guó)心血管雜志. 2019(01)
[3]慢性病的治與防[J]. 本刊編輯部. 國(guó)際醫(yī)藥衛(wèi)生導(dǎo)報(bào). 2018 (15)
[4]專(zhuān)利文本主題建模中領(lǐng)域停用詞自動(dòng)選取研究[J]. 俞琰,趙乃瑄. 圖書(shū)情報(bào)工作. 2018(11)
[5]基于多數(shù)據(jù)源的知識(shí)圖譜構(gòu)建方法研究[J]. 吳運(yùn)兵,陰愛(ài)英,林開(kāi)標(biāo),余小燕,賴(lài)國(guó)華. 福州大學(xué)學(xué)報(bào)(自然科學(xué)版). 2017(03)
[6]詞形還原方法及實(shí)現(xiàn)工具比較分析[J]. 吳思竹,錢(qián)慶,胡鐵軍,李丹亞,李軍蓮,洪娜. 現(xiàn)代圖書(shū)情報(bào)技術(shù). 2012(03)
[7]中國(guó)高血壓防治指南2010[J]. 劉力生. 中國(guó)醫(yī)學(xué)前沿雜志(電子版). 2011(05)
[8]領(lǐng)域本體的構(gòu)建方法研究[J]. 張文秀,朱慶華. 圖書(shū)與情報(bào). 2011(01)
本文編號(hào):3235634
【文章來(lái)源】:醫(yī)學(xué)信息學(xué)雜志. 2020,41(10)
【文章頁(yè)數(shù)】:6 頁(yè)
【部分圖文】:
圖1高血壓知識(shí)庫(kù)構(gòu)建流程??屬件抽取??知識(shí)抽取??知識(shí)繳合????38????
關(guān)系及屬性,其分類(lèi)效果直接影響上層??應(yīng)用準(zhǔn)確性。屬性可視為實(shí)體與屬性值之間一種名??詞性關(guān)系,因此可將屬性抽取任務(wù)轉(zhuǎn)化為關(guān)系抽取??任務(wù)。利用引入注意力機(jī)制的Bi?-LSTM?(Att?-??BiLSTM)模型進(jìn)行關(guān)系分類(lèi)及屬性抽齲基本流程??是:將預(yù)訓(xùn)練的詞向量作為輸入,利用Bi-LSTM??抽取文本中的高層語(yǔ)義特征,注意力層通過(guò)引人權(quán)??重向量將詞級(jí)特征合并為句級(jí)特征,以此捕捉句子??的深層語(yǔ)義特征,利用特征分類(lèi)器得到兩個(gè)實(shí)體之??間的關(guān)系。關(guān)系分類(lèi)及屬性抽取基本流程,見(jiàn)圖3。??5.3半結(jié)構(gòu)化數(shù)據(jù)??面向半結(jié)構(gòu)化數(shù)據(jù)的知識(shí)抽取利用包裝器。包??裝器是一種基于規(guī)則的文本信息抽取模型,其規(guī)則??集合易于建立且抽取精度高,適用于半結(jié)構(gòu)化數(shù)據(jù)??的知識(shí)抽齲包裝器基本工作流程是:首先根據(jù)輸??圖3關(guān)系分類(lèi)及屬性抽取基本流程??人數(shù)據(jù)從規(guī)則庫(kù)中選擇對(duì)應(yīng)的規(guī)則,將規(guī)則傳入規(guī)??則執(zhí)行模塊;然后將規(guī)則執(zhí)行模塊中的規(guī)則應(yīng)用于??輸入數(shù)據(jù),抽取出有用信息;最后將上述信息傳人??信息轉(zhuǎn)換模塊中,將傳人的信息轉(zhuǎn)換為特定格式的??知識(shí)。包裝器工作流程,見(jiàn)圖4。??:?包裝器??!??廠??規(guī)則執(zhí)行模塊??規(guī)則庫(kù)??〕??)??信息轉(zhuǎn)換模塊??〇〇??—??半結(jié)構(gòu)化數(shù)據(jù)?知識(shí)??圖4包裝器工作流程??6知識(shí)融合與知識(shí)存儲(chǔ)??6.?1?知識(shí)融合??6.1.1概述知識(shí)融合是知識(shí)圖譜構(gòu)建過(guò)程中重??要步驟。通過(guò)知識(shí)融合可將知識(shí)圖譜內(nèi)部實(shí)體進(jìn)行??精簡(jiǎn),使知識(shí)圖譜運(yùn)轉(zhuǎn)更加有效。知識(shí)融合包括實(shí)??體對(duì)齊、實(shí)體消歧和重復(fù)知識(shí)合并3方面內(nèi)容。??6.1.2實(shí)體對(duì)齊也稱(chēng)為共指消解、實(shí)體匹配、??實(shí)體同義,用于解決多個(gè)指稱(chēng)對(duì)應(yīng)
本流程,見(jiàn)圖3。??5.3半結(jié)構(gòu)化數(shù)據(jù)??面向半結(jié)構(gòu)化數(shù)據(jù)的知識(shí)抽取利用包裝器。包??裝器是一種基于規(guī)則的文本信息抽取模型,其規(guī)則??集合易于建立且抽取精度高,適用于半結(jié)構(gòu)化數(shù)據(jù)??的知識(shí)抽齲包裝器基本工作流程是:首先根據(jù)輸??圖3關(guān)系分類(lèi)及屬性抽取基本流程??人數(shù)據(jù)從規(guī)則庫(kù)中選擇對(duì)應(yīng)的規(guī)則,將規(guī)則傳入規(guī)??則執(zhí)行模塊;然后將規(guī)則執(zhí)行模塊中的規(guī)則應(yīng)用于??輸入數(shù)據(jù),抽取出有用信息;最后將上述信息傳人??信息轉(zhuǎn)換模塊中,將傳人的信息轉(zhuǎn)換為特定格式的??知識(shí)。包裝器工作流程,見(jiàn)圖4。??:?包裝器??!??廠??規(guī)則執(zhí)行模塊??規(guī)則庫(kù)??〕??)??信息轉(zhuǎn)換模塊??〇〇??—??半結(jié)構(gòu)化數(shù)據(jù)?知識(shí)??圖4包裝器工作流程??6知識(shí)融合與知識(shí)存儲(chǔ)??6.?1?知識(shí)融合??6.1.1概述知識(shí)融合是知識(shí)圖譜構(gòu)建過(guò)程中重??要步驟。通過(guò)知識(shí)融合可將知識(shí)圖譜內(nèi)部實(shí)體進(jìn)行??精簡(jiǎn),使知識(shí)圖譜運(yùn)轉(zhuǎn)更加有效。知識(shí)融合包括實(shí)??體對(duì)齊、實(shí)體消歧和重復(fù)知識(shí)合并3方面內(nèi)容。??6.1.2實(shí)體對(duì)齊也稱(chēng)為共指消解、實(shí)體匹配、??實(shí)體同義,用于解決多個(gè)指稱(chēng)對(duì)應(yīng)同一實(shí)體對(duì)象問(wèn)??題。利用實(shí)體對(duì)齊可將多個(gè)指稱(chēng)項(xiàng)關(guān)聯(lián)到統(tǒng)一實(shí)體??對(duì)象,以便將語(yǔ)義網(wǎng)絡(luò)中的分散實(shí)體互聯(lián)起來(lái)。本??文通過(guò)計(jì)算Word2vec模型的詞間空間距離,以此??代表詞間語(yǔ)義相似度,設(shè)定相似度閾值來(lái)劃分本體??間的關(guān)系,以此得到待對(duì)齊實(shí)體。??6.1.3實(shí)體消歧可以消除同名實(shí)體產(chǎn)生的歧??義。由于目標(biāo)實(shí)體概念集合不確定,采用基于聚類(lèi)??的命名實(shí)體消歧。將指向目標(biāo)實(shí)體的指稱(chēng)項(xiàng)取出并??聚在同一個(gè)類(lèi)別下。每個(gè)類(lèi)別包含某一個(gè)命名實(shí)體??的所有可能指向的指稱(chēng)項(xiàng)。根據(jù)命
【參考文獻(xiàn)】:
期刊論文
[1]詞向量語(yǔ)義表示研究進(jìn)展[J]. 李楓林,柯佳. 情報(bào)科學(xué). 2019(05)
[2]中國(guó)高血壓防治指南(2018年修訂版)[J]. Writing Group of 2018 Chinese Guidelines for the Management of Hypertension, Chinese Hypertension League, Chinese Society of Cardiology, Chinese Medical Doctor Association Hypertension Committee, Hypertension Branch of China International Exchange and Promotive Association for Medical and Health Care, Hypertension Branch of Chinese Geriatric Medical Association;. 中國(guó)心血管雜志. 2019(01)
[3]慢性病的治與防[J]. 本刊編輯部. 國(guó)際醫(yī)藥衛(wèi)生導(dǎo)報(bào). 2018 (15)
[4]專(zhuān)利文本主題建模中領(lǐng)域停用詞自動(dòng)選取研究[J]. 俞琰,趙乃瑄. 圖書(shū)情報(bào)工作. 2018(11)
[5]基于多數(shù)據(jù)源的知識(shí)圖譜構(gòu)建方法研究[J]. 吳運(yùn)兵,陰愛(ài)英,林開(kāi)標(biāo),余小燕,賴(lài)國(guó)華. 福州大學(xué)學(xué)報(bào)(自然科學(xué)版). 2017(03)
[6]詞形還原方法及實(shí)現(xiàn)工具比較分析[J]. 吳思竹,錢(qián)慶,胡鐵軍,李丹亞,李軍蓮,洪娜. 現(xiàn)代圖書(shū)情報(bào)技術(shù). 2012(03)
[7]中國(guó)高血壓防治指南2010[J]. 劉力生. 中國(guó)醫(yī)學(xué)前沿雜志(電子版). 2011(05)
[8]領(lǐng)域本體的構(gòu)建方法研究[J]. 張文秀,朱慶華. 圖書(shū)與情報(bào). 2011(01)
本文編號(hào):3235634
本文鏈接:http://sikaile.net/yixuelunwen/xxg/3235634.html
最近更新
教材專(zhuān)著