基于知識表示學習的領域本體輔助構建研究
發(fā)布時間:2021-10-24 17:36
為完成多種不同類型的任務,研究人員創(chuàng)建出該相關知識領域的知識庫,然而,不同知識庫中的數(shù)據(jù),表現(xiàn)出結構松散、多源異構的特點。為解決此問題,研究人員開始針對特定領域,創(chuàng)建出滿足結構化描述該相關領域概念的方法——“本體”。創(chuàng)建領域本體,其過程極其復雜,在此過程中,不僅需要各種方法的交替使用,更加需要人力資源的參與,為對其過程進行一定的優(yōu)化,本文的目的在于使用相關的自動學習的方法在領域本體被創(chuàng)建時,針對其過程中的某一特定環(huán)節(jié),進行一定的輔助作用。其具體任務為:給定領域知識庫,在領域本體創(chuàng)建過程中,利用相關的自動化方法,輔助本體構建過程中的實體到相應概念類的映射,即對實體進行聚類操作。針對此任務,本研究對從Sem Med DB知識庫所提取的數(shù)據(jù)進行處理,使用多跳策略完成相應的實體匹配,并通過三元組過濾構造出針對糖尿病領域的知識庫。基于此知識庫進行實驗,對比研究本文所用模型的有效性。完成本研究中的輔助構建要求,關鍵在于如何對知識庫中的數(shù)據(jù)——實體,進行有效的表示,而本研究中的知識庫的組織形式為知識圖譜,其表現(xiàn)為多關系圖。因此,本研究中,分別利用知識表示學習中的Trans X翻譯模型、Rotat E...
【文章來源】:哈爾濱工業(yè)大學黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:64 頁
【學位級別】:碩士
【部分圖文】:
糖尿病領域本體示例
哈爾濱工業(yè)大學工程碩士學位論文-5-其不但能夠表示為眾所周知的蘋果公司,也能夠表示成一種水果;谥R圖譜,Google將其研發(fā)的搜索引擎Chrome變得更加智能,初步達到了將strings看成things的目標,在這一過程中機器開始逐步去深入理解用戶搜索關鍵詞所代表的內(nèi)涵。知識圖譜的最大特點在于其表現(xiàn)形式呈現(xiàn)出高度的結構化特點,其結構展示出了在現(xiàn)實世界中各種事物之間的關聯(lián),如圖1-2展示了糖尿病的知識圖譜。如今,尤其是人工智能領域,知識圖譜已經(jīng)開始被廣泛的應用,例如現(xiàn)在較為前沿的網(wǎng)絡搜索[8]領域、自動問答領域、搜索引擎領域、信息抽取領域等。知識圖譜高度的結構化特點體現(xiàn)在把知識描述為多源多關系的數(shù)據(jù)并且將其利用三重事實進行表述,實體和關系作為基礎構成,實體之間的關系具有不同的類別屬性,對于知識存儲,利用三元組(頭實體,關系,尾實體)對任一事實進行描述,即可表示為(h,r,t),其中h、t分別表示頭尾實體,r表示頭尾實體之間的關系。以(胰島素,治療,糖尿病)為例,此三元組描述了“胰島素可以治療糖尿脖這一既定事實。圖1-2糖尿病知識圖譜示例知識圖譜形式化定義為:KG=(V,E,,ψ),其中V代表知識圖譜中所存儲的實體集合;EV×V代表實體之間相互關聯(lián)的關系集合,:V→C代表實體向其所屬類別的映射函數(shù),ψ:E→C代表關系向其所屬類別映射函數(shù)。即對每個實體而言,其在C中都有與之一一對應的類別信息,與之同理,對每個關系而言,其在C中也有與之一一對應的類別信息。所謂實體,其對應的是世界上某個客觀存在的事物。以本文知識圖譜中知識為例,在本知識庫中垂體切割術Hypophysectomy和治療TREATS之間存在part_of部分關系,垂體切割術Hypophysectomy的實體類型是TOPP(TherapeuticorPreventiveProcedure),part_of屬于?
哈爾濱工業(yè)大學工程碩士學位論文-7-圖1-3本體的層次關系針對某個領域,當前任務需要利用該領域內(nèi)的知識時,首先利用該領域知識庫構建該領域的領域本體,從而達到領域知識抽象概括,進行知識復用和共享的過程。因此,構建本體往往被定義一個自上而下的過程[3]。本文主要解決的是基于知識圖譜中現(xiàn)有的知識,在本體構建期間對其概念確定起到輔助作用。具體而言,針對給定領域,其實體類別未知,通過自動化的方式對知識庫中的實體進行聚類,從而完成抽象概念的提取,達到對知識庫中知識進行概念確定的作用。(3)領域本體輔助構建問題澳大利亞科庭大學MajaHadzi等人針對疾病本體,進行了深層次的研究,在第38屆國際系統(tǒng)科學會議上,其展示了團隊針對疾病本體領域的科研成果,其主要貢獻在于對疾病本體的頂層框架進行了定義,其認為疾病本體可以從疾病類型、表型、病因學、治療手段4個主要的維度進行描述,如圖1-4所示。如上述研究所述,本研究中使用的知識庫為糖尿病領域知識,而疾病本體頂層框架的存在為輔助構建領域本體提供了先驗知識,而這種先驗知識的存在啟發(fā)了本體框架構建的方向。對領域知識庫完成知識表示學習之后,對處于高維空間的實體,對其進行聚類,完成相應類別的映射。而在疾病本體的頂層框架指導下,將其劃分為四個大類,即初始默認其四大類為疾病類型、表型、病因、治療手段。即可將本文研究內(nèi)容形式化描述:輸入:糖尿病領域知識庫KG,其中任意實體對應的概念種類未知輸出:KG中針對實體的四類聚類劃分效果。
【參考文獻】:
期刊論文
[1]精準醫(yī)學知識庫的構建[J]. 劉雷,王星. 中華醫(yī)學圖書情報雜志. 2018(06)
[2]智能教學系統(tǒng)中基于本體的知識表示及推送研究[J]. 林木輝,張杰,包正委. 福建師范大學學報(自然科學版). 2009(01)
本文編號:3455690
【文章來源】:哈爾濱工業(yè)大學黑龍江省 211工程院校 985工程院校
【文章頁數(shù)】:64 頁
【學位級別】:碩士
【部分圖文】:
糖尿病領域本體示例
哈爾濱工業(yè)大學工程碩士學位論文-5-其不但能夠表示為眾所周知的蘋果公司,也能夠表示成一種水果;谥R圖譜,Google將其研發(fā)的搜索引擎Chrome變得更加智能,初步達到了將strings看成things的目標,在這一過程中機器開始逐步去深入理解用戶搜索關鍵詞所代表的內(nèi)涵。知識圖譜的最大特點在于其表現(xiàn)形式呈現(xiàn)出高度的結構化特點,其結構展示出了在現(xiàn)實世界中各種事物之間的關聯(lián),如圖1-2展示了糖尿病的知識圖譜。如今,尤其是人工智能領域,知識圖譜已經(jīng)開始被廣泛的應用,例如現(xiàn)在較為前沿的網(wǎng)絡搜索[8]領域、自動問答領域、搜索引擎領域、信息抽取領域等。知識圖譜高度的結構化特點體現(xiàn)在把知識描述為多源多關系的數(shù)據(jù)并且將其利用三重事實進行表述,實體和關系作為基礎構成,實體之間的關系具有不同的類別屬性,對于知識存儲,利用三元組(頭實體,關系,尾實體)對任一事實進行描述,即可表示為(h,r,t),其中h、t分別表示頭尾實體,r表示頭尾實體之間的關系。以(胰島素,治療,糖尿病)為例,此三元組描述了“胰島素可以治療糖尿脖這一既定事實。圖1-2糖尿病知識圖譜示例知識圖譜形式化定義為:KG=(V,E,,ψ),其中V代表知識圖譜中所存儲的實體集合;EV×V代表實體之間相互關聯(lián)的關系集合,:V→C代表實體向其所屬類別的映射函數(shù),ψ:E→C代表關系向其所屬類別映射函數(shù)。即對每個實體而言,其在C中都有與之一一對應的類別信息,與之同理,對每個關系而言,其在C中也有與之一一對應的類別信息。所謂實體,其對應的是世界上某個客觀存在的事物。以本文知識圖譜中知識為例,在本知識庫中垂體切割術Hypophysectomy和治療TREATS之間存在part_of部分關系,垂體切割術Hypophysectomy的實體類型是TOPP(TherapeuticorPreventiveProcedure),part_of屬于?
哈爾濱工業(yè)大學工程碩士學位論文-7-圖1-3本體的層次關系針對某個領域,當前任務需要利用該領域內(nèi)的知識時,首先利用該領域知識庫構建該領域的領域本體,從而達到領域知識抽象概括,進行知識復用和共享的過程。因此,構建本體往往被定義一個自上而下的過程[3]。本文主要解決的是基于知識圖譜中現(xiàn)有的知識,在本體構建期間對其概念確定起到輔助作用。具體而言,針對給定領域,其實體類別未知,通過自動化的方式對知識庫中的實體進行聚類,從而完成抽象概念的提取,達到對知識庫中知識進行概念確定的作用。(3)領域本體輔助構建問題澳大利亞科庭大學MajaHadzi等人針對疾病本體,進行了深層次的研究,在第38屆國際系統(tǒng)科學會議上,其展示了團隊針對疾病本體領域的科研成果,其主要貢獻在于對疾病本體的頂層框架進行了定義,其認為疾病本體可以從疾病類型、表型、病因學、治療手段4個主要的維度進行描述,如圖1-4所示。如上述研究所述,本研究中使用的知識庫為糖尿病領域知識,而疾病本體頂層框架的存在為輔助構建領域本體提供了先驗知識,而這種先驗知識的存在啟發(fā)了本體框架構建的方向。對領域知識庫完成知識表示學習之后,對處于高維空間的實體,對其進行聚類,完成相應類別的映射。而在疾病本體的頂層框架指導下,將其劃分為四個大類,即初始默認其四大類為疾病類型、表型、病因、治療手段。即可將本文研究內(nèi)容形式化描述:輸入:糖尿病領域知識庫KG,其中任意實體對應的概念種類未知輸出:KG中針對實體的四類聚類劃分效果。
【參考文獻】:
期刊論文
[1]精準醫(yī)學知識庫的構建[J]. 劉雷,王星. 中華醫(yī)學圖書情報雜志. 2018(06)
[2]智能教學系統(tǒng)中基于本體的知識表示及推送研究[J]. 林木輝,張杰,包正委. 福建師范大學學報(自然科學版). 2009(01)
本文編號:3455690
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3455690.html
最近更新
教材專著