基于多材料本體的語義查詢擴展機制的研究
發(fā)布時間:2019-09-30 10:44
【摘要】:隨著材料信息學的不斷發(fā)展,出現(xiàn)越來越多的金屬材料數(shù)據(jù)源,在這些數(shù)據(jù)源中包含著大量的金屬材料知識和豐富的結構。然而,這些材料數(shù)據(jù)源中的存儲結構和命名方式都存在一定的差異,使用傳統(tǒng)的關鍵字查詢方法在這些數(shù)據(jù)源中進行查詢,其效果不是非常理想。為了提高其檢索性能,本文提出了一種基于多材料本體的語義查詢擴展方法,即需要對用戶輸入的種子查詢概念在多個材料本體中進行語義擴展,然后在材料數(shù)據(jù)源中進行查詢,使其查詢結果中能夠包含更多更加準確的相關結果。本課題所做的主要研究工作如下:1)基于多材料本體的概念擴展。首先,根據(jù)多個材料本體提出了一種相似性概念擴展策略S-SMOA,該策略采用基于字符串的SMOA算法以及材料本體的上下位結構在多個材料本體中對用戶輸入的種子查詢概念進行相似性概念擴展。然后,利用基于集合的Jaccard算法設計出一種相關概念擴展策略P-Jaccard,該策略利用材料本體中的對象屬性以及Jaccard算法獲取相關概念。2)擴展概念的過濾和補充。首先,為了提高概念擴展的準確率,提出了一種基于Leacock-Chodorow算法的概念過濾策略,對擴展概念集合中的概念進行過濾。其次,為了保證其概念擴展的召回率和完整性,需要對擴展過濾后的概念進行一次概念補充,利用基于結構的Leacock-Chodorow算法對種子查詢概念進行擴展,將擴展后的概念與過濾后的概念進行合并補充,保證概念擴展的完整性。3)擴展概念在數(shù)據(jù)源中的查詢處理。首先,利用基于字符串算法SMOA的匹配策略,對擴展概念在數(shù)據(jù)源中進行概念定位,得到匹配概念集合。然后設計出了一種基于多本體的語義查詢處理方案,該方案根據(jù)RDF數(shù)據(jù)的三元組結構的特點以及用戶所選的不同的查詢模式動態(tài)的生成SPARQL語句,并在數(shù)據(jù)源中進行查詢,其查詢結果可以以文本和可視化兩種方式展示給材料數(shù)據(jù)用戶�;诙嗖牧媳倔w的語義查詢擴展機制,不僅使用SMOA和Jaccard算法進行概念擴展,還充分利用了材料本體的上下位結構以及本體中概念的屬性,擴展到更多相關概念。同時還使用了Leacock-Chodorow方法對擴展概念進行過濾和補充,提高了概念擴展的準確性和完整性。為材料領域用戶和專家提供了一種語義查詢擴展方法,并提供了一個基于多材料本體的語義查詢擴展系統(tǒng)。
【圖文】:
19]。圖2-1 查詢擴展理解圖對查詢擴展的理解可以通過金屬材料實例鋁合金作為種子查詢概念進行舉例,如圖2-1所示,可以看出如果不進行概念擴展,則其查詢結果只包含鑄造鋁合金和鍛造鋁合金等等,但是如果對鋁合金進行概念擴展之后再進行查詢,則其查詢結果不僅包含鑄造鋁合金和鍛造鋁合金,同時還包含鋁合金的實例概念(ZL104等)以及相對應的屬性等等。查詢擴展包含如下技術[20]:1)查找種子查詢概念的同義詞,將得到的這些同義詞再次進行查找;2)查找詞匯的各種形態(tài),通過在搜索查詢中提取單詞詞干;3)修改拼寫錯誤,并且自動進行搜索對于修改過的形式或在結果中給予暗示標識;4)重新調(diào)整在原始查詢中的術語權重值。2.2 基于本體的查詢擴展方法目前
所以本章主要介紹基于多材料本體的概念擴展部分。具體的相關概念定義如下:定義1:擴展本體。擴展本體用于對于原始種子查詢概念進行擴展,,本文所使用的擴展本體為STSM、MMOY和AMO三個本體。擴展本體可以表示為一個六元組,即ES = (Cc, Cr, Ic, Ir, Pc, Pr),其中Cc表示核心概念集合,Cr表示相關概念集合,Ic表示核心實例概念集合,Ir表示相關實例集合,Pc表示核心屬性集合,Pr表示相關屬性集合。定義2:查詢模式。查詢模式構成了用戶的查詢模板,不同的查詢模式可以查詢不同方面的信息內(nèi)容,用戶可以根據(jù)自己的需求選擇相應的查詢模式。定義3:相似性概念擴展。相似性概念擴展是指采用相應的擴展策略對種子查詢概念在擴展本體中進行相似性擴展,可以得到與種子查詢概念含義相似或相近的一些概念。定義4:相關性概念擴展。相關性概念擴展是根據(jù)種子查詢概念本身及其相似的概念所推薦出來的概念,與用戶所選的查詢模式緊密相關,選擇不同的查詢模式則會推薦出不同的相關概念。
【學位授予單位】:河北科技大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TG14;TP391.1
本文編號:2544250
【圖文】:
19]。圖2-1 查詢擴展理解圖對查詢擴展的理解可以通過金屬材料實例鋁合金作為種子查詢概念進行舉例,如圖2-1所示,可以看出如果不進行概念擴展,則其查詢結果只包含鑄造鋁合金和鍛造鋁合金等等,但是如果對鋁合金進行概念擴展之后再進行查詢,則其查詢結果不僅包含鑄造鋁合金和鍛造鋁合金,同時還包含鋁合金的實例概念(ZL104等)以及相對應的屬性等等。查詢擴展包含如下技術[20]:1)查找種子查詢概念的同義詞,將得到的這些同義詞再次進行查找;2)查找詞匯的各種形態(tài),通過在搜索查詢中提取單詞詞干;3)修改拼寫錯誤,并且自動進行搜索對于修改過的形式或在結果中給予暗示標識;4)重新調(diào)整在原始查詢中的術語權重值。2.2 基于本體的查詢擴展方法目前
所以本章主要介紹基于多材料本體的概念擴展部分。具體的相關概念定義如下:定義1:擴展本體。擴展本體用于對于原始種子查詢概念進行擴展,,本文所使用的擴展本體為STSM、MMOY和AMO三個本體。擴展本體可以表示為一個六元組,即ES = (Cc, Cr, Ic, Ir, Pc, Pr),其中Cc表示核心概念集合,Cr表示相關概念集合,Ic表示核心實例概念集合,Ir表示相關實例集合,Pc表示核心屬性集合,Pr表示相關屬性集合。定義2:查詢模式。查詢模式構成了用戶的查詢模板,不同的查詢模式可以查詢不同方面的信息內(nèi)容,用戶可以根據(jù)自己的需求選擇相應的查詢模式。定義3:相似性概念擴展。相似性概念擴展是指采用相應的擴展策略對種子查詢概念在擴展本體中進行相似性擴展,可以得到與種子查詢概念含義相似或相近的一些概念。定義4:相關性概念擴展。相關性概念擴展是根據(jù)種子查詢概念本身及其相似的概念所推薦出來的概念,與用戶所選的查詢模式緊密相關,選擇不同的查詢模式則會推薦出不同的相關概念。
【學位授予單位】:河北科技大學
【學位級別】:碩士
【學位授予年份】:2016
【分類號】:TG14;TP391.1
【參考文獻】
相關期刊論文 前4條
1 李華昱;張培穎;肖晗;;基于抽取規(guī)則和本體映射的領域XML語義集成[J];河北科技大學學報;2016年04期
2 韓仙玉;閆東亮;李睿;;一種針對特定領域的查詢擴展方法[J];計算機應用與軟件;2014年01期
3 賀元香;史寶明;張永;;基于本體的語義相似度算法研究[J];計算機應用與軟件;2013年11期
4 張娟;高克峰;張曦;;從文本中學習本體的系統(tǒng)設計[J];河北工業(yè)科技;2011年03期
本文編號:2544250
本文鏈接:http://sikaile.net/kejilunwen/jinshugongy/2544250.html
最近更新
教材專著