本體庫(kù)與數(shù)據(jù)庫(kù)相融合的民族信息資源語(yǔ)義檢索研究
發(fā)布時(shí)間:2020-05-07 12:48
【摘要】:伴隨著信息技術(shù)、網(wǎng)絡(luò)技術(shù)的迅猛發(fā)展,語(yǔ)義檢索技術(shù)成為從浩瀚的網(wǎng)絡(luò)信息資源中獲取有價(jià)值信息的重要手段。傳統(tǒng)的信息檢索方式主要是基于關(guān)系數(shù)據(jù)庫(kù)的關(guān)鍵字匹配技術(shù),但該技術(shù)處理語(yǔ)義信息的能力較弱,而且信息檢索的準(zhǔn)確率難以讓人滿意。因此,語(yǔ)義Web的提出和發(fā)展為語(yǔ)義信息檢索的實(shí)現(xiàn)開(kāi)辟了一條嶄新的思路。語(yǔ)義Web通過(guò)融入本體技術(shù),能更好的讓計(jì)算機(jī)“理解”信息中蘊(yùn)含的語(yǔ)義信息,為人類提供更好的服務(wù)。 本體作為共享概念模型的形式化規(guī)范說(shuō)明,實(shí)現(xiàn)了某個(gè)概念領(lǐng)域的概念及其關(guān)系的抽象描述,提供了某個(gè)領(lǐng)域普遍、共享的知識(shí)表示方式。本體可以很好地應(yīng)用于信息檢索,進(jìn)而挖掘出信息資源之間的語(yǔ)義信息。因此,本體成為實(shí)現(xiàn)語(yǔ)義檢索的一個(gè)關(guān)鍵因素。本體模型與數(shù)據(jù)庫(kù)模型之間存在著巨大的差距,而目前大多數(shù)應(yīng)用數(shù)據(jù)都存儲(chǔ)在關(guān)系數(shù)據(jù)庫(kù)中,導(dǎo)致了本體距離真正的實(shí)際應(yīng)用仍有一個(gè)漫長(zhǎng)的過(guò)程。因此,為了充分發(fā)揮關(guān)系數(shù)據(jù)庫(kù)與本體各自的優(yōu)勢(shì),,本文通過(guò)將數(shù)據(jù)庫(kù)與本體庫(kù)進(jìn)行融合,針對(duì)民族信息資源領(lǐng)域,研究民族信息資源的語(yǔ)義檢索。 本文首先在信息檢索、語(yǔ)義Web和本體理論的研究基礎(chǔ)上,對(duì)本體的構(gòu)建原則、方法等進(jìn)行了介紹,詳細(xì)論述了民族信息資源領(lǐng)域本體庫(kù)的設(shè)計(jì)和構(gòu)建過(guò)程,并構(gòu)建了民族信息資源本體庫(kù)。其次,闡述了民族信息資源語(yǔ)義檢索模型,在此框架下,設(shè)計(jì)了數(shù)據(jù)庫(kù)與本體庫(kù)的融合模型,通過(guò)建立融合結(jié)構(gòu)體,實(shí)現(xiàn)了民族信息資源本體庫(kù)中的概念與民族信息資源信息表的關(guān)系映射。另外,基于民族信息資源本體庫(kù)中的概念,詳細(xì)論述了檢索關(guān)鍵詞的擴(kuò)展方法。最后,在上述基礎(chǔ)之上,設(shè)計(jì)開(kāi)發(fā)了民族信息資源語(yǔ)義檢索原型系統(tǒng),同時(shí)對(duì)原型系統(tǒng)中相關(guān)表結(jié)構(gòu)和主要功能模塊進(jìn)行了設(shè)計(jì)。通過(guò)實(shí)驗(yàn)分析表明,與傳統(tǒng)信息檢索方式相比,原型系統(tǒng)在保證查全率的基礎(chǔ)上,具有較高的查準(zhǔn)率。
【圖文】:
10圖 2.1 傳統(tǒng)信息檢索一致性匹配原理圖2.1.2 信息檢索模型概述隨著計(jì)算機(jī)技術(shù)的發(fā)展,信息檢索理論及相關(guān)技術(shù)發(fā)展十分迅速,而基于信息檢索的模型研究更成為信息檢索的關(guān)鍵。信息檢索模型是對(duì)用戶信息檢索任務(wù)的一種數(shù)字化抽象,信息檢索模型的相關(guān)研究也逐漸成為一個(gè)熱點(diǎn)。信息檢索模型主要從兩個(gè)方面研究信息檢索的方法:一是確定信息檢索的條件和對(duì)應(yīng)的請(qǐng)求文檔,這兩個(gè)元素是信息檢索的關(guān)鍵;二是檢索模型將確立計(jì)算機(jī)文檔和用戶信息請(qǐng)求之間的關(guān)系(即匹配關(guān)系)。當(dāng)前信息檢索模型主要可分為三類:基于集合理論的分類、基于代數(shù)理論的模型和基于概論統(tǒng)計(jì)理論的模型。傳統(tǒng)的信息檢索模型主要包括三個(gè)經(jīng)典模型:布爾模型、向量空間模型和概率檢索模型。(1)布爾模型布爾模型(Boolen Model)是一種最簡(jiǎn)單的檢索模型,它是以布爾代數(shù)和集合論為基礎(chǔ)的,布爾模型將用戶的檢索需求按檢索項(xiàng)在計(jì)算機(jī)文檔中的布爾邏輯關(guān)系進(jìn)行查詢。布爾模型是以布爾邏輯(二元邏輯)為基礎(chǔ)的,其假設(shè)搜索的文檔中標(biāo)引詞要么與查詢是有關(guān)聯(lián)的,要么兩者不存在關(guān)聯(lián)關(guān)系。這和我們傳統(tǒng)的信息檢索中的關(guān)鍵字匹配非常類似。布爾模型在查詢過(guò)程中是將用戶請(qǐng)求轉(zhuǎn)換成由 AND、OR 和 NOT 邏輯算子連接起來(lái)的關(guān)系表達(dá)式。如“白族”、“白族”AND“云南大理”等。通過(guò)用戶請(qǐng)求表達(dá)式與計(jì)算機(jī)文檔中標(biāo)引詞進(jìn)行比較(真假判斷),最終模型將符合條件的信息資源反饋給用戶。
民族信息資源本體樹(shù)形
【學(xué)位授予單位】:云南師范大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2014
【分類號(hào)】:G252.7
本文編號(hào):2652997
【圖文】:
10圖 2.1 傳統(tǒng)信息檢索一致性匹配原理圖2.1.2 信息檢索模型概述隨著計(jì)算機(jī)技術(shù)的發(fā)展,信息檢索理論及相關(guān)技術(shù)發(fā)展十分迅速,而基于信息檢索的模型研究更成為信息檢索的關(guān)鍵。信息檢索模型是對(duì)用戶信息檢索任務(wù)的一種數(shù)字化抽象,信息檢索模型的相關(guān)研究也逐漸成為一個(gè)熱點(diǎn)。信息檢索模型主要從兩個(gè)方面研究信息檢索的方法:一是確定信息檢索的條件和對(duì)應(yīng)的請(qǐng)求文檔,這兩個(gè)元素是信息檢索的關(guān)鍵;二是檢索模型將確立計(jì)算機(jī)文檔和用戶信息請(qǐng)求之間的關(guān)系(即匹配關(guān)系)。當(dāng)前信息檢索模型主要可分為三類:基于集合理論的分類、基于代數(shù)理論的模型和基于概論統(tǒng)計(jì)理論的模型。傳統(tǒng)的信息檢索模型主要包括三個(gè)經(jīng)典模型:布爾模型、向量空間模型和概率檢索模型。(1)布爾模型布爾模型(Boolen Model)是一種最簡(jiǎn)單的檢索模型,它是以布爾代數(shù)和集合論為基礎(chǔ)的,布爾模型將用戶的檢索需求按檢索項(xiàng)在計(jì)算機(jī)文檔中的布爾邏輯關(guān)系進(jìn)行查詢。布爾模型是以布爾邏輯(二元邏輯)為基礎(chǔ)的,其假設(shè)搜索的文檔中標(biāo)引詞要么與查詢是有關(guān)聯(lián)的,要么兩者不存在關(guān)聯(lián)關(guān)系。這和我們傳統(tǒng)的信息檢索中的關(guān)鍵字匹配非常類似。布爾模型在查詢過(guò)程中是將用戶請(qǐng)求轉(zhuǎn)換成由 AND、OR 和 NOT 邏輯算子連接起來(lái)的關(guān)系表達(dá)式。如“白族”、“白族”AND“云南大理”等。通過(guò)用戶請(qǐng)求表達(dá)式與計(jì)算機(jī)文檔中標(biāo)引詞進(jìn)行比較(真假判斷),最終模型將符合條件的信息資源反饋給用戶。
民族信息資源本體樹(shù)形
【學(xué)位授予單位】:云南師范大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2014
【分類號(hào)】:G252.7
【參考文獻(xiàn)】
相關(guān)期刊論文 前5條
1 龔劍;;談我國(guó)民族文獻(xiàn)資源的共建共享[J];圖書(shū)與情報(bào);2010年06期
2 李興春;;計(jì)算機(jī)信息檢索中的本體構(gòu)建研究[J];重慶文理學(xué)院學(xué)報(bào);2013年03期
3 程立倩;基于知識(shí)庫(kù)的概念檢索[J];山東農(nóng)業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版);2003年02期
4 張會(huì)影;;領(lǐng)域本體中的語(yǔ)義相似度算法研究[J];宜春學(xué)院學(xué)報(bào);2011年04期
5 陳德容;民族信息資源的網(wǎng)絡(luò)化探討[J];中南民族學(xué)院學(xué)報(bào)(人文社會(huì)科學(xué)版);2003年02期
本文編號(hào):2652997
本文鏈接:http://sikaile.net/tushudanganlunwen/2652997.html
最近更新
教材專著