基于領(lǐng)域本體的語義擴(kuò)展檢索算法的研究與應(yīng)用
發(fā)布時間:2020-08-21 06:41
【摘要】:I隨著信息爆炸時代的來臨,根據(jù)關(guān)鍵字進(jìn)行搜索的查詢技術(shù)無法滿足用戶快速獲取信息和知識的需求。而信息化技術(shù)的深入發(fā)展與應(yīng)用使得利用語義和知識進(jìn)行信息搜索成為一種可能和必需。本體學(xué)習(xí)和本體技術(shù)可以挖掘文本信息中隱含的知識并對其進(jìn)行加工和重用,面對結(jié)構(gòu)各異、大量的文本數(shù)據(jù),梳理領(lǐng)域知識規(guī)律并設(shè)計(jì)抽取算法,是困難的但是極具意義。在信息檢索中融入知識和語義,讓計(jì)算機(jī)具有一定語義理解能力和領(lǐng)域知識,可以更好地提高檢索效率和用戶滿意度。本文提出一個基于人工智能算法的領(lǐng)域本體學(xué)習(xí)方法以及在此基礎(chǔ)上的語義檢索框架,并對這一框架的設(shè)計(jì)實(shí)施以及相關(guān)算法的智能化和創(chuàng)新性問題進(jìn)行了討論和研究。在閱讀大量相關(guān)文獻(xiàn)的基礎(chǔ)以及領(lǐng)域?qū)<覅⑴c下,總結(jié)出不同的領(lǐng)域知識在其文獻(xiàn)載體中的表現(xiàn)方式不一樣的規(guī)律,根據(jù)酶的領(lǐng)域知識特性,尋找易于實(shí)現(xiàn)合乎規(guī)律高效的方法。通過反復(fù)實(shí)踐探索如何運(yùn)用知識在信息檢索中充分表達(dá)檢索意圖來提高信息檢索效率和滿意度。本文首先提出一種基于統(tǒng)計(jì)學(xué)的本體學(xué)習(xí)方法。通過與綜合語料庫的對比來定義領(lǐng)域術(shù)語的相關(guān)性。然后根據(jù)酶的領(lǐng)域知識特性,總結(jié)出某一種酶的領(lǐng)域知識存在于一定范圍的相關(guān)領(lǐng)域語料中,而在整個領(lǐng)域語料庫中均勻出現(xiàn)的術(shù)語是領(lǐng)域術(shù)語的謂詞關(guān)系,從而提出領(lǐng)域確定性的定義。通過將兩者結(jié)合來抽取領(lǐng)域術(shù)語,然后再抽取該術(shù)語的關(guān)系,并對提取結(jié)果進(jìn)行語義過濾,提高本體學(xué)習(xí)的正確性,改善領(lǐng)域本體的構(gòu)建效率。再運(yùn)用人工蜂群算法對領(lǐng)域語料文本空間搜索來獲得術(shù)語及關(guān)系。為避免跟隨蜂選擇較優(yōu)蜜源的方式過于貪婪,使算法多樣性不足,在跟隨蜂和引領(lǐng)蜂的搜索中加入方向性搜索信息,設(shè)計(jì)均勻選擇算子,通過與多目標(biāo)優(yōu)化問題適應(yīng)度的配合,擴(kuò)大搜索區(qū)域,避免陷入局部最優(yōu),使算法具有導(dǎo)向性。在構(gòu)建的領(lǐng)域本體的基礎(chǔ)上,探討并初步實(shí)現(xiàn)了一個基于語義擴(kuò)展的全文檢索框架,將語義與全文檢索有機(jī)結(jié)合起來,本體學(xué)習(xí),構(gòu)建領(lǐng)域本體,利用語義進(jìn)行全文檢索,并對結(jié)果進(jìn)行評價,將該結(jié)果反饋于本體學(xué)習(xí)以及蜂群算法的參數(shù)設(shè)置中,形成一個高效的智能檢索框架。最后對該智能語義檢索框架的各部分,本體學(xué)習(xí),檢索效率以及性能進(jìn)行測試和分析。本文創(chuàng)新性在于:總結(jié)領(lǐng)域語料庫中酶學(xué)領(lǐng)域知識中術(shù)語中心詞的概念在整個領(lǐng)域語料中只存在較少文本中,而領(lǐng)域知識中普遍存在的通用關(guān)系在語料庫中是均勻分布的。根據(jù)領(lǐng)域知識規(guī)律設(shè)計(jì)領(lǐng)域確定度作為抽取的標(biāo)準(zhǔn),并加入權(quán)重和閾值;運(yùn)用蜂群算法在語料抽取概念的過程中指定偵查蜂的初始行為并加入均勻選擇算子,加快迭代速度,保證解的多樣性;在全文搜索中,將文本中含有的本體元素計(jì)算權(quán)重作為檢索排序的一個重要標(biāo)準(zhǔn),提出語義相關(guān)度的計(jì)算方法對語義擴(kuò)展進(jìn)行規(guī)范度量,從而使得到結(jié)果更接近用戶的檢索意圖。本研究的意義在于將智能語義檢索框架進(jìn)行了應(yīng)用,使信息檢索系統(tǒng)具有一定的學(xué)習(xí)能力,并將學(xué)習(xí)所得的相關(guān)領(lǐng)域術(shù)語概念及關(guān)系,進(jìn)行層次化的結(jié)構(gòu)規(guī)范,以構(gòu)建對領(lǐng)域知識的理解;又能在搜索信息時,利用構(gòu)建的領(lǐng)域本體獲得知識,將語義用于檢索。最后通過評價檢索效果,再對本體學(xué)習(xí)及蜂群算法的相關(guān)參數(shù)進(jìn)行調(diào)整,改善學(xué)習(xí)和檢索能力。
【學(xué)位授予單位】:山東師范大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2015
【分類號】:TP391.3
本文編號:2799056
【學(xué)位授予單位】:山東師范大學(xué)
【學(xué)位級別】:博士
【學(xué)位授予年份】:2015
【分類號】:TP391.3
本文編號:2799056
本文鏈接:http://sikaile.net/shoufeilunwen/xxkjbs/2799056.html
最近更新
教材專著