一種基于Jena的語義檢索模型研究與實現(xiàn)
發(fā)布時間:2021-08-29 13:03
在傳統(tǒng)信息檢索系統(tǒng)中,通過關(guān)鍵字進行匹配是最為常用的方法,然而這種方式得到的結(jié)果并不能讓人滿意。為解決該問題,本文在回顧信息檢索系統(tǒng)發(fā)展歷史,介紹國內(nèi)外搜索引擎研究的最新進展后,提出了一種基于本體的語義檢索模型,并詳細介紹了該模型的各個組成模塊以及在Jena語義網(wǎng)框架下的實現(xiàn)方法,重點討論了本體提取、推理和查詢的實現(xiàn)細節(jié);并采用tf-idf結(jié)合關(guān)鍵詞文檔矩陣的方法解決了在結(jié)果排序返回過程中,如何將本體模型與關(guān)鍵詞進行相似度計算的問題,有效提高了系統(tǒng)的查準(zhǔn)率與兼容性;同時,提出了一種采用傳統(tǒng)實體-關(guān)系圖的本體建模方法,簡化了小型本體建模的分析流程。最后通過對實驗系統(tǒng)的定量化分析,得出了該模型在特定條件下,可有效提高檢索系統(tǒng)查準(zhǔn)率與查全率的結(jié)論。
【文章來源】:西安電子科技大學(xué)陜西省 211工程院校 教育部直屬院校
【文章頁數(shù)】:59 頁
【學(xué)位級別】:碩士
【部分圖文】:
國內(nèi)主流互聯(lián)網(wǎng)應(yīng)用分布
詞匹配的方式往往返回成百上千條記錄。在這些記錄中,只有很少是用戶想要的。1.3搜索引擎新進展讓我們首先看一看國內(nèi)外搜索服務(wù)商的分布情況吧(圖1.3,圖1.4)。從這兩幅圖可知,目前搜索引擎服務(wù)提供商可以說是百花齊放,雖然Google仍然坐在老大的地位,但其它提供商通過開發(fā)新的搜索功能與自己特色的服務(wù)來提高市場占有率。至少在中國,百度很好的利用了中國本土企業(yè)的優(yōu)勢,在提供符合中國人習(xí)慣的搜索服務(wù)方面有著比Google更強的優(yōu)勢?梢哉f,誰先推出對方?jīng)]有的功能,誰就有可能在下輪搜索引擎市場中占得先機。搜索引擎分布狀況搜狐搜狗21%MSN&Live騰訊505。口搜狐搜狗.MSN&Live DGoogle口百度貼吧.百度D騰訊
詞匹配的方式往往返回成百上千條記錄。在這些記錄中,只有很少是用戶想要的。1.3搜索引擎新進展讓我們首先看一看國內(nèi)外搜索服務(wù)商的分布情況吧(圖1.3,圖1.4)。從這兩幅圖可知,目前搜索引擎服務(wù)提供商可以說是百花齊放,雖然Google仍然坐在老大的地位,但其它提供商通過開發(fā)新的搜索功能與自己特色的服務(wù)來提高市場占有率。至少在中國,百度很好的利用了中國本土企業(yè)的優(yōu)勢,在提供符合中國人習(xí)慣的搜索服務(wù)方面有著比Google更強的優(yōu)勢?梢哉f,誰先推出對方?jīng)]有的功能,誰就有可能在下輪搜索引擎市場中占得先機。搜索引擎分布狀況搜狐搜狗21%MSN&Live騰訊505。口搜狐搜狗.MSN&Live DGoogle口百度貼吧.百度D騰訊5050.電信114圖1.3國內(nèi)搜索引擎使用份額
【參考文獻】:
期刊論文
[1]頂級專家Frank van Harmelen揭秘語義網(wǎng)[J]. 徐涵. 程序員. 2007(11)
[2]基于Jena的本體構(gòu)建方法研究[J]. 向陽,王敏,馬強. 計算機工程. 2007(14)
[3]基于本體語義的定題爬蟲[J]. 鄭健珍,林坤輝,周昌樂,康愷. 山東大學(xué)學(xué)報(理學(xué)版). 2006(03)
[4]基于語義Web和Jena插件的語義檢索系統(tǒng)實驗研究[J]. 顏端武,丁晟春,李岳蒙,顧德訪. 情報理論與實踐. 2006(03)
[5]Jena推理機在基于本體的信息檢索中的應(yīng)用[J]. 耿科明,袁方. 微型機與應(yīng)用. 2005(10)
[6]Jena在實現(xiàn)基于Ontology的語義檢索中的應(yīng)用研究[J]. 丁晟春,顧德訪. 現(xiàn)代圖書情報技術(shù). 2005(10)
[7]定題搜索引擎Robot的設(shè)計與算法[J]. 龍宇巍,王永成,許歡慶. 計算機仿真. 2004(04)
博士論文
[1]基于本體的語義信息系統(tǒng)研究[D]. 余傳明.武漢大學(xué) 2005
碩士論文
[1]智能中文搜索引擎若干關(guān)鍵技術(shù)的研究與實現(xiàn)[D]. 潘照明.浙江大學(xué) 2006
[2]支持查詢剪裁的搜索引擎數(shù)據(jù)緩沖策略[D]. 謝超.浙江大學(xué) 2006
[3]基于語義網(wǎng)絡(luò)的教學(xué)資源搜索引擎研究[D]. 朱雪剛.東北師范大學(xué) 2006
[4]基于Java技術(shù)的搜索引擎研究與實現(xiàn)[D]. 何世林.西南交通大學(xué) 2006
[5]本體映射的研究[D]. 鄭麗萍.山東科技大學(xué) 2005
[6]基于內(nèi)容的搜索引擎技術(shù)研究及其應(yīng)用[D]. 王曉華.鄭州大學(xué) 2005
[7]基于Jena的本體檢索模型設(shè)計與實現(xiàn)[D]. 陳琮.武漢大學(xué) 2005
[8]基于本體的Web非規(guī)范知識處理中信息抽取技術(shù)研究[D]. 劉藝琴.昆明理工大學(xué) 2005
本文編號:3370706
【文章來源】:西安電子科技大學(xué)陜西省 211工程院校 教育部直屬院校
【文章頁數(shù)】:59 頁
【學(xué)位級別】:碩士
【部分圖文】:
國內(nèi)主流互聯(lián)網(wǎng)應(yīng)用分布
詞匹配的方式往往返回成百上千條記錄。在這些記錄中,只有很少是用戶想要的。1.3搜索引擎新進展讓我們首先看一看國內(nèi)外搜索服務(wù)商的分布情況吧(圖1.3,圖1.4)。從這兩幅圖可知,目前搜索引擎服務(wù)提供商可以說是百花齊放,雖然Google仍然坐在老大的地位,但其它提供商通過開發(fā)新的搜索功能與自己特色的服務(wù)來提高市場占有率。至少在中國,百度很好的利用了中國本土企業(yè)的優(yōu)勢,在提供符合中國人習(xí)慣的搜索服務(wù)方面有著比Google更強的優(yōu)勢?梢哉f,誰先推出對方?jīng)]有的功能,誰就有可能在下輪搜索引擎市場中占得先機。搜索引擎分布狀況搜狐搜狗21%MSN&Live騰訊505。口搜狐搜狗.MSN&Live DGoogle口百度貼吧.百度D騰訊
詞匹配的方式往往返回成百上千條記錄。在這些記錄中,只有很少是用戶想要的。1.3搜索引擎新進展讓我們首先看一看國內(nèi)外搜索服務(wù)商的分布情況吧(圖1.3,圖1.4)。從這兩幅圖可知,目前搜索引擎服務(wù)提供商可以說是百花齊放,雖然Google仍然坐在老大的地位,但其它提供商通過開發(fā)新的搜索功能與自己特色的服務(wù)來提高市場占有率。至少在中國,百度很好的利用了中國本土企業(yè)的優(yōu)勢,在提供符合中國人習(xí)慣的搜索服務(wù)方面有著比Google更強的優(yōu)勢?梢哉f,誰先推出對方?jīng)]有的功能,誰就有可能在下輪搜索引擎市場中占得先機。搜索引擎分布狀況搜狐搜狗21%MSN&Live騰訊505。口搜狐搜狗.MSN&Live DGoogle口百度貼吧.百度D騰訊5050.電信114圖1.3國內(nèi)搜索引擎使用份額
【參考文獻】:
期刊論文
[1]頂級專家Frank van Harmelen揭秘語義網(wǎng)[J]. 徐涵. 程序員. 2007(11)
[2]基于Jena的本體構(gòu)建方法研究[J]. 向陽,王敏,馬強. 計算機工程. 2007(14)
[3]基于本體語義的定題爬蟲[J]. 鄭健珍,林坤輝,周昌樂,康愷. 山東大學(xué)學(xué)報(理學(xué)版). 2006(03)
[4]基于語義Web和Jena插件的語義檢索系統(tǒng)實驗研究[J]. 顏端武,丁晟春,李岳蒙,顧德訪. 情報理論與實踐. 2006(03)
[5]Jena推理機在基于本體的信息檢索中的應(yīng)用[J]. 耿科明,袁方. 微型機與應(yīng)用. 2005(10)
[6]Jena在實現(xiàn)基于Ontology的語義檢索中的應(yīng)用研究[J]. 丁晟春,顧德訪. 現(xiàn)代圖書情報技術(shù). 2005(10)
[7]定題搜索引擎Robot的設(shè)計與算法[J]. 龍宇巍,王永成,許歡慶. 計算機仿真. 2004(04)
博士論文
[1]基于本體的語義信息系統(tǒng)研究[D]. 余傳明.武漢大學(xué) 2005
碩士論文
[1]智能中文搜索引擎若干關(guān)鍵技術(shù)的研究與實現(xiàn)[D]. 潘照明.浙江大學(xué) 2006
[2]支持查詢剪裁的搜索引擎數(shù)據(jù)緩沖策略[D]. 謝超.浙江大學(xué) 2006
[3]基于語義網(wǎng)絡(luò)的教學(xué)資源搜索引擎研究[D]. 朱雪剛.東北師范大學(xué) 2006
[4]基于Java技術(shù)的搜索引擎研究與實現(xiàn)[D]. 何世林.西南交通大學(xué) 2006
[5]本體映射的研究[D]. 鄭麗萍.山東科技大學(xué) 2005
[6]基于內(nèi)容的搜索引擎技術(shù)研究及其應(yīng)用[D]. 王曉華.鄭州大學(xué) 2005
[7]基于Jena的本體檢索模型設(shè)計與實現(xiàn)[D]. 陳琮.武漢大學(xué) 2005
[8]基于本體的Web非規(guī)范知識處理中信息抽取技術(shù)研究[D]. 劉藝琴.昆明理工大學(xué) 2005
本文編號:3370706
本文鏈接:http://sikaile.net/tushudanganlunwen/3370706.html
最近更新
教材專著