基于多本體的智能搜索引擎模型研究與實現
本文關鍵詞:基于多本體的智能搜索引擎模型研究與實現,由筆耕文化傳播整理發(fā)布。
《首都師范大學》 2013年
基于多本體的智能搜索引擎模型研究與實現
張燦
【摘要】:隨著近些年來互聯(lián)網的迅猛發(fā)展,網絡數據量呈指數級的增長,用戶對搜索的需求越來越多迫切。如何在海量的網頁數據中準確、迅速找到用戶期望的結果,越來越成為搜索引擎領域熱點問題。傳統(tǒng)的基于關鍵字匹配的搜索引擎技術顯然已經不能夠滿足廣大互聯(lián)網需求。隨著語義網技術的發(fā)展,本體技術進入人們的視野,基于本體的搜索引擎技術越來越受到重視。經過這些年來的探索發(fā)展,基于單個領域本體的搜索引擎技術已有所進展。然后,在現在互聯(lián)網走向個性化、社區(qū)化的趨勢中,單個網頁資源中包含的概念不僅限于一個領域中,很可能是跨領域的概念實體出現在同一個網頁資源中。所以,我們需要多領域本體支持的搜索引擎技術來應對這一趨勢。 本文主要討論基于多領域本體支持的搜索引擎技術的框架設計及相關技術。首先,結合當前搜索引擎發(fā)展狀況,討論了搜索引擎技術的核心問題評價標準,并在此基礎上分析了搜索引擎未來的八大發(fā)展趨勢。然后,分析和比較了現有的語義標注工具和方法,闡述了一般的語義標注流程,給出了一種基于多本體支持的語義標注工具模型設計框圖。最后,結合語義標注技術及傳統(tǒng)的搜索引擎的模型給出了一種基于多本體支持的搜索引擎框架。通過實驗系統(tǒng)的檢驗,并分析了結果。 該框架分為領域信息的采集、網頁資源的預處理、元數據抽取、元數據索引、查詢擴展及查詢重排六個模塊。其中,領域信息采集模塊,在傳統(tǒng)的信息采集系統(tǒng)的基礎上,提出了一種動態(tài)判定網頁是否屬于特定領域的采集策略;預處理模塊主要是實現了網頁去噪、去重等操作,重點討論了網頁去重算法;元數據抽取模塊,提出了一種基于XSLT技術的HTML等結構化文檔的元數據抽取策略;元數據索引利用倒排索引的技術將抽取到的元數據文檔進行索引,為檢索操作打下基礎;查詢擴展通過對查詢請求進行語法、語義兩方面的推理擴展;查詢重排,在Lucene開源框架下,綜合鏈接評價、文檔綜合評分基礎上增加了文檔與領域本體的匹配程度三方面因素,提高檢索的查準率。經過試驗系統(tǒng)的試驗檢測,該模型在查全率和查準率方面優(yōu)于傳統(tǒng)基于關鍵字檢索模型。
【關鍵詞】:
【學位授予單位】:首都師范大學
【學位級別】:碩士
【學位授予年份】:2013
【分類號】:TP391.1
【目錄】:
下載全文 更多同類文獻
CAJ全文下載
(如何獲取全文? 歡迎:購買知網充值卡、在線充值、在線咨詢)
CAJViewer閱讀器支持CAJ、PDF文件格式
【參考文獻】
中國期刊全文數據庫 前2條
1 武成崗,焦文品,田啟家,史忠植;基于本體論和多主體的信息檢索服務器[J];計算機研究與發(fā)展;2001年06期
2 劉治綱;葉水生;;基于多本體的搜索引擎框架設計[J];南昌航空大學學報(自然科學版);2011年02期
中國碩士學位論文全文數據庫 前2條
1 沙麗華;面向領域文檔的語義標注方法研究[D];吉林大學;2009年
2 于曉繁;基于本體和元數據的語義標注平臺模型與系統(tǒng)架構研究[D];山東理工大學;2012年
【共引文獻】
中國期刊全文數據庫 前10條
1 王曉東,高宏卿,張際平;基于Ontology疑難問題答疑系統(tǒng)的設計與實現[J];電化教育研究;2004年09期
2 袁亮環(huán);;基于本體的智能參考咨詢系統(tǒng)研究[J];電腦知識與技術;2010年16期
3 楊寧;郭雷;方俊;;基于語義的查詢優(yōu)化方法[J];紡織高;A科學學報;2011年01期
4 楊曉東;林曉霞;崔孟榮;;基于本體的網絡信息檢索[J];福建電腦;2006年09期
5 魏桂英;高學東;武森;;基于領域本體的個性化文本信息檢索[J];遼寧工程技術大學學報(自然科學版);2011年02期
6 羅清磊,章文,李衛(wèi)華;基于本體的Web智能信息Agent[J];廣東工業(yè)大學學報;2004年03期
7 張鳳琴;;普適計算中基于本體的上下文感知研究[J];甘肅科技;2009年03期
8 程新榮;楊仁剛;康麗;;基于Ontology的Web信息檢索方法[J];廣西師范大學學報(自然科學版);2007年02期
9 林潔;;基于本體的個性化檢索技術研究[J];貴州科學;2009年04期
10 馬斌;;基于本體的管理信息系統(tǒng)課程知識表示方法研究[J];電腦開發(fā)與應用;2013年08期
中國重要會議論文全文數據庫 前3條
1 李偉剛;張克亮;王慧蘭;;基于航空領域本體知識庫的語義檢索研究[A];中國計算語言學研究前沿進展(2009-2011)[C];2011年
2 孫涌;韋小麗;;領域本體構建研究及在專利信息服務中的應用[A];江蘇省系統(tǒng)工程學會第十一屆學術年會論文集[C];2009年
3 陳康;武港山;;基于Ontology的信息檢索技術研究[A];NCIRCS2004第一屆全國信息檢索與內容安全學術會議論文集[C];2004年
中國博士學位論文全文數據庫 前10條
1 宋巖;基于多Agent和本體的散雜貨港口集團船舶調度系統(tǒng)研究[D];北京交通大學;2011年
2 楊抒;基于WEB的林產品信息資源整合方法研究[D];北京林業(yè)大學;2011年
3 熊回香;面向Web3.0的大眾分類研究[D];華中師范大學;2011年
4 湯華茂;基于語義的產業(yè)鏈網絡化協(xié)同設計模式及關鍵技術研究[D];重慶大學;2010年
5 馬沁怡;基于KBE的快速有限元分析方法研究[D];大連理工大學;2011年
6 姚紹文;語義化Web的關鍵技術及其應用研究[D];電子科技大學;2002年
7 徐振寧;基于本體的Web數據語義信息的表示與處理方法研究[D];中國人民解放軍國防科學技術大學;2002年
8 應曉敏;面向Internet個性化服務的用戶建模技術研究[D];中國人民解放軍國防科學技術大學;2003年
9 王曉東;基于Ontology知識庫系統(tǒng)建模與應用研究[D];華東師范大學;2003年
10 李景;本體理論及在農業(yè)文獻檢索系統(tǒng)中的應用研究——以花卉學本體建模為例[D];中國科學院研究生院(文獻情報中心);2004年
中國碩士學位論文全文數據庫 前10條
1 朱利君;基于茶學領域本體的智能檢索研究[D];安徽農業(yè)大學;2010年
2 王娟;基于本體的課程資源管理系統(tǒng)研究[D];江西師范大學;2010年
3 杜海波;本體在醫(yī)療信息檢索系統(tǒng)中的應用研究[D];長春工業(yè)大學;2010年
4 李帥;基于語義相似度的查詢擴展優(yōu)化[D];杭州電子科技大學;2011年
5 宋慶;基于領域本體的智能檢索技術應用研究[D];中國農業(yè)科學院;2011年
6 申欣;基于語義網的信息檢索研究[D];山東理工大學;2011年
7 劉景波;基于本體的村鎮(zhèn)空間規(guī)劃信息搜索方法研究與實現[D];電子科技大學;2011年
8 張春節(jié);基于規(guī)則的隱私本體推理研究[D];云南大學;2011年
9 王利甫;基于本體的語義檢索在數字圖書館中的應用研究[D];鄭州大學;2011年
10 焦莉;基于本體技術的積件式教學系統(tǒng)的研究與設計[D];江西師范大學;2011年
【二級參考文獻】
中國期刊全文數據庫 前10條
1 鄧志鴻,唐世渭,張銘,楊冬青,陳捷;Ontology研究綜述[J];北京大學學報(自然科學版);2002年05期
2 李向陽;張亞非;;一種基于遺傳算法的語義標注[J];電子科技大學學報;2007年01期
3 傅賽香,袁鼎榮,黃柏雄,鐘智;基于統(tǒng)計的無詞典分詞方法[J];廣西科學院學報;2002年04期
4 劉群,張華平,俞鴻魁,程學旗;基于層疊隱馬模型的漢語詞法分析[J];計算機研究與發(fā)展;2004年08期
5 吳勝遠;一種漢語分詞方法[J];計算機研究與發(fā)展;1996年04期
6 高研博;趙京雷;陸汝占;;基于自動模板方法的漢語語義標注[J];計算機工程與應用;2008年07期
7 尹奇韡;李善平;;語義Web語言DAML+OIL及其應用初探[J];計算機科學;2003年01期
8 胡鶴,劉大有,王生生;Web本體語言OWL[J];計算機工程;2004年12期
9 潘宇斌,陳躍新;基于Ontology的自然語言理解[J];計算技術與自動化;2003年04期
10 殷建平;漢語自動分詞方法[J];計算機工程與科學;1998年03期
中國博士學位論文全文數據庫 前1條
1 劉海學;基于語義標注的元數據自動構建及其相關技術研究[D];華東師范大學;2010年
中國碩士學位論文全文數據庫 前4條
1 熊榮東;結合WordNet的領域語義標注研究[D];重慶大學;2011年
2 羅旋;基于復句領域本體的語義標注方法研究[D];華中師范大學;2006年
3 毛平;基于領域本體的文本信息語義檢索研究[D];南京理工大學;2007年
4 湯煒;基于OWL的語義檢索系統(tǒng)的研究與應用[D];武漢理工大學;2009年
【相似文獻】
中國期刊全文數據庫 前10條
1 徐險峰;;網絡信息檢索搜索引擎技術及發(fā)展趨勢[J];江西圖書館學刊;2005年04期
2 韓進軍;安園園;;搜索引擎的未來發(fā)展[J];醫(yī)學信息學雜志;2007年05期
3 劉冰;胡風華;;知識庫系統(tǒng)在智能搜索引擎中的應用[J];光盤技術;2009年02期
4 康桂英,張帆,劉春平;新一代智能搜索引擎網典研究[J];情報理論與實踐;2000年03期
5 袁淵;;搜索引擎關鍵技術及展望[J];湖北財經高等?茖W校學報;2006年05期
6 劉志娟;;虛擬參考咨詢與搜索引擎的結合——智能搜索引擎誕生[J];圖書情報論壇;2008年03期
7 王挺;;智能搜索引擎在企業(yè)人力資源管理決策支持系統(tǒng)中的應用[J];電腦知識與技術;2010年24期
8 劉志娟;黃立冬;;虛擬參考咨詢與搜索引擎結合——智能搜索引擎的誕生[J];科技情報開發(fā)與經濟;2008年25期
9 胡風華;劉冰;;基于知識庫系統(tǒng)的智能搜索引擎研究[J];電腦知識與技術;2009年11期
10 劉成亮;韓海偉;;知識庫系統(tǒng)的原理及其在智能搜索引擎中的應用[J];電腦知識與技術;2008年08期
中國重要會議論文全文數據庫 前10條
1 田田;馬軍;李躍軍;;應用多本體進行信息檢索的研究[A];第二十二屆中國數據庫學術會議論文集(研究報告篇)[C];2005年
2 車萬翔;劉挺;秦兵;李生;;面向依存文法分析的搭配抽取方法研究[A];自然語言理解與機器翻譯——全國第六屆計算語言學聯(lián)合學術會議論文集[C];2001年
3 韓近強;趙靜;楊冬青;唐世渭;姚小波;;基于領域知識的網頁篩選系統(tǒng)[A];第十九屆全國數據庫學術會議論文集(技術報告篇)[C];2002年
4 王曉峰;劉惟一;;從用戶需求到網頁集團的模糊變換[A];第二十屆全國數據庫學術會議論文集(技術報告篇)[C];2003年
5 吳倩;楊逍;張兆心;;基于視覺特征的網頁信息提取[A];第六屆全國信息檢索學術會議論文集[C];2010年
6 羅陽;季鐸;張桂平;王瑩瑩;;面向單一網頁的雙語資源挖掘方法[A];第六屆全國信息檢索學術會議論文集[C];2010年
7 張貫虹;烏達巴拉;鞏政;;基于向量空間模型的網頁文本句子對齊方法研究[A];第十一屆全國人機語音通訊學術會議論文集(一)[C];2011年
8 趙玉芳;張一鳴;;基于網頁信息的印象形成的初步研究[A];第十屆全國心理學學術大會論文摘要集[C];2005年
9 張陽;李戰(zhàn)懷;近藤廣幸;;WEB PAGE的自動分類[A];第十六屆全國數據庫學術會議論文集[C];1999年
10 馮玉才;胡剛;陳勝;蔡詔;向隆剛;李東;;大能量轉換系統(tǒng)遠程實時數據庫設計與實現[A];第十九屆全國數據庫學術會議論文集(技術報告篇)[C];2002年
中國重要報紙全文數據庫 前10條
1 惠曉霜;[N];新華每日電訊;2009年
2 本報記者 蔣崢;[N];經濟日報;2000年
3 王旭;[N];計算機世界;2001年
4 陸元婕;[N];中國計算機報;2001年
5 朱艷燕;[N];中華工商時報;2004年
6 壯壯;[N];電腦報;2004年
7 錢峻英;[N];光明日報;2004年
8 本報記者 張彤;[N];網絡世界;2003年
9 王宏亮;[N];經濟視點報;2005年
10 張秋;[N];中國郵政報;2004年
中國博士學位論文全文數據庫 前10條
1 陳治平;智能搜索引擎理論與應用研究[D];湖南大學;2003年
2 劉竟;面向概念檢索的農史信息門戶的設計與構建[D];南京農業(yè)大學;2008年
3 陳潔;基于概念融合的網頁篩選技術研究[D];北京郵電大學;2013年
4 焦斌星;用于搜索的網頁可視化摘要技術研究[D];中國科學技術大學;2012年
5 米楊;基于頂級本體整合的醫(yī)學領域語義標注研究[D];吉林大學;2012年
6 孟憲軍;互聯(lián)網文本聚類與檢索技術研究[D];哈爾濱工業(yè)大學;2009年
7 張長利;面向特定領域的互聯(lián)網輿情分析技術研究[D];吉林大學;2011年
8 王镠璞;基于用戶體驗的互聯(lián)網搜索引擎醫(yī)學信息檢索可用性評估研究[D];吉林大學;2010年
9 劉守群;海量網絡視頻快速檢索關鍵技術研究[D];中國科學技術大學;2010年
10 黃河;農業(yè)復雜自適應搜索模型研究及實現[D];中國科學技術大學;2010年
中國碩士學位論文全文數據庫 前10條
1 張燦;基于多本體的智能搜索引擎模型研究與實現[D];首都師范大學;2013年
2 孟驍;基于語義網絡的智能搜索引擎研究[D];東北師范大學;2011年
3 雷豐云;智能搜索引擎的理論分析與應用研究[D];中南大學;2007年
4 李振振;基于本體的智能搜索引擎研究與應用[D];青島科技大學;2010年
5 張騫;傳統(tǒng)搜索引擎與智能搜索引擎比較研究[D];鄭州大學;2012年
6 楊延錕;面向油田信息服務的智能搜索引擎研究與應用[D];大慶石油學院;2010年
7 李娟;數據挖掘技術在智能搜索引擎中的應用[D];長春理工大學;2010年
8 朱素媛;網絡教育中的智能搜索引擎的研究[D];合肥工業(yè)大學;2004年
9 張明遠;基于粒計算的智能搜索引擎技術研究[D];武漢理工大學;2010年
10 于洪波;中文網頁自動采集與分類系統(tǒng)設計與實現[D];北京郵電大學;2010年
本文關鍵詞:基于多本體的智能搜索引擎模型研究與實現,,由筆耕文化傳播整理發(fā)布。
本文編號:61330
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/61330.html