基于語義的美食垂直搜索研究
發(fā)布時間:2019-09-16 20:03
【摘要】:隨著互聯(lián)網(wǎng)的快速發(fā)展,網(wǎng)上內(nèi)容極大豐富,為了在海量資源中快速獲取有價值的信息,用戶趨向于利用搜索引擎檢索信息。市場需求的多元化促使專業(yè)搜索引擎和特定領(lǐng)域的門戶網(wǎng)站在近幾年越來越受歡迎,這些也被稱為垂直引擎和垂直門戶網(wǎng)站。 傳統(tǒng)的垂直搜索引擎仍采用基于關(guān)鍵詞或者文本內(nèi)容的檢索方式,這種檢索方式不能充分表達(dá)語義信息,只能從關(guān)鍵詞表達(dá)的語義層次上來處理用戶請求。究其原因是在文檔收集時,未對文檔進(jìn)行語義標(biāo)注,在搜索查詢時,無法對用戶請求進(jìn)行語義處理,難以提供用戶更準(zhǔn)確全面的的檢索結(jié)果。本體技術(shù)的引入,將其與搜索引擎相結(jié)合,已成為搜索引擎主要發(fā)展方向。 針對信息資源的不斷增加,搜索引擎需要一種快速的索引方法,以提高索引的效率。對大規(guī)模文本構(gòu)建索引涉及較大的數(shù)據(jù)量和計算量,會消耗大量計算資源,如何實現(xiàn)海量文本數(shù)據(jù)高性能索引,是搜索應(yīng)用中不可或缺的議題。 本文就怎樣構(gòu)建領(lǐng)域本體及怎樣將本體技術(shù)與搜索引擎結(jié)合起來的問題進(jìn)行了研究,給出了基于本體的美食垂直搜索引擎框架和具體的實現(xiàn)方法,并采用了一種加速索引構(gòu)建的模型。本文完成的工作主要有: (1)分析美食領(lǐng)域的相關(guān)信息,完成美食領(lǐng)域本體構(gòu)建,對本體中的概念類、關(guān)系和屬性進(jìn)行定義和描述,更好的整合美食領(lǐng)域的知識。 (2)根據(jù)美食網(wǎng)站的特點,使用基于規(guī)則的信息抽取技術(shù)完成美食領(lǐng)域本體實例的自動構(gòu)建,為用戶查詢請求的語義分析和語義擴(kuò)展打下基礎(chǔ)。 (3)分析索引的構(gòu)建機(jī)制,采用了CPU和GPU的任務(wù)協(xié)作模型,充分發(fā)揮CPU和GPU的計算優(yōu)勢,提高索引構(gòu)建的性能。 (4)探討了語義擴(kuò)展的流程,在美食領(lǐng)域本體指導(dǎo)下分析和擴(kuò)展了用戶的查詢請求,,實現(xiàn)了語義信息檢索。
【學(xué)位授予單位】:武漢科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2013
【分類號】:TP391.1
本文編號:2536398
【學(xué)位授予單位】:武漢科技大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2013
【分類號】:TP391.1
【參考文獻(xiàn)】
相關(guān)期刊論文 前7條
1 龍樹全;趙正文;唐華;;中文分詞算法概述[J];電腦知識與技術(shù);2009年10期
2 周程遠(yuǎn);朱敏;楊云;;基于詞典的中文分詞算法研究[J];計算機(jī)與數(shù)字工程;2009年03期
3 楊力;從RDF,DAML+OIL到OWL——Ontology語言比較[J];農(nóng)業(yè)圖書情報學(xué)刊;2005年11期
4 孫庚;馮艷紅;于紅;史鵬輝;;一種基于Heritrix的網(wǎng)絡(luò)定題爬蟲算法——以漁業(yè)信息網(wǎng)絡(luò)為例[J];軟件導(dǎo)刊;2010年05期
5 陶皖;姚紅燕;;OWL本體關(guān)系數(shù)據(jù)庫存儲模式設(shè)計[J];計算機(jī)技術(shù)與發(fā)展;2007年02期
6 鮑文;李冠宇;;本體存儲技術(shù)研究[J];計算機(jī)技術(shù)與發(fā)展;2008年01期
7 蒲筱哥;;基于Web的信息抽取技術(shù)研究綜述[J];現(xiàn)代情報;2007年10期
本文編號:2536398
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2536398.html
最近更新
教材專著