基于領(lǐng)域本體的智能垂直搜索引擎的設(shè)計(jì)實(shí)現(xiàn).pdf
本文關(guān)鍵詞:基于領(lǐng)域本體的智能垂直搜索引擎的設(shè)計(jì)與實(shí)現(xiàn),由筆耕文化傳播整理發(fā)布。
文檔介紹:
廣東工業(yè)大學(xué)碩士學(xué)位論文基于領(lǐng)域本體的智能垂直搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)姓名:曹志廣申請(qǐng)學(xué)位級(jí)別:碩士專業(yè):工業(yè)工程指導(dǎo)教師:毛寧201205摘要摘要隨著網(wǎng)絡(luò)的飛速發(fā)展,人們對(duì)互聯(lián)網(wǎng)信息檢索的需求不斷專業(yè)化、細(xì)致化,通用搜索引擎技術(shù)在一定程度上已經(jīng)不能滿足用戶的搜索需求。垂直搜索是某一個(gè)領(lǐng)域的專業(yè)化的搜索引擎,是通用搜索引擎的細(xì)化和發(fā)展,是相對(duì)通用搜索引擎的信息量大、查詢不準(zhǔn)確、深度不夠等問題提出來的新一代搜索引擎服務(wù)模式。通過針對(duì)某一特定領(lǐng)域、某一特定人群或某一特定需求提供有一定價(jià)值的信息和相關(guān)服務(wù)。信息抓取技術(shù)與通用搜索引擎的不同,垂直搜索引擎的網(wǎng)絡(luò)蜘蛛(又稱為網(wǎng)絡(luò)爬蟲)僅采集與搜索目的相應(yīng)的網(wǎng)頁(yè)。通過對(duì)網(wǎng)頁(yè)的目的相似度進(jìn)行預(yù)測(cè)和判斷,專業(yè)網(wǎng)絡(luò)蜘蛛在爬行時(shí)放棄了很多與主題無關(guān)的網(wǎng)站。由于只爬取與主題相關(guān)的網(wǎng)頁(yè),垂直搜索引擎在查詢的查準(zhǔn)率和查全率上都有明顯地提高。本體相關(guān)的技術(shù)在信息檢索系統(tǒng)的研究越來越成熟。詞語(yǔ)相似度計(jì)算是信息處理技術(shù)中的一個(gè)關(guān)鍵問題,主要研究用什么樣的方法來計(jì)算或比較兩個(gè)詞語(yǔ)的相似性。本文基于模具企業(yè)的領(lǐng)域本體,對(duì)單關(guān)鍵詞查詢和多關(guān)鍵詞查詢進(jìn)行了相似度計(jì)算。實(shí)驗(yàn)結(jié)果表明,該方法能夠比較準(zhǔn)確地...
內(nèi)容來自轉(zhuǎn)載請(qǐng)標(biāo)明出處.
本文關(guān)鍵詞:基于領(lǐng)域本體的智能垂直搜索引擎的設(shè)計(jì)與實(shí)現(xiàn),由筆耕文化傳播整理發(fā)布。
,本文編號(hào):76056
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/76056.html