加權(quán)映射匹配方法的站內(nèi)搜索引擎設(shè)計(jì)
本文關(guān)鍵詞:加權(quán)映射匹配方法的站內(nèi)搜索引擎設(shè)計(jì)
更多相關(guān)文章: 站內(nèi)搜索 對象映射 附件內(nèi)容 對象相似度
【摘要】:通用搜索引擎與網(wǎng)站提供的站內(nèi)搜索機(jī)制都無法實(shí)現(xiàn)基于內(nèi)容的企業(yè)網(wǎng)站信息查找。在分析企業(yè)網(wǎng)站信息的類型后,針對該問題提出一個通用站內(nèi)搜索引擎架構(gòu)。給出該引擎的設(shè)計(jì)思想,介紹對象映射匹配方法、加權(quán)對象相似度計(jì)算算法、索引構(gòu)建等實(shí)現(xiàn)技術(shù)。實(shí)現(xiàn)基于網(wǎng)頁內(nèi)容、Word與pdf附件內(nèi)容的查找定位。實(shí)驗(yàn)結(jié)果顯示,該方法具有很高的查準(zhǔn)率和查全率。該引擎可為企業(yè)網(wǎng)站的內(nèi)容搜索與個性化服務(wù)提供支持。
【作者單位】: 上海理工大學(xué)光電信息與計(jì)算機(jī)工程學(xué)院;
【關(guān)鍵詞】: 站內(nèi)搜索 對象映射 附件內(nèi)容 對象相似度
【分類號】:TP391.3
【正文快照】: 0引言隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展與廣泛應(yīng)用,網(wǎng)站信息的增長和傳播速度也越來越快,網(wǎng)站的差異化發(fā)展與特色服務(wù)需求也就更加強(qiáng)烈。事實(shí)上很多網(wǎng)站在特色信息采集方面都相當(dāng)成功,但由于缺少強(qiáng)有效的站內(nèi)搜索引擎用戶卻只會看首頁或相關(guān)欄目的第一頁。長期積累的高價值信息被沉積在數(shù)
【相似文獻(xiàn)】
中國期刊全文數(shù)據(jù)庫 前10條
1 楊華;肖丹鳳;;基于遞進(jìn)的多關(guān)鍵詞站內(nèi)搜索的設(shè)計(jì)與實(shí)現(xiàn)[J];桂林航天工業(yè)高等專科學(xué)校學(xué)報;2009年02期
2 劉凡平;高艷華;于炯;張偉;;基于關(guān)鍵決策方法的站內(nèi)搜索研究與實(shí)現(xiàn)[J];微電子學(xué)與計(jì)算機(jī);2010年08期
3 劉俊熙;龍怡;;站內(nèi)搜索是下一個網(wǎng)絡(luò)信息資源檢索的最佳點(diǎn)——網(wǎng)絡(luò)、行業(yè)和站內(nèi)搜索的技術(shù)分析[J];現(xiàn)代情報;2008年04期
4 蔣輝;陽小華;劉志明;閆仕宇;馬家宇;李曉昀;李萌;周座;;基于一種文檔表示模型的站內(nèi)搜索引擎設(shè)計(jì)與實(shí)現(xiàn)[J];南華大學(xué)學(xué)報(自然科學(xué)版);2013年04期
5 段旭良;;中小企業(yè)電子商務(wù)網(wǎng)站站內(nèi)搜索引擎的設(shè)計(jì)與應(yīng)用[J];商場現(xiàn)代化;2009年36期
6 鐘瑞瓊;周黎;韓德志;;中小型網(wǎng)站站內(nèi)搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)[J];現(xiàn)代計(jì)算機(jī)(專業(yè)版);2011年08期
7 周安;;基于Sphinx+MySql+Python的站內(nèi)搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)[J];湖北科技學(xué)院學(xué)報;2013年06期
8 黃云;唐世民;羅宇;;基于關(guān)聯(lián)規(guī)則的站內(nèi)搜索引擎設(shè)計(jì)[J];軟件導(dǎo)刊;2010年01期
9 陳勇;;基于遺傳算法的多值站內(nèi)搜索設(shè)計(jì)與實(shí)現(xiàn)[J];微電子學(xué)與計(jì)算機(jī);2008年11期
10 鮑R,
本文編號:672908
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/672908.html