基于DotLucene的垂直搜索引擎的研究
本文關(guān)鍵詞: Web 垂直搜索 DotLucene 出處:《微計(jì)算機(jī)信息》2007年24期 論文類(lèi)型:期刊論文
【摘要】:網(wǎng)絡(luò)信息資源的"爆炸"式增長(zhǎng)使得人們獲得有用信息日益困難,垂直搜索引擎應(yīng)運(yùn)而生。本文主要研究了下一代的搜索引擎—垂直搜索引擎,并利用Dotlucene建造一個(gè)中等規(guī)模的垂直搜索引擎,其關(guān)鍵字的拆分比對(duì)技術(shù)、信息檢索的速度以及最終結(jié)果的排序都有獨(dú)到之處.同時(shí)給出了部分核心算法。
[Abstract]:The "exploding" growth of network information resources makes it increasingly difficult for people to obtain useful information, and vertical search engines emerge as the times require. This paper mainly studies the next generation of search engines-vertical search engines. A medium scale vertical search engine is constructed by using Dotlucene. The key words splitting and matching technology, the speed of information retrieval and the sorting of final results are all unique. At the same time, some core algorithms are given.
【作者單位】:
【基金】:國(guó)家科技部創(chuàng)新基金資助項(xiàng)目(20044101010046)
【分類(lèi)號(hào)】:TP391.3
【參考文獻(xiàn)】
相關(guān)期刊論文 前2條
1 彭曙蓉;蔡蕾;王耀南;;基于近似網(wǎng)頁(yè)聚類(lèi)的智能搜索系統(tǒng)[J];微計(jì)算機(jī)信息;2006年12期
2 張校乾,金玉玲,侯麗波;一種基于Lucene檢索引擎的全文數(shù)據(jù)庫(kù)的研究與實(shí)現(xiàn)[J];現(xiàn)代圖書(shū)情報(bào)技術(shù);2005年02期
【共引文獻(xiàn)】
相關(guān)期刊論文 前7條
1 潘以鋒;;基于Lucene的網(wǎng)站全文檢索系統(tǒng)的開(kāi)發(fā)[J];廣西教育學(xué)院學(xué)報(bào);2006年05期
2 胡濤;路紅英;;基于Nutch的搜索引擎的研究[J];計(jì)算機(jī)時(shí)代;2007年01期
3 吳發(fā)輝;;Ajax技術(shù)初探[J];南平師專(zhuān)學(xué)報(bào);2006年04期
4 蔣國(guó)瑞;孫明;;基于Lucene的TBT文檔管理Agent系統(tǒng)研究[J];情報(bào)雜志;2006年05期
5 湯光恒;;網(wǎng)格環(huán)境下的數(shù)字圖書(shū)館檢索模型研究[J];情報(bào)雜志;2006年08期
6 許軍林;蔣年德;;基于Ajax的Web應(yīng)用研究[J];現(xiàn)代計(jì)算機(jī);2007年04期
7 陳艷春;李雙平;;基于Lucene的企業(yè)級(jí)搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)[J];現(xiàn)代圖書(shū)情報(bào)技術(shù);2007年08期
相關(guān)碩士學(xué)位論文 前10條
1 孫明;面向技術(shù)貿(mào)易壁壘的智能搜索技術(shù)研究[D];北京工業(yè)大學(xué);2006年
2 魏潔;基于Web Services的異構(gòu)數(shù)據(jù)源統(tǒng)一檢索[D];南京理工大學(xué);2006年
3 陳艷平;基于Web的農(nóng)作物遠(yuǎn)程診斷系統(tǒng)分析與設(shè)計(jì)[D];重慶大學(xué);2006年
4 鄧忠京;基于多線程與代理模式的企業(yè)網(wǎng)絡(luò)機(jī)器人研究[D];暨南大學(xué);2006年
5 董祥千;搜索引擎設(shè)計(jì)分析與結(jié)果聚類(lèi)改進(jìn)[D];電子科技大學(xué);2007年
6 蔣建洪;基于分布式的搜索引擎框架研究和實(shí)現(xiàn)[D];西北工業(yè)大學(xué);2007年
7 羅玫;基于LUCENE2.0的源代碼搜索引擎架構(gòu)的實(shí)現(xiàn)[D];西北工業(yè)大學(xué);2007年
8 廖繼東;基于DotLucene網(wǎng)站全文搜索系統(tǒng)的實(shí)現(xiàn)[D];鄭州大學(xué);2007年
9 周宇;數(shù)字化法定公務(wù)文書(shū)全文檢索系統(tǒng)研究[D];鄭州大學(xué);2007年
10 葉云;基于P2PKM的桌面搜索優(yōu)化的研究[D];廣西大學(xué);2007年
【二級(jí)參考文獻(xiàn)】
相關(guān)期刊論文 前2條
1 王蘭成,蔣丹,劉慶輝;全文數(shù)據(jù)庫(kù)建庫(kù)原理與應(yīng)用技術(shù)[J];情報(bào)學(xué)報(bào);1999年04期
2 王羲,任琦梅;基于44B0平臺(tái)的uC-Linux Web服務(wù)器實(shí)現(xiàn)方法研究[J];微計(jì)算機(jī)信息;2005年03期
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 趙麗娜;周吉順;;基于WEB的高校網(wǎng)上選課系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];電腦知識(shí)與技術(shù);2011年18期
2 劉博卿;;基于軍事工程兵的垂直搜索引擎研究[J];科技創(chuàng)新導(dǎo)報(bào);2011年18期
3 米新英;;基于Web的通用商品報(bào)價(jià)系統(tǒng)的研究與實(shí)現(xiàn)[J];北華航天工業(yè)學(xué)院學(xué)報(bào);2011年03期
4 朱啟英;李明霞;穆玉明;張?jiān)疵?;基于WEB的考試系統(tǒng)在醫(yī)學(xué)遠(yuǎn)程教育中的應(yīng)用[J];中國(guó)高等醫(yī)學(xué)教育;2011年06期
5 段靜波;潘惠蘋(píng);;基于WEB的學(xué)院教務(wù)管理系統(tǒng)設(shè)計(jì)與應(yīng)用[J];電腦知識(shí)與技術(shù);2011年17期
6 王玉華;;Unix平臺(tái)下的數(shù)據(jù)庫(kù)查詢開(kāi)發(fā)工具(Web-DTools)的設(shè)計(jì)與實(shí)現(xiàn)[J];信息與電腦(理論版);2011年06期
7 張愛(ài)軍;;電子商務(wù)技術(shù)的創(chuàng)新發(fā)展趨勢(shì)[J];電腦知識(shí)與技術(shù);2011年26期
8 周園;;基于WEB的獨(dú)立學(xué)院學(xué)院校友管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J];信息與電腦(理論版);2011年06期
9 任智乾;;JSP技術(shù)在Web數(shù)據(jù)庫(kù)中的應(yīng)用[J];信息與電腦(理論版);2011年06期
10 鄭木德;;用ASP.NET實(shí)現(xiàn)Web與數(shù)據(jù)庫(kù)連接的技術(shù)分析[J];電腦開(kāi)發(fā)與應(yīng)用;2011年08期
相關(guān)會(huì)議論文 前10條
1 石晶;龔震宇;裘杭萍;;基于Web挖掘的個(gè)性化服務(wù)技術(shù)[A];第十九屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2002年
2 殷華蓓;李通;唐常杰;張?zhí)鞈c;左志松;;從Web文件中挖掘個(gè)性化導(dǎo)航知識(shí)[A];第十七屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2000年
3 鄧長(zhǎng)壽;郭景峰;楊焱林;鄧安遠(yuǎn);;下一代Web搜索引擎初探[A];第十八屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2001年
4 ;WTCA:A Web Text Clustering Algorithm Based on DFSSM[A];第二十七屆中國(guó)控制會(huì)議論文集[C];2008年
5 楊沁;張維勇;韓江洪;;KJ15A系統(tǒng)基于Web的動(dòng)態(tài)瀏覽設(shè)計(jì)研究[A];2004“安徽制造業(yè)發(fā)展”博士科技論壇論文集[C];2004年
6 謝麗聰;白清源;;基于Web的網(wǎng)上繼續(xù)教育系統(tǒng)[A];第十七屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2000年
7 于冰;于守健;丁祥武;樂(lè)嘉錦;;基于多層次接口匹配的語(yǔ)義Web服務(wù)自動(dòng)組合研究[A];第二十二屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2005年
8 謝彥麒;謝麗聰;白清源;謝伙生;張瑩;;挖掘Web訪問(wèn)模式的一種基于路徑克隆的新算法[A];第二十三屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(技術(shù)報(bào)告篇)[C];2006年
9 劉振鵬;常曉萌;張楊;宋曉靜;周冬冬;;基于QoS的語(yǔ)義Web服務(wù)選擇[A];第二十三屆中國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2006年
10 安倫;周斌;賈焰;;在線Web挖掘中的計(jì)算資源動(dòng)態(tài)平衡[A];全國(guó)計(jì)算機(jī)安全學(xué)術(shù)交流會(huì)論文集·第二十五卷[C];2010年
相關(guān)重要報(bào)紙文章 前10條
1 電子工業(yè)出版社 董婭 工業(yè)和信息化部電子科學(xué)技術(shù)情報(bào)研究所 周峻松;用開(kāi)源軟件建垂直搜索引擎[N];計(jì)算機(jī)世界;2010年
2 本報(bào)特約撰稿 張娟;用Web 2.0提升知識(shí)管理效率[N];計(jì)算機(jī)世界;2008年
3 電腦商報(bào)記者 周雪;Web安全市場(chǎng)須冷卻慎行[N];電腦商報(bào);2008年
4 彭敏;企業(yè)級(jí)Web2.0迎來(lái)應(yīng)用高潮[N];電腦商報(bào);2009年
5 閆冰;“推”出Web交付新天地[N];網(wǎng)絡(luò)世界;2009年
6 ;Web2.0工具使用須謹(jǐn)慎[N];網(wǎng)絡(luò)世界;2009年
7 編譯 郭濤;Web 2.0存儲(chǔ):低成本還要易擴(kuò)展[N];中國(guó)計(jì)算機(jī)報(bào);2010年
8 本報(bào)記者 那罡 北京啟明星辰信息技術(shù)股份有限公司首席執(zhí)行官 嚴(yán)望佳 東軟網(wǎng)絡(luò)安全產(chǎn)品營(yíng)銷(xiāo)中心副總經(jīng)理 李青山 綠盟科技總裁 沈繼業(yè) 聯(lián)想網(wǎng)御產(chǎn)品研發(fā)中心總經(jīng)理 譚曙光;2008·信息安全Web風(fēng)險(xiǎn)唱主角[N];中國(guó)計(jì)算機(jī)報(bào);2008年
9 本報(bào)記者 于翔;企業(yè)級(jí)協(xié)作擁抱Web 2.0[N];網(wǎng)絡(luò)世界;2010年
10 張鵑;以Web 2.0技術(shù)搭建企業(yè)知識(shí)管理平臺(tái)[N];中國(guó)計(jì)算機(jī)報(bào);2008年
相關(guān)博士學(xué)位論文 前10條
1 王曄;垂直搜索引擎若干問(wèn)題研究[D];復(fù)旦大學(xué);2011年
2 朱俊武;基于本體的Web服務(wù)語(yǔ)義支撐技術(shù)研究[D];南京航空航天大學(xué);2008年
3 楊卉;Web文本觀點(diǎn)挖掘及隱含情感傾向的研究[D];吉林大學(xué);2011年
4 胡宜敏;農(nóng)業(yè)垂直搜索引擎語(yǔ)義化若干問(wèn)題的研究與實(shí)現(xiàn)[D];中國(guó)科學(xué)技術(shù)大學(xué);2012年
5 李傳席;基于本體的自適應(yīng)Web信息抽取方法研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2012年
6 孔鴻濱;語(yǔ)義Web技術(shù)的本體安全性研究[D];云南大學(xué);2012年
7 聶鐵錚;Deep Web中Web數(shù)據(jù)庫(kù)集成關(guān)鍵技術(shù)的研究[D];東北大學(xué);2009年
8 鐘美;基于Web的空間本體構(gòu)建方法研究[D];武漢大學(xué);2010年
9 楊瑞龍;基于短語(yǔ)特征的Web文檔聚類(lèi)方法研究[D];重慶大學(xué);2010年
10 孫靜宇;基于CBR的協(xié)同Web搜索研究[D];太原理工大學(xué);2010年
相關(guān)碩士學(xué)位論文 前10條
1 任強(qiáng);基于謂詞抽象與精化技術(shù)的Web服務(wù)驗(yàn)證研究[D];蘇州大學(xué);2011年
2 侯曉帆;基于云計(jì)算的Web教育爬蟲(chóng)[D];東北師范大學(xué);2011年
3 涂丘;一種基于Web界面的協(xié)同文檔管理系統(tǒng)的部署與實(shí)施[D];電子科技大學(xué);2010年
4 崔宏亮;面向Web服務(wù)體系的協(xié)同辦公系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];電子科技大學(xué);2010年
5 馬麗莎;基于WEB操作平臺(tái)下的辦公自動(dòng)化系統(tǒng)[D];電子科技大學(xué);2009年
6 馬雪麗;基于Web的網(wǎng)絡(luò)協(xié)同辦公系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];大連理工大學(xué);2011年
7 丁婕峰;基于Web的開(kāi)放教育學(xué)員作業(yè)管理系統(tǒng)[D];電子科技大學(xué);2011年
8 徐偉德;基于HP2P網(wǎng)絡(luò)的語(yǔ)義Web服務(wù)發(fā)現(xiàn)模型的研究[D];西安電子科技大學(xué);2010年
9 趙鋼;基于Web服務(wù)的服裝企業(yè)信息管理系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D];天津大學(xué);2010年
10 張海燕;基于web的教務(wù)管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];長(zhǎng)安大學(xué);2011年
,本文編號(hào):1524936
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1524936.html