基于近似網(wǎng)頁聚類的智能搜索系統(tǒng)
本文關(guān)鍵詞: 信息搜索 搜索引擎 近似網(wǎng)頁聚類 出處:《微計算機信息》2006年12期 論文類型:期刊論文
【摘要】:從Internet用戶的興趣度出發(fā),設(shè)計了一種基于近似網(wǎng)頁聚類的智能搜索系統(tǒng)。該系統(tǒng)在用戶利用常用搜索引擎系統(tǒng)進行信息檢索時,消除搜索引擎返回的重復(fù)頁,對剩余頁面進行聚類,返回給用戶聚類后的網(wǎng)頁簇,這樣用戶就可以選擇瀏覽自己感興趣的頁面,從而大大提高了信息檢索的查準率;實驗證明該系統(tǒng)在保證查全率和查準率的基礎(chǔ)上大大提高了搜索效率。
[Abstract]:Based on the interest of Internet users, an intelligent search system based on approximate web page clustering is designed, which can be used to retrieve information from common search engines. Eliminate the duplicate pages returned by the search engine, cluster the remaining pages, and return the cluster of web pages to the users, so that users can choose to browse the pages they are interested in. Therefore, the precision rate of information retrieval is greatly improved. Experiments show that the system can greatly improve the search efficiency on the basis of guaranteeing recall and precision.
【作者單位】:
【基金】:國家自然科學基金(60375001)
【分類號】:TP391.3
【正文快照】: 1引言Internet上信息搜索方式主要有兩種:關(guān)鍵詞(如Alta Vista)和目錄搜索(如Yahoo)。關(guān)鍵詞搜索和目錄搜索有許多優(yōu)點,然而它也都存在各自的缺陷。例如,關(guān)鍵詞搜索引擎通常返回大量的冗余信息;而目錄搜索方法則需要用戶花費大量的時間進行一步步的子目錄精簡,而在每一步的子
【參考文獻】
相關(guān)期刊論文 前2條
1 李文斌;構(gòu)筑INTERNET及信息的獲取[J];微計算機信息;2000年02期
2 王羲,任琦梅;基于44B0平臺的uC-Linux Web服務(wù)器實現(xiàn)方法研究[J];微計算機信息;2005年03期
【共引文獻】
相關(guān)期刊論文 前6條
1 鄒治鋒;張曦煌;;Linux2.6進程調(diào)度[J];微計算機信息;2006年02期
2 古鵬;徐開勇;李立新;;基于XKMS的安全Web服務(wù)組件的研究與設(shè)計[J];微計算機信息;2006年06期
3 高永平;周書民;王仁波;龔汝洪;;基于GPRS的家校信息平臺的研究與實現(xiàn)[J];微計算機信息;2006年09期
4 李曉峰;王雅輝;;嵌入式Linux在分布式測控系統(tǒng)中的應(yīng)用[J];微計算機信息;2007年14期
5 呂月娥;李信利;;基于信息類別的元搜索引擎設(shè)計[J];微計算機信息;2007年21期
6 張謙;王嵐;王國強;;基于S3C44B0的嵌入式智能控制器設(shè)計[J];微計算機信息;2007年32期
相關(guān)會議論文 前1條
1 方勇;周安民;劉嘉勇;張志國;張雪峰;;基于內(nèi)容的網(wǎng)絡(luò)應(yīng)用監(jiān)控系統(tǒng)研究與設(shè)計[A];第十七次全國計算機安全學術(shù)交流會暨電子政務(wù)安全研討會論文集[C];2002年
相關(guān)碩士學位論文 前10條
1 馮志將;一種電路板故障可診斷嵌入式軟件設(shè)計[D];電子科技大學;2011年
2 王璐鑫;嵌入式Web服務(wù)器在遠程監(jiān)控中的研究與應(yīng)用[D];安徽理工大學;2010年
3 李建文;濟鋼中板廠設(shè)備管理信息系統(tǒng)研究[D];大連理工大學;2002年
4 楊煒;分布式電子郵件監(jiān)測與分析系統(tǒng)[D];四川大學;2004年
5 楊宇;基于嵌入式Web服務(wù)器的熱處理遠程監(jiān)控系統(tǒng)研究[D];武漢理工大學;2006年
6 蔣吉明;基于ARM的嵌入式系統(tǒng)板級設(shè)計的原理、方法及應(yīng)用[D];南京師范大學;2006年
7 黃鳳鳴;ARM DIS系統(tǒng)軟件設(shè)計及其網(wǎng)絡(luò)應(yīng)用開發(fā)[D];南京師范大學;2007年
8 胡海鵬;基于ARM和μClinux的嵌入式網(wǎng)關(guān)設(shè)計[D];華中科技大學;2006年
9 何俊;電除塵器智能控制系統(tǒng)設(shè)計[D];浙江大學;2007年
10 趙會娟;基于ARM9的嵌入式Linux開發(fā)平臺構(gòu)建與Boa的實現(xiàn)[D];西南交通大學;2008年
【相似文獻】
相關(guān)期刊論文 前10條
1 趙京勝;周攀;;基于移動Agent的信息搜索系統(tǒng)設(shè)計[J];青島理工大學學報;2007年01期
2 何素清;劉樹春;;搜索引擎及其特色功能的比較與應(yīng)用分析[J];現(xiàn)代情報;2011年06期
3 李奎;;基于智能Agent的個性化搜索引擎系統(tǒng)[J];和田師范專科學校學報;2008年05期
4 蔡俊武;互聯(lián)網(wǎng)信息搜索技術(shù)[J];雁北師范學院學報;2003年02期
5 任玉梅;;網(wǎng)上搜索引擎信息查詢的方法[J];機械管理開發(fā);2009年06期
6 孫淑偉;張力;;搜索引擎對用戶獲取信息方式的影響及發(fā)展趨勢[J];中國醫(yī)學教育技術(shù);2007年01期
7 柳勝國;論互聯(lián)網(wǎng)信息搜索策略[J];情報資料工作;2002年S1期
8 郭從穎;;企業(yè)信息搜索方案初探[J];信息技術(shù)與標準化;2010年08期
9 蔡銀珊;Google的使用技巧及搜索引擎的發(fā)展趨勢[J];中國科技信息;2005年10期
10 ;中國政府網(wǎng)搜索引擎[J];中國傳媒科技;2006年01期
相關(guān)會議論文 前10條
1 董紅斌;蘇中濱;;基于Mobile Agent的信息搜索技術(shù)[A];全國計算機網(wǎng)絡(luò)應(yīng)用年會論文集(2001)[C];2001年
2 彭軻;廖聞劍;;淺析搜索引擎[A];中國通信學會第五屆學術(shù)年會論文集[C];2008年
3 李丹;;如何利用搜索引擎查找中醫(yī)藥信息[A];中國中醫(yī)藥信息研究會第二屆理事大會暨學術(shù)交流會議論文匯編[C];2003年
4 鄧長壽;郭景峰;楊焱林;鄧安遠;;下一代Web搜索引擎初探[A];第十八屆全國數(shù)據(jù)庫學術(shù)會議論文集(研究報告篇)[C];2001年
5 維尼拉·木沙江;吐爾洪·吾司曼;;維、哈、柯文搜索引擎中網(wǎng)頁爬行器的設(shè)計與實現(xiàn)[A];少數(shù)民族青年自然語言處理技術(shù)研究與進展——第三屆全國少數(shù)民族青年自然語言信息處理、第二屆全國多語言知識庫建設(shè)聯(lián)合學術(shù)研討會論文集[C];2010年
6 湯薇;曾艷;;構(gòu)建校園網(wǎng)搜索引擎必要性分析[A];廣西計算機學會2008年年會論文集[C];2008年
7 姚樹宇;趙少東;;一種使用分布式技術(shù)的搜索引擎[A];2005年全國開放式分布與并行計算學術(shù)會議論文集[C];2005年
8 倪俊峰;;基于黃頁搜索引擎的關(guān)鍵字排名廣告系統(tǒng)的設(shè)計與實現(xiàn)[A];2005年中國索引學會年會暨學術(shù)研討會論文集[C];2005年
9 張怡;查貴庭;;SEO在信息服務(wù)中的應(yīng)用研究[A];2010年中國索引學會年會暨學術(shù)研討會論文集[C];2010年
10 陳援非;何哲;朱珍民;;基于普適計算的個性化搜索技術(shù)[A];第二屆和諧人機環(huán)境聯(lián)合學術(shù)會議(HHME2006)——第2屆中國普適計算學術(shù)會議(PCC'06)論文集[C];2006年
相關(guān)重要報紙文章 前10條
1 記者 肖揚;信息搜索分眾化成為趨勢[N];金融時報;2006年
2 賽迪顧問股份有限公司互聯(lián)網(wǎng)與電子商務(wù)咨詢中心 常燕杰;搜索,,還是門戶[N];中國計算機報;2005年
3 本報記者 楊琳樺;“你是寶馬,但我說了算”[N];21世紀經(jīng)濟報道;2006年
4 本報記者 胡軍;搜索引擎邁下神壇[N];中國消費者報;2006年
5 南京大學社會學系教授 杜駿飛;構(gòu)建公平健康的網(wǎng)絡(luò)社會[N];解放日報;2008年
6 記者 林雨;網(wǎng)絡(luò)黃頁異軍突起[N];民營經(jīng)濟報;2005年
7 商報記者 江文兵;旅游搜索引擎遭遇寒冬[N];北京現(xiàn)代商報;2005年
8 江文兵;旅游搜索引擎遇寒冬[N];華東旅游報;2005年
9 本報記者 楊春暉;搜索返現(xiàn)金能讓用戶上癮?[N];中國計算機報;2008年
10 本報記者:段世文 ;林奇:演繹商用搜索引擎?zhèn)髌鎇N];經(jīng)濟參考報;2005年
相關(guān)博士學位論文 前10條
1 白玉琪;空間信息搜索引擎研究[D];中國科學院研究生院(遙感應(yīng)用研究所);2003年
2 王昤璞;基于用戶體驗的互聯(lián)網(wǎng)搜索引擎醫(yī)學信息檢索可用性評估研究[D];吉林大學;2010年
3 岑榮偉;基于用戶行為分析的搜索引擎評價研究[D];清華大學;2010年
4 李群;主題搜索引擎聚類算法的研究[D];北京林業(yè)大學;2011年
5 蘇君華;面向搜索引擎的技術(shù)接受模型研究[D];南京大學;2011年
6 劉佐達;分布協(xié)作式搜索引擎模型及算法研究[D];清華大學;2011年
7 陳旭毅;基于索引云的企業(yè)搜索引擎實現(xiàn)研究[D];武漢大學;2011年
8 郭眈;中文互聯(lián)網(wǎng)視頻搜索引擎系統(tǒng)策略研究[D];北京交通大學;2012年
9 李莎莎;面向搜索引擎的自然語言處理關(guān)鍵技術(shù)研究[D];國防科學技術(shù)大學;2011年
10 費巍;搜索引擎檢索功能的性能評價研究[D];武漢大學;2010年
相關(guān)碩士學位論文 前10條
1 薛云;Internet上元搜索引擎的研究與設(shè)計[D];太原理工大學;2003年
2 李雷;基于Nutch的農(nóng)業(yè)信息搜索引擎實現(xiàn)和優(yōu)化[D];吉林大學;2011年
3 徐財應(yīng);基于Lucene的搜索引擎技術(shù)的研究與改進[D];長春理工大學;2010年
4 王春花;基于Nutch的農(nóng)業(yè)搜索引擎檢索結(jié)果排序策略的研究[D];西北農(nóng)林科技大學;2010年
5 董晨;基于模糊聚類的個性化搜索引擎的研究[D];福州大學;2005年
6 封俊;基于Hadoop的分布式搜索引擎研究與實現(xiàn)[D];太原理工大學;2010年
7 李浩;分布式教育網(wǎng)信息檢索系統(tǒng)的研究和實現(xiàn)[D];華南理工大學;2010年
8 尉建興;基于Lucene搜索引擎的研究與應(yīng)用[D];太原理工大學;2011年
9 李建平;智能化WEB信息搜索引擎的研究與實現(xiàn)[D];大慶石油學院;2003年
10 袁宏;基于移動Agent的中文信息搜索引擎系統(tǒng)模型的研究[D];沈陽工業(yè)大學;2003年
本文編號:1472833
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1472833.html