搜索引擎及其個(gè)性化
本文選題:搜索引擎 + 個(gè)性化 ; 參考:《復(fù)旦大學(xué)》2012年碩士論文
【摘要】:隨著網(wǎng)絡(luò)技術(shù)的飛速發(fā)展和電腦設(shè)備的普及,人們的生活、工作已經(jīng)越來越不能離開網(wǎng)絡(luò),網(wǎng)絡(luò)上的信息也是呈指數(shù)級(jí)的增多,為了幫助用戶從海量的信息中到找到他們所需要的那部分信息,搜索引擎技術(shù)應(yīng)運(yùn)而生,并迅速成為人們不可或缺的信息查找工具,在短時(shí)間內(nèi)風(fēng)靡全球。搜索引擎技術(shù)的使用在很大程度上解決了人們查找信息的困難,但它也存在許多缺陷:搜索引擎反饋給用戶的結(jié)果越來越多,而且對(duì)所有的用戶一視同仁,沒有針對(duì)性,其中的很多信息是用戶并不需要的,這樣的反饋結(jié)果使得用戶耗費(fèi)大量時(shí)間都可能找不到自己需要的信息,因此改善用戶的查詢體驗(yàn)以便于用戶從海量的網(wǎng)絡(luò)信息資源中得到自己所需的內(nèi)容,必然會(huì)成為搜索引擎技術(shù)發(fā)展的一個(gè)重要方向,個(gè)性化搜索引擎的正是基于這一思想提出的。 本文圍繞個(gè)性化搜索引擎的應(yīng)用展開,從分析搜索引擎用戶的角度入手,介紹了搜索引擎技術(shù)的發(fā)展,個(gè)性化搜索引擎技術(shù)的原理,研究的現(xiàn)狀和存在的問題,并提出了個(gè)人認(rèn)為的預(yù)期發(fā)展,對(duì)現(xiàn)有的應(yīng)用提出了一些改進(jìn)方法,研究工作具有一定的理論性和實(shí)用性。本文的研究重點(diǎn)為以下幾個(gè)方面: 1.用戶信息的收集和分析。要想達(dá)到“個(gè)性化搜索”的目的,必須能通過用戶上網(wǎng)留下的痕跡來收集到用戶的有效信息,并利用這些信息分析出用戶的興趣、上網(wǎng)習(xí)慣等,以用于與搜索結(jié)果匹配。 2.如何對(duì)現(xiàn)有的搜索引擎的進(jìn)行改進(jìn)以達(dá)到個(gè)性化搜索結(jié)果的目的。目前使用的主流搜索引擎如百度、谷歌等雖然有其不足之處,但從技術(shù)的實(shí)現(xiàn)等方面去考慮,個(gè)性化的過程不會(huì)馬上能夠?qū)崿F(xiàn),必然是在目前的基礎(chǔ)上循序漸進(jìn)的進(jìn)行,那么對(duì)目前的搜索引擎的一些改進(jìn)可以達(dá)到較好的效果。 3.研究開源全文檢索工具Lucene,使用Lucene進(jìn)行索引與檢索。
[Abstract]:With the rapid development of network technology and the popularization of computer equipment, people's life and work have become more and more unable to leave the network, and the information on the network is also increasing exponentially. In order to help users from the mass of information to find the part of information they need, search engine technology emerged as the times require, and quickly become an indispensable information search tool, in a short period of time popular around the world. The use of search engine technology has largely solved the difficulty of finding information, but it also has many defects: search engine feedback to users more and more, and the same to all users, not targeted, Much of this information is not needed by the user, and such feedback results in the possibility that users will not be able to find the information they need for a great deal of time. Therefore, improving the user's query experience so that users can get the content they need from the massive network information resources will inevitably become an important direction in the development of search engine technology. Personalized search engine is based on this idea put forward. Based on the application of personalized search engine, this paper introduces the development of search engine technology, the principle of personalized search engine technology, the status quo of the research and the existing problems from the point of view of analyzing the users of the search engine. The author also puts forward the expected development of personal opinion, and puts forward some improved methods for the existing application. The research work has certain theory and practicability. This paper focuses on the following aspects: 1. Collection and analysis of user information. In order to achieve the goal of "personalized search", we must be able to collect the effective information of the user through the traces left by the user on the Internet, and use this information to analyze the interests and habits of the user, etc., in order to match the search results. 2. How to improve the existing search engine to achieve the goal of personalized search results. The mainstream search engines currently used, such as Baidu and Google, have their shortcomings, but considering the realization of technology and other aspects, the process of individuation will not be realized immediately. It is bound to be carried out step by step on the current basis. So some improvements to the current search engine can achieve better results. 3. This paper studies the open source full-text retrieval tool Lucene and uses Lucene for indexing and retrieval.
【學(xué)位授予單位】:復(fù)旦大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2012
【分類號(hào)】:TP391.3
【相似文獻(xiàn)】
相關(guān)期刊論文 前10條
1 劉高原;張國平;;基于Nutch的搜索引擎技術(shù)[J];平頂山學(xué)院學(xué)報(bào);2008年05期
2 胡長春;劉功申;;面向搜索引擎Lucene的中文分析器[J];計(jì)算機(jī)工程與應(yīng)用;2009年12期
3 孫建;秦琪;袁方;;基于Lucene的知識(shí)搜索引擎的設(shè)計(jì)與實(shí)現(xiàn)[J];安徽電氣工程職業(yè)技術(shù)學(xué)院學(xué)報(bào);2011年01期
4 楊晶;呂天君;蔣占生;;Web搜索引擎原理及應(yīng)用研究[J];軟件導(dǎo)刊;2008年07期
5 王豐;戴兵;;國內(nèi)中文搜索引擎研究[J];電腦知識(shí)與技術(shù)(學(xué)術(shù)交流);2007年08期
6 伍裕標(biāo);搜索無結(jié)果原因剖析[J];個(gè)人電腦;2004年03期
7 趙紅梅;互聯(lián)網(wǎng)實(shí)時(shí)信息搜索引擎[J];大眾標(biāo)準(zhǔn)化;2004年12期
8 彭波;搜索引擎的混合索引技術(shù)[J];計(jì)算機(jī)工程與應(yīng)用;2004年22期
9 翟曉玲;潘偉;王波;;基于Lucene的web站內(nèi)搜索引擎的研究與實(shí)現(xiàn)[J];硅谷;2009年12期
10 余斯恒,鄭扣根,陳丹;一種面向商業(yè)領(lǐng)域的搜索引擎索引結(jié)構(gòu)設(shè)計(jì)及實(shí)現(xiàn)[J];計(jì)算機(jī)工程與科學(xué);2005年12期
相關(guān)會(huì)議論文 前10條
1 彭軻;廖聞劍;;淺析搜索引擎[A];中國通信學(xué)會(huì)第五屆學(xué)術(shù)年會(huì)論文集[C];2008年
2 李丹;;如何利用搜索引擎查找中醫(yī)藥信息[A];中國中醫(yī)藥信息研究會(huì)第二屆理事大會(huì)暨學(xué)術(shù)交流會(huì)議論文匯編[C];2003年
3 鄧長壽;郭景峰;楊焱林;鄧安遠(yuǎn);;下一代Web搜索引擎初探[A];第十八屆全國數(shù)據(jù)庫學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2001年
4 維尼拉·木沙江;吐爾洪·吾司曼;;維、哈、柯文搜索引擎中網(wǎng)頁爬行器的設(shè)計(jì)與實(shí)現(xiàn)[A];少數(shù)民族青年自然語言處理技術(shù)研究與進(jìn)展——第三屆全國少數(shù)民族青年自然語言信息處理、第二屆全國多語言知識(shí)庫建設(shè)聯(lián)合學(xué)術(shù)研討會(huì)論文集[C];2010年
5 謝麗星;孫茂松;佟子健;王燦輝;;基于用戶查詢?nèi)罩竞湾^文字的漢語縮略語識(shí)別[A];中國計(jì)算機(jī)語言學(xué)研究前沿進(jìn)展(2007-2009)[C];2009年
6 湯薇;曾艷;;構(gòu)建校園網(wǎng)搜索引擎必要性分析[A];廣西計(jì)算機(jī)學(xué)會(huì)2008年年會(huì)論文集[C];2008年
7 姚樹宇;趙少東;;一種使用分布式技術(shù)的搜索引擎[A];2005年全國開放式分布與并行計(jì)算學(xué)術(shù)會(huì)議論文集[C];2005年
8 倪俊峰;;基于黃頁搜索引擎的關(guān)鍵字排名廣告系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[A];2005年中國索引學(xué)會(huì)年會(huì)暨學(xué)術(shù)研討會(huì)論文集[C];2005年
9 張怡;查貴庭;;SEO在信息服務(wù)中的應(yīng)用研究[A];2010年中國索引學(xué)會(huì)年會(huì)暨學(xué)術(shù)研討會(huì)論文集[C];2010年
10 陳援非;何哲;朱珍民;;基于普適計(jì)算的個(gè)性化搜索技術(shù)[A];第二屆和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2006)——第2屆中國普適計(jì)算學(xué)術(shù)會(huì)議(PCC'06)論文集[C];2006年
相關(guān)重要報(bào)紙文章 前10條
1 章森 王偉;搜索引擎的工作機(jī)制[N];計(jì)算機(jī)世界;2006年
2 李一鑫;搜索排名的紅與黑[N];財(cái)經(jīng)時(shí)報(bào);2007年
3 周文林;搜狗3.0能否撼動(dòng)搜索市場[N];經(jīng)濟(jì)參考報(bào);2007年
4 惠正一;比爾·蓋茨:微軟不怕Google[N];第一財(cái)經(jīng)日?qǐng)?bào);2005年
5 賽迪顧問股份有限公司互聯(lián)網(wǎng)與電子商務(wù)咨詢中心 常燕杰;搜索,,還是門戶[N];中國計(jì)算機(jī)報(bào);2005年
6 陳珊;浙江移動(dòng)推出手機(jī)搜索引擎服務(wù)[N];人民郵電;2005年
7 趙法忠;搜索引擎還需悠著點(diǎn)[N];中國經(jīng)營報(bào);2005年
8 金朝力;搜索引擎火拼搜索質(zhì)量[N];北京商報(bào);2006年
9 本報(bào)記者 趙曉輝 孟昭麗;搜索引擎駛?cè)搿氨茱L(fēng)港”[N];中國證券報(bào);2006年
10 孫t;搜索引擎驚喜侵權(quán)官司止于“避風(fēng)港”?[N];第一財(cái)經(jīng)日?qǐng)?bào);2006年
相關(guān)博士學(xué)位論文 前10條
1 李群;主題搜索引擎聚類算法的研究[D];北京林業(yè)大學(xué);2011年
2 岑榮偉;基于用戶行為分析的搜索引擎評(píng)價(jià)研究[D];清華大學(xué);2010年
3 蘇君華;面向搜索引擎的技術(shù)接受模型研究[D];南京大學(xué);2011年
4 劉佐達(dá);分布協(xié)作式搜索引擎模型及算法研究[D];清華大學(xué);2011年
5 黃建年;農(nóng)業(yè)古籍的計(jì)算機(jī)斷句標(biāo)點(diǎn)與分詞標(biāo)引研究[D];南京農(nóng)業(yè)大學(xué);2009年
6 陳旭毅;基于索引云的企業(yè)搜索引擎實(shí)現(xiàn)研究[D];武漢大學(xué);2011年
7 郭眈;中文互聯(lián)網(wǎng)視頻搜索引擎系統(tǒng)策略研究[D];北京交通大學(xué);2012年
8 王昤璞;基于用戶體驗(yàn)的互聯(lián)網(wǎng)搜索引擎醫(yī)學(xué)信息檢索可用性評(píng)估研究[D];吉林大學(xué);2010年
9 李莎莎;面向搜索引擎的自然語言處理關(guān)鍵技術(shù)研究[D];國防科學(xué)技術(shù)大學(xué);2011年
10 白玉琪;空間信息搜索引擎研究[D];中國科學(xué)院研究生院(遙感應(yīng)用研究所);2003年
相關(guān)碩士學(xué)位論文 前10條
1 陳魁;智能搜索引擎系統(tǒng)的分析設(shè)計(jì)與開發(fā)[D];大連理工大學(xué);2004年
2 劉懷英;基于分布式并行計(jì)算的搜索引擎的研究與設(shè)計(jì)[D];武漢理工大學(xué);2005年
3 孫曉峰;基于輕量級(jí)框架的互動(dòng)問答平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn)[D];中國地質(zhì)大學(xué)(北京);2008年
4 孫華昱;Lucene在醫(yī)學(xué)影像資源檢索平臺(tái)中的應(yīng)用[D];沈陽工業(yè)大學(xué);2011年
5 陳焱R
本文編號(hào):1791936
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1791936.html