基于二次排序的個性化中文搜索引擎設(shè)計與實現(xiàn)
發(fā)布時間:2018-07-01 09:20
本文選題:個性化搜索引擎 + 用戶興趣; 參考:《廣西大學(xué)》2013年碩士論文
【摘要】:隨著計算機系統(tǒng)性能的提高和網(wǎng)絡(luò)技術(shù)的飛速發(fā)展,Internet成為全球最大的信息資源庫,用戶面臨著“信息過載”的問題。如何為如此龐大的信息資源提供高效的信息檢索服務(wù),幫助用戶在數(shù)據(jù)的海洋中快速找到需要的信息是搜索引擎急需解決的問題。解決上述問題的方法之一是研發(fā)個性化搜索引擎。如何實現(xiàn)個性化服務(wù),已成為了搜索引擎技術(shù)研究中的熱點之一。 本文主要介紹了個性搜索引擎的研究現(xiàn)狀以及現(xiàn)有搜索引擎的不足,結(jié)合第一和第二代搜索引擎技術(shù),通過分析用戶在使用搜索引擎時打開的鏈接Web頁面,提出了一種基于由客戶端自行即時分析、自行即時應(yīng)答反饋、自行即時再排序的個性化搜索引擎模型——基于二次排序的個性化搜索引擎系統(tǒng)模型,并完成了一個基于二次排序個性化中文搜索引擎系統(tǒng)原型Myso搜索引擎。本論文所作的主要工作如下: (1)在研究個性化搜索引擎工作原理的基礎(chǔ)上,設(shè)計和實現(xiàn)了基于二次排序的個性化搜索引擎系統(tǒng)模型-Myso搜索引擎。 (2)借鑒詞頻位置加權(quán)排序法,設(shè)計了基于中文分詞系統(tǒng)ICTCIAS中詞的eWeight計算網(wǎng)頁Rank的公式與算法,計算網(wǎng)頁初始的序列并簡化Myso搜索引擎,。 (3)為了獲取用戶興趣,利用隱式收集用戶興趣技術(shù),設(shè)計了一種跟蹤用戶的行為的即時更新用戶興趣的方法;在此基礎(chǔ)上,結(jié)合網(wǎng)頁分類技術(shù),提出了一種個性化排序方法一基于二次排序的個性化排序方法。
[Abstract]:With the improvement of computer system performance and the rapid development of network technology, Internet has become the largest information resource bank in the world, and users are facing the problem of "information overload". How to provide an efficient information retrieval service for such a huge information resource and help users quickly find the information needed in the ocean of data is an urgent problem for search engines to solve. One of the ways to solve these problems is to develop personalized search engines. How to realize personalized service has become one of the hotspots in the research of search engine technology. This paper mainly introduces the research status of personality search engine and the deficiency of the existing search engine. Combining with the first and second generation search engine technology, this paper analyzes the linked Web page that the user opens when using the search engine. This paper presents a personalized search engine model based on real-time analysis, feedback and reordering by the client, which is based on the second order of the personalized search engine system. And completed a personalized Chinese search engine system based on secondary sorting Myso search engine prototype. The main work of this paper is as follows: (1) on the basis of studying the working principle of personalized search engine, This paper designs and implements the personalized search engine model-Myso search engine based on quadratic ordering. (2) the formula and algorithm of eWeight computing web page Rank based on Chinese word segmentation system ICTCIAS is designed. The initial sequence of web pages is calculated and the Myso search engine is simplified. (3) in order to gain users' interest, an instant updating method of user interest is designed to track the user's behavior by using the technology of gathering user's interest implicitly. Combined with the technology of web page classification, a personalized sorting method based on secondary sorting is proposed.
【學(xué)位授予單位】:廣西大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2013
【分類號】:TP391.3
【參考文獻】
相關(guān)期刊論文 前10條
1 陳智;錢言玉;;基于用戶興趣的個性化搜索引擎研究[J];合肥師范學(xué)院學(xué)報;2010年03期
2 張春元;康耀紅;伍小芹;;Web信息檢索排序算法研究[J];海南大學(xué)學(xué)報(自然科學(xué)版);2009年01期
3 王碩;尤楓;山嵐;趙恒永;;一種適用于專業(yè)搜索引擎的中文分詞系統(tǒng)研究[J];計算機工程與應(yīng)用;2008年19期
4 樊勇;鄭家恒;;網(wǎng)頁去重方法研究[J];計算機工程與應(yīng)用;2009年12期
5 包瑞;;淺析第三代搜索引擎的發(fā)展[J];晉圖學(xué)刊;2010年04期
6 曹樹金,楊濤;自動分類在搜索引擎性能優(yōu)化中的應(yīng)用[J];情報科學(xué);2004年02期
7 成穎,史九林;自動分類研究現(xiàn)狀與展望[J];情報學(xué)報;1999年01期
8 文振威;秦曉;;個性化搜索引擎的研究與設(shè)計[J];計算機工程與設(shè)計;2009年02期
9 王繼生;王一莉;;基于自適應(yīng)互動式的元搜索引擎[J];計算機工程與設(shè)計;2009年07期
10 柳婷;;網(wǎng)絡(luò)蜘蛛的簡單設(shè)計與研究[J];大眾商務(wù);2010年16期
,本文編號:2087312
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2087312.html
最近更新
教材專著