天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 搜索引擎論文 >

基于聚類的搜索可視化呈現系統(tǒng)的設計與實現

發(fā)布時間:2018-03-15 00:14

  本文選題:搜索結果聚類 切入點:可視化 出處:《北京郵電大學》2013年碩士論文 論文類型:學位論文


【摘要】:隨著信息技術以及互聯(lián)網的普及,搜索引擎技術得到了快速的發(fā)展,傳統(tǒng)的搜索引擎根據用戶輸入的檢索關鍵字為用戶提供搜索結果,并根據相關性對得到的搜索結果進行排序。然而,由于自然語言中的詞語往往存在二義性,用戶所輸入的檢索詞概念相對模糊,導致搜索結果范圍相對分散,用戶需要花費一定時間才能找到自己真正感興趣的主題。如何有效處理大量的搜索結果減少用戶的檢索時間,這促進了元搜索引擎技術以及文本聚類技術的發(fā)展。 本論文旨在結合元搜索和文本聚類技術對搜索結果進行改進和增強。元搜索技術是建立在獨立搜索引擎上的一種技術,該技術能夠針對各個成員搜索引擎的搜索結果進行匯聚和篩選,并將整合的最終結果呈現給用戶。搜索結果之間存在著不同程度的差異性,如果利用文本聚類技術對搜索結果進行聚類,以層次化的形式呈現搜索結果,每個聚類結果都有一個標簽用以描述其主題和內容,這樣可以一定程度上幫助用戶進行搜索定位,從而將檢索范圍和用于檢索篩選的時間降低。 本論文的主要內容是設計并實現一個基于聚類的搜索結果可視化工具。為了實現該工具,本文首先基于原有搜索引擎得到的結果,提出一種結合用戶行為的搜索結果聚類方法。該方法通過對搜索結果進行二次處理,將具有相似主題的搜索結果歸并,以聚類的形式將搜索結果呈現給用戶,幫助用戶快速定位到自己感興趣的信息。與此同時,該方法還對用戶的訪問行為信息加以收集分析,通過迭代的方式不斷優(yōu)化聚類算法。本文結合需求對系統(tǒng)相關方案和總體架構進行說明,包括了搜索結果獲取、搜索結果預處理、聚類生成以及用戶行為分析等主要模塊的設計思想和工作原理。接下來,本文對各個主要模塊的實現以及具體交互設計和工作流程進行詳細的說明,并展示了最終的聚類效果以及對聚類效果和質量方面的測試結果。最后對本文設計實現的搜索結果聚類可視化工具提出建議和下一步研究方向。
[Abstract]:With the popularity of information technology and the Internet, search engine technology has been rapidly developed. Traditional search engines provide users with search results according to the search keywords entered by users. The search results are sorted according to the correlation. However, because of the ambiguity of the words in the natural language, the concept of the search words entered by the user is relatively fuzzy, which leads to the relative dispersion of the search results. It takes a certain amount of time for users to find their own real topic of interest. How to effectively deal with a large number of search results to reduce the retrieval time of users, which promotes the development of meta-search engine technology and text clustering technology. The purpose of this thesis is to improve and enhance the search results by combining meta-search and text clustering. Meta-search is a technology based on independent search engine. This technology can aggregate and filter the search results of each member search engine, and present the integrated final results to the users. If the text clustering technology is used to cluster the search results and present the search results in a hierarchical form, each result has a label to describe its subject and content, which can help the user to locate the search to a certain extent. As a result, the retrieval range and the time used for retrieving filtering are reduced. The main content of this paper is to design and implement a clustering based search results visualization tool. A search result clustering method combining user behavior is proposed. By quadratic processing of search results, the search results with similar topics are merged and presented to users in the form of clustering. It helps users quickly locate the information they are interested in. At the same time, the method also collects and analyzes the information about users' access behavior. In this paper, the related schemes and the overall architecture of the system are explained, including the search results acquisition, search results preprocessing, and the optimization of the clustering algorithm. The design idea and working principle of the main modules, such as clustering generation and user behavior analysis, are introduced in detail. Then, the realization of the main modules and the specific interactive design and workflow are described in detail. Finally, the final clustering effect and the test results of clustering effect and quality are presented. Finally, some suggestions and further research directions are given for the design and implementation of the search result clustering visualization tool in this paper.
【學位授予單位】:北京郵電大學
【學位級別】:碩士
【學位授予年份】:2013
【分類號】:TP391.3

【參考文獻】

相關期刊論文 前6條

1 王繼成,潘金貴,張福炎;Web文本挖掘技術研究[J];計算機研究與發(fā)展;2000年05期

2 王繼成,蕭嶸,孫正興,張福炎;Web信息檢索研究進展[J];計算機研究與發(fā)展;2001年02期

3 徐偉革;;淺析數字圖書館搜索引擎[J];科技情報開發(fā)與經濟;2010年20期

4 余慧佳;劉奕群;張敏;茹立云;馬少平;;基于大規(guī)模日志分析的搜索引擎用戶行為分析[J];中文信息學報;2007年01期

5 趙華軍;鐘才明;李文;王睿智;苗奪謙;;網頁搜索結果聚類與可視化[J];南京大學學報(自然科學版);2010年05期

6 趙宇;;計算機檢索工具的發(fā)展與應用[J];中小企業(yè)管理與科技(上旬刊);2011年02期

相關碩士學位論文 前4條

1 蘇力華;基于向量空間模型的文本分類技術研究[D];西安電子科技大學;2006年

2 周登朋;搜索引擎搜索結果的聚類研究[D];上海交通大學;2007年

3 馮超;K-means聚類算法的研究[D];大連理工大學;2007年

4 馮冰潔;后綴樹算法在元搜索引擎中的應用[D];暨南大學;2010年

,

本文編號:1613569

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1613569.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶8b536***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com