天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

云搜索中的搜索結(jié)果聚類技術(shù)研究

發(fā)布時間:2018-02-11 12:47

  本文關(guān)鍵詞: 搜索引擎 搜索結(jié)果聚類 模糊C均值 近鄰傳播算法 出處:《北京郵電大學(xué)》2013年碩士論文 論文類型:學(xué)位論文


【摘要】:隨著互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,網(wǎng)絡(luò)信息激增,搜索引擎逐漸成為用戶查找網(wǎng)絡(luò)信息的主要工具。但是,著名的搜索引擎如Google、百度等,為用戶返回的結(jié)果均為線性列表的形式,毫無規(guī)律的羅列在一起。這些搜索結(jié)果往往數(shù)以萬計,因此用戶經(jīng)常需要花費大量時間在這些雜亂的線性列表中來查找自己真正需要的結(jié)果。 所謂搜索結(jié)果聚類,是指將搜索引擎的返回結(jié)果按照不同的主題聚類,然后以類別的形式展現(xiàn)給用戶。與傳統(tǒng)搜索引擎以列表形式返回搜索結(jié)果相比,以類別的形式返回搜索結(jié)果更能方便用戶快速查找定位信息,可以有效地幫助用戶減少查找信息所需要的時間,提高用戶獲取信息的效率,從而提升搜索引擎的用戶體驗。 論文的工作主要包括以下幾個方面:(1)研究搜索結(jié)果的向量表示形式,特征詞項的權(quán)重計算和搜索結(jié)果間的相似性度量方法,通過實驗驗證找出適用于搜索結(jié)果在線聚類的最佳方法。(2)針對傳統(tǒng)向量空間模型及相似性度量方法中忽略搜索結(jié)果中詞項前后位關(guān)系以及詞項詞性等問題,提出一種針對搜索結(jié)果標(biāo)題聚類的相似性度量方法。(3)針對模糊C均值算法需預(yù)先指定聚類數(shù)目的問題,結(jié)合近鄰傳播算法對這一問題進(jìn)行改進(jìn),并使用Carrot2聚類平臺獲取大量搜索結(jié)果集進(jìn)行新聚類方法的驗證。
[Abstract]:With the continuous development of Internet technology and the proliferation of network information, search engines have gradually become the main tools for users to find information on the Internet. However, famous search engines, such as Google and Baidu, return results in the form of linear lists for users. These search results tend to be in the tens of thousands, so users often spend a lot of time in these messy linear lists to find the results they really need. The so-called search result clustering refers to clustering the returned results of search engines according to different topics and then presenting them to users in the form of categories. Compared with traditional search engines, they return search results in the form of lists. Returning search results in the form of categories can facilitate users to find location information quickly, can effectively help users to reduce the time required to find information, improve the efficiency of users to obtain information, and thus enhance the user experience of search engines. The main work of this paper includes the following aspects: 1) study the vector representation of search results, calculate the weight of feature items and measure the similarity between search results. The best method for online clustering of search results is found out by experiment. (2) aiming at the problems of ignoring the relationship between word items and word items in traditional vector space models and similarity measurement methods, and so on, this paper proposes a new method for online clustering of search results. In this paper, a similarity measure method for the clustering of search results is proposed. The fuzzy C-means algorithm needs to specify the number of clusters in advance, which is improved by combining with the nearest neighbor propagation algorithm. Carrot2 clustering platform is used to obtain a large number of search result sets to verify the new clustering method.
【學(xué)位授予單位】:北京郵電大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2013
【分類號】:TP391.3

【參考文獻(xiàn)】

相關(guān)期刊論文 前10條

1 張倩;;依托智能搜索引擎構(gòu)建檔案信息檢索系統(tǒng)的策略研究[J];檔案與建設(shè);2011年06期

2 陽小蘭;錢程;趙海廷;;Web文本預(yù)處理技術(shù)探析[J];電腦知識與技術(shù);2010年29期

3 高新波,裴繼紅,謝維信;模糊c-均值聚類算法中加權(quán)指數(shù)m的研究[J];電子學(xué)報;2000年04期

4 張妍;許云峰;張立全;;基于云計算的中文分詞研究[J];河北科技大學(xué)學(xué)報;2012年03期

5 毛嘉莉;;文本聚類中的特征降維方法研究[J];西華師范大學(xué)學(xué)報(自然科學(xué)版);2009年04期

6 管仁初;裴志利;時小虎;楊晨;梁艷春;;權(quán)吸引子傳播算法及其在文本聚類中的應(yīng)用[J];計算機(jī)研究與發(fā)展;2010年10期

7 何擁軍,駱嘉偉,孫星明;應(yīng)用鏈接分析的web搜索結(jié)果聚類[J];計算機(jī)工程與應(yīng)用;2005年02期

8 于洪;楊大春;;基于擴(kuò)展粗集模型的聚類方法研究[J];計算機(jī)工程與應(yīng)用;2007年08期

9 李春芳;龐雅靜;錢麗璞;高愛華;;半監(jiān)督FCM聚類算法目標(biāo)函數(shù)研究[J];計算機(jī)工程與應(yīng)用;2009年14期

10 齊淼;張化祥;;改進(jìn)的模糊C-均值聚類算法研究[J];計算機(jī)工程與應(yīng)用;2009年20期

相關(guān)碩士學(xué)位論文 前7條

1 奚婷;搜索引擎結(jié)果的聚類系統(tǒng)研究[D];西南交通大學(xué);2011年

2 俞文明;Web中文文本聚類研究[D];杭州電子科技大學(xué);2009年

3 李麗麗;模糊C-均值聚類算法及其在圖像分割中的應(yīng)用[D];山東師范大學(xué);2009年

4 陳平;中文聚類搜索引擎中主要技術(shù)的研究[D];吉林大學(xué);2009年

5 張筱丹;基于向量空間模型的web文本自動摘要系統(tǒng)的研究[D];合肥工業(yè)大學(xué);2009年

6 李靜月;中文事件模式自動生成方法的研究和實現(xiàn)[D];蘇州大學(xué);2010年

7 王英帥;Web人名消歧方法的研究與實現(xiàn)[D];蘇州大學(xué);2010年

,

本文編號:1503094

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1503094.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶76f56***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com