天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 搜索引擎論文 >

基于用戶(hù)查詢(xún)?nèi)罩镜牟樵?xún)聚類(lèi)

發(fā)布時(shí)間:2018-03-23 23:25

  本文選題:聚類(lèi)算法 切入點(diǎn):搜索引擎 出處:《北京航空航天大學(xué)學(xué)報(bào)》2010年04期


【摘要】:基于用戶(hù)查詢(xún)?nèi)罩咎岢隽诵碌牟樵?xún)聚類(lèi)算法.用戶(hù)查詢(xún)?nèi)罩緮?shù)據(jù)量大,比通常用于查詢(xún)聚類(lèi)的查詢(xún)展現(xiàn)日志和查詢(xún)點(diǎn)擊日志更加稠密,不易產(chǎn)生聚類(lèi)小的問(wèn)題,但噪聲多,不容易處理.為發(fā)現(xiàn)相似查詢(xún)并減少噪聲影響,同一用戶(hù)同一時(shí)段的多次查詢(xún)(共現(xiàn)查詢(xún))之間認(rèn)為具有較高相似概率.在這一假設(shè)基礎(chǔ)上,利用查詢(xún)共現(xiàn)關(guān)系建立查詢(xún)的鄰居查詢(xún)向量空間.將查詢(xún)用鄰居查詢(xún)向量表示,鄰居查詢(xún)向量的相似度作為聚類(lèi)中的查詢(xún)相似度.應(yīng)用改進(jìn)的基于密度聚類(lèi)算法完成聚類(lèi).實(shí)驗(yàn)證明,95 262個(gè)查詢(xún)組成數(shù)據(jù)集上,聚類(lèi)算法實(shí)現(xiàn)查準(zhǔn)率79.77%、查全率48.21%,平均聚類(lèi)大小達(dá)到51.
[Abstract]:User query log query proposed new clustering algorithm based on query log data, than is commonly used for query clustering query logs and click query log to show more dense, not easy to produce a small cluster, but the noise, not easy to deal with. In order to find similar queries and reduces the noise, repeated the same query at the same time the user (co-occurrence queries) between that with a higher probability of similar. In this hypothesis, the co-occurrence relationship query vector space using neighbor query query. The query with neighbor query vector, neighbor query vector similarity as query similarity clustering. The application of improved clustering algorithm based on density complete clustering. The experimental results show that the 95262 query consists of data set, clustering algorithm precision 79.77%, recall 48.21%, the average cluster size reached 51.

【作者單位】: 北京航空航天大學(xué)計(jì)算機(jī)學(xué)院;
【基金】:國(guó)家863計(jì)劃資助項(xiàng)目(2007AA010302) 國(guó)家自然科學(xué)基金資助項(xiàng)目(60603039,90718018)
【分類(lèi)號(hào)】:TP391.3

【參考文獻(xiàn)】

相關(guān)期刊論文 前2條

1 張輝;謝科;龐斌;吳輝;;一種基于關(guān)鍵特征的搜索引擎結(jié)果聚類(lèi)算法[J];北京航空航天大學(xué)學(xué)報(bào);2007年06期

2 張剛;劉悅;郭嘉豐;程學(xué)旗;;一種層次化的檢索結(jié)果聚類(lèi)方法[J];計(jì)算機(jī)研究與發(fā)展;2008年03期

【共引文獻(xiàn)】

相關(guān)期刊論文 前8條

1 于洪;諶強(qiáng);;一種結(jié)合K-Means的層次化的搜索結(jié)果聚類(lèi)方法[J];重慶郵電大學(xué)學(xué)報(bào)(自然科學(xué)版);2010年03期

2 陳毅恒;秦兵;劉挺;王平;李生;;基于潛在語(yǔ)義索引和自組織映射網(wǎng)的檢索結(jié)果聚類(lèi)方法[J];計(jì)算機(jī)研究與發(fā)展;2009年07期

3 靳宇倡;秦啟文;安俊秀;;網(wǎng)絡(luò)群體心理趨勢(shì)智能分析模型研究[J];計(jì)算機(jī)科學(xué);2010年06期

4 安俊秀;;基于服務(wù)器集群的云檢索系統(tǒng)的研究與示范[J];計(jì)算機(jī)科學(xué);2010年07期

5 黃健斌;白楊;康劍梅;鐘翔;張?chǎng)?孫鶴立;;一種基于同步動(dòng)力學(xué)模型的網(wǎng)絡(luò)社團(tuán)發(fā)現(xiàn)方法[J];計(jì)算機(jī)研究與發(fā)展;2012年10期

6 柳佳剛;曾利軍;;基于PAT-tree的中文搜索引擎結(jié)果聚類(lèi)算法[J];情報(bào)雜志;2009年12期

7 龐觀松;張黎莎;蔣盛益;鄺麗敏;吳美玲;;一種基于名詞短語(yǔ)的檢索結(jié)果多層聚類(lèi)方法[J];山東大學(xué)學(xué)報(bào)(理學(xué)版);2010年07期

8 羅宏;陳黎;王亞強(qiáng);朱洪波;韓國(guó)輝;于中華;;基于查詢(xún)相關(guān)性分析的檢索結(jié)果聚類(lèi)算法[J];小型微型計(jì)算機(jī)系統(tǒng);2011年10期

相關(guān)會(huì)議論文 前1條

1 秦鵬;李恒訓(xùn);張華平;劉金剛;;基于關(guān)鍵詞提取的搜索結(jié)果聚類(lèi)研究[A];第五屆全國(guó)信息檢索學(xué)術(shù)會(huì)議論文集[C];2009年

相關(guān)博士學(xué)位論文 前3條

1 周世兵;聚類(lèi)分析中的最佳聚類(lèi)數(shù)確定方法研究及應(yīng)用[D];江南大學(xué);2011年

2 李紅梅;智能元搜索引擎關(guān)鍵技術(shù)研究[D];西安電子科技大學(xué);2009年

3 陳毅恒;文本檢索結(jié)果聚類(lèi)及類(lèi)別標(biāo)簽抽取技術(shù)研究[D];哈爾濱工業(yè)大學(xué);2010年

相關(guān)碩士學(xué)位論文 前10條

1 軒春青;基于客戶(hù)反饋的FTP搜索引擎的研究與設(shè)計(jì)[D];鄭州大學(xué);2011年

2 鄒浩;基于B/S+C/S結(jié)構(gòu)的高校圖書(shū)管理系統(tǒng)[D];電子科技大學(xué);2011年

3 劉龍海;基于成對(duì)約束的半監(jiān)督文本聚類(lèi)算法研究[D];重慶大學(xué);2011年

4 楊韶華;形式背景近似約簡(jiǎn)及其在信息聚類(lèi)中的應(yīng)用[D];河南大學(xué);2008年

5 林浩;基于電子商務(wù)平臺(tái)的智能搜索引擎研究與設(shè)計(jì)[D];東北師范大學(xué);2009年

6 史進(jìn)玲;基于粒計(jì)算的決策表屬性約簡(jiǎn)與規(guī)則提取研究[D];河南師范大學(xué);2009年

7 王平;基于自組織特征映射的檢索結(jié)果聚類(lèi)研究[D];哈爾濱工業(yè)大學(xué);2009年

8 萬(wàn)濤;圖書(shū)館管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D];吉林大學(xué);2009年

9 李琳;基于粗糙集和遺傳算法的聚類(lèi)方法研究[D];廣西師范大學(xué);2009年

10 黎冬;基于Linux平臺(tái)FTP搜索引擎的研究[D];湖北工業(yè)大學(xué);2009年

【二級(jí)參考文獻(xiàn)】

相關(guān)期刊論文 前3條

1 姚莉秀,楊杰,葉晨洲,陳念貽;用于特征篩選的最近鄰(KNN)法[J];計(jì)算機(jī)與應(yīng)用化學(xué);2001年02期

2 王志梅,張俊林,李秋山;Web檢索結(jié)果快速聚類(lèi)方法的研究與實(shí)現(xiàn)[J];計(jì)算機(jī)工程與設(shè)計(jì);2004年12期

3 耿玉良,陳家琪,王詠梅;中文Web檢索中聚類(lèi)算法的改進(jìn)[J];計(jì)算機(jī)工程與設(shè)計(jì);2005年10期

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 彭松行;;基于描述優(yōu)先算法的Web搜索結(jié)果聚類(lèi)系統(tǒng)研究[J];心智與計(jì)算;2010年04期

2 周彩蘭;馮斌;;Web數(shù)據(jù)挖掘在搜索引擎中的應(yīng)用[J];軟件導(dǎo)刊;2007年17期

3 張麗霞;;如何在Web挖掘中使用聚類(lèi)算法[J];牡丹江大學(xué)學(xué)報(bào);2007年09期

4 江婕;李建民;曾R挽,

本文編號(hào):1655688


資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1655688.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶(hù)11b42***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com