基于概念聚類的Web數(shù)據(jù)挖掘搜索引擎的設計與實現(xiàn)
本文關鍵詞:基于概念聚類的Web數(shù)據(jù)挖掘搜索引擎的設計與實現(xiàn)
更多相關文章: 二分圖 鄰接矩陣 聚類 數(shù)據(jù)挖掘 搜索引擎
【摘要】:針對Web數(shù)據(jù)挖掘的搜索過程,其準確度很大程度取決于用戶輸入的關鍵詞的數(shù)量,以及搜索引擎對關鍵詞的語義的解析與用戶原意的吻合度,而搜索引擎對關鍵詞的解析,包括基于鏈接的聚類方法和基于概念的聚類方法。本文克服基于鏈接的聚類方法的缺陷,采用基于概念聚類的方法,從二分圖的概念和存儲方法入手,設計和實現(xiàn)了個性化的Web數(shù)據(jù)挖掘搜索引擎,并驗證了其優(yōu)越性。
【作者單位】: 湖南警察學院信息技術系;湖南大學軟件學院;
【關鍵詞】: 二分圖 鄰接矩陣 聚類 數(shù)據(jù)挖掘 搜索引擎
【基金】:湖南省科技創(chuàng)新基金項目資助(項目編號:2014FJ3108)
【分類號】:TP311.13;TP391.3
【正文快照】: 眾所周知,關鍵詞數(shù)量越多,單個詞越能清晰表達查詢需求,搜索引擎就越能準確計算網(wǎng)頁相關度,用戶就越能準確得到所希望的查詢結果。然而絕大多數(shù)用戶在使用搜索引擎時,輸入的關鍵詞都少于三個,且很多情況下,關鍵詞不能正確表達用戶的查詢需求,使得查詢結果不盡如人意。本文采用
【參考文獻】
中國期刊全文數(shù)據(jù)庫 前2條
1 王和勇;鄭杰;姚正安;李磊;;基于聚類和改進距離的LLE方法在數(shù)據(jù)降維中的應用[J];計算機研究與發(fā)展;2006年08期
2 吳湖;王永吉;王哲;王秀利;杜栓柱;;兩階段聯(lián)合聚類協(xié)同過濾算法[J];軟件學報;2010年05期
【共引文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 紀良浩;;協(xié)作過濾信息推薦技術研究[J];重慶郵電大學學報(自然科學版);2012年01期
2 田兆東;張育林;;自適應局部線性嵌入算法[J];電腦編程技巧與維護;2010年06期
3 胡利斌;;基于流形的概念空間形式化研究[J];電腦知識與技術;2010年10期
4 付媛;邢志棟;董建民;張?zhí)m;;LLE方法在圖像檢索中的應用[J];高師理科學刊;2009年03期
5 楊曉敏;吳煒;何小海;陳默;;應用SLLE實現(xiàn)手寫體數(shù)字識別[J];光學精密工程;2009年03期
6 張莉;;電子商務協(xié)同推薦技術研究綜述分析[J];電子商務;2012年07期
7 韓淑云;;協(xié)同過濾算法中擴展性問題研究[J];計算機光盤軟件與應用;2013年17期
8 文貴華;;面向機器學習的相對變換[J];計算機研究與發(fā)展;2008年04期
9 吳泓辰;王新軍;成勇;彭朝暉;;基于協(xié)同過濾與劃分聚類的改進推薦算法[J];計算機研究與發(fā)展;2011年S3期
10 李勇;陳賀新;趙剛;孫中華;陳綿書;;基于可變k近鄰LLE數(shù)據(jù)降維的圖像檢索方法[J];吉林大學學報(工學版);2008年04期
中國重要會議論文全文數(shù)據(jù)庫 前1條
1 劉新東;;基于LLE和SVM的模擬電路軟故障診斷[A];'2010系統(tǒng)仿真技術及其應用學術會議論文集[C];2010年
中國博士學位論文全文數(shù)據(jù)庫 前10條
1 夏培勇;個性化推薦技術中的協(xié)同過濾算法研究[D];中國海洋大學;2011年
2 王慶軍;基于流形學習子空間的人臉識別方法研究[D];哈爾濱工程大學;2011年
3 朱蓉;基于語義的Web圖像分類研究[D];浙江大學;2011年
4 席景科;時空孤立點檢測算法研究[D];中國礦業(yè)大學;2010年
5 袁冠;移動對象軌跡數(shù)據(jù)挖掘方法研究[D];中國礦業(yè)大學;2012年
6 張曉龍;艾薩銅熔煉配料優(yōu)化及狀態(tài)控制參數(shù)預測方法研究[D];昆明理工大學;2012年
7 任磊;推薦系統(tǒng)關鍵技術研究[D];華東師范大學;2012年
8 王立才;上下文感知推薦系統(tǒng)若干關鍵技術研究[D];北京郵電大學;2012年
9 劉青文;基于協(xié)同過濾的推薦算法研究[D];中國科學技術大學;2013年
10 邢星;社交網(wǎng)絡個性化推薦方法研究[D];大連海事大學;2013年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 吳曉婷;基于流形學習的數(shù)據(jù)降維算法的研究[D];遼寧師范大學;2010年
2 邢西峰;基于流形學習的生物數(shù)據(jù)特征提取方法[D];濟南大學;2011年
3 談書才;流形學習算法及其在圖像識別中的應用研究[D];河南科技大學;2009年
4 趙豐富;基于流形學習的雜草種子識別的研究[D];西北農(nóng)林科技大學;2011年
5 李建;聚類融合研究及其應用[D];哈爾濱工程大學;2011年
6 呂世陽;基于C2C電子商務模式下商品推薦系統(tǒng)應用研究[D];東華大學;2012年
7 馬恩穹;基于Web數(shù)據(jù)挖掘的個性化搜索引擎研究[D];南京理工大學;2012年
8 陳燦;電力系統(tǒng)短期負荷預測與動態(tài)無功優(yōu)化技術研究[D];浙江大學;2008年
9 王慶軍;流形學習算法分析及應用研究[D];哈爾濱工程大學;2008年
10 林明文;基于實時交通流檢測的道路交通狀態(tài)判定系統(tǒng)[D];大連理工大學;2009年
【二級參考文獻】
中國期刊全文數(shù)據(jù)庫 前2條
1 李曉光;于戈;王大玲;鮑玉斌;;基于信息論的潛在概念獲取與文本聚類[J];軟件學報;2008年09期
2 許海玲;吳瀟;李曉東;閻保平;;互聯(lián)網(wǎng)推薦系統(tǒng)比較研究[J];軟件學報;2009年02期
【相似文獻】
中國期刊全文數(shù)據(jù)庫 前10條
1 范莉莎;劉剛;劉志鏡;;Web數(shù)據(jù)挖掘在網(wǎng)絡教育中的應用[J];計算機技術與發(fā)展;2006年06期
2 張娥,馮耕中,戰(zhàn)子玉;Web數(shù)據(jù)應用的利器——Web數(shù)據(jù)挖掘[J];情報學報;2002年06期
3 范亞芹,劉穎,李興男;Web數(shù)據(jù)挖掘原理及實現(xiàn)[J];吉林大學學報(信息科學版);2003年04期
4 劉麗;Web數(shù)據(jù)挖掘及其在數(shù)字圖書館中的應用[J];中國信息導報;2003年12期
5 趙紅霞,趙玉梅;Web數(shù)據(jù)挖掘在電子商務中的應用[J];華南金融電腦;2004年11期
6 丁瑾;基于Web數(shù)據(jù)挖掘的綜述[J];科技情報開發(fā)與經(jīng)濟;2004年12期
7 馬保國;侯存軍;王文豐;錢方正;;Web數(shù)據(jù)挖掘技術及應用[J];計算機與數(shù)字工程;2006年06期
8 吳俊;馬良渝;;Web數(shù)據(jù)挖掘在電子商務中的應用研究[J];科技經(jīng)濟市場;2006年11期
9 張瑩;;Web數(shù)據(jù)挖掘在電子商務中的應用[J];商場現(xiàn)代化;2007年01期
10 趙全明;;Web數(shù)據(jù)挖掘探討[J];民營科技;2007年09期
中國重要會議論文全文數(shù)據(jù)庫 前2條
1 易虹;許德剛;;Web數(shù)據(jù)挖掘的研究與應用[A];第一屆全國Web信息系統(tǒng)及其應用會議(WISA2004)論文集[C];2004年
2 吳楊凱;王澤兵;黃杲;馮雁;;Web數(shù)據(jù)挖掘綜述[A];第六屆全國計算機應用聯(lián)合學術會議論文集[C];2002年
中國碩士學位論文全文數(shù)據(jù)庫 前10條
1 任明樞;Web數(shù)據(jù)挖掘及其在電子商務中的應用[D];山東科技大學;2004年
2 張新生;基于Web數(shù)據(jù)挖掘技術構建自適應站點研究[D];西安建筑科技大學;2004年
3 李鳳慧;面向電子商務的Web數(shù)據(jù)挖掘的研究[D];山東科技大學;2004年
4 宋洪芳;Web數(shù)據(jù)挖掘在電子商務中的應用研究[D];山東科技大學;2005年
5 謝中;基于Web數(shù)據(jù)挖掘商務網(wǎng)站推薦系統(tǒng)的研究[D];西南師范大學;2002年
6 史豪斌;基于Web數(shù)據(jù)挖掘的信息智能過濾技術研究[D];西北工業(yè)大學;2004年
7 邊小勇;面向電子商務的Web數(shù)據(jù)挖掘技術的研究[D];武漢科技大學;2005年
8 鄭東飛;基于XML的Web數(shù)據(jù)挖掘技術研究與實現(xiàn)[D];山東大學;2005年
9 劉妮娜;Web數(shù)據(jù)挖掘和個性化搜索引擎研究[D];浙江大學;2005年
10 莊玲盈;Web數(shù)據(jù)挖掘在個性化自適應網(wǎng)站中的應用[D];重慶大學;2006年
,本文編號:1116198
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/1116198.html