一種基于頻繁項集的搜索引擎聚類瀏覽算法
[Abstract]:The clustering and browsing technology of search engine can help users to locate the information they are interested in better in the results returned by search engines. TS-FIC algorithm uses frequent itemsets mined by processing association rules as cluster labels to form initial clustering. Using the semantic relation between frequent itemsets, the initial clustering is organized into tree structure. When the final clustering is formed, semantic similarity is introduced as an aspect of computing class similarity. Finally, a new sorting scheme is used to display the final results to users. Experiments show that the algorithm is feasible and has good performance in efficiency and clustering accuracy.
【作者單位】: 福州大學數(shù)學與計算機科學學院;
【基金】:中科院軟件所開放課題基金資助項目(SYSKF0701) 國家自然科學基金資助項目(61070062)
【分類號】:TP391.1
【共引文獻】
相關(guān)期刊論文 前10條
1 段宏,張桂清,譚運猛;一種基于Web挖掘的信息自動分類系統(tǒng)[J];華中科技大學學報(自然科學版);2003年07期
2 王勛,劉君強,魏貴義;智能學習中的知識表示和知識聚類[J];計算機工程與應用;2003年07期
3 朱克斌,唐菁,楊炳儒;Web文本挖掘系統(tǒng)及聚類分析算法[J];計算機工程;2004年13期
4 梅馨,邢桂芬;文本挖掘技術(shù)綜述[J];江蘇大學學報(自然科學版);2003年05期
5 錢鐵云,王元珍,馮小年;結(jié)合類頻率的關(guān)聯(lián)中文文本分類[J];中文信息學報;2004年06期
6 諶志群;張國煊;;文本挖掘與中文文本挖掘模型研究[J];情報科學;2007年07期
7 王勛,劉君強;基于文檔聚類的Web輔助瀏覽研究[J];情報學報;2004年02期
8 王楠;基于聚類的全文檢索系統(tǒng)后處理[J];情報雜志;2005年01期
9 王建會,申展,胡運發(fā);一種實用高效的聚類算法[J];軟件學報;2004年05期
10 王勛,費玉蓮,魏貴義;基于智能學習的網(wǎng)絡(luò)輔助瀏覽技術(shù)研究[J];計算機工程與設(shè)計;2003年02期
相關(guān)會議論文 前1條
1 曾依靈;許洪波;白碩;;改進的OPTICS算法及其在文本聚類中的應用[A];第三屆全國信息檢索與內(nèi)容安全學術(shù)會議論文集[C];2007年
相關(guān)博士學位論文 前8條
1 李學明;計算機數(shù)據(jù)的關(guān)聯(lián)規(guī)則挖掘理論和算法研究[D];重慶大學;2003年
2 溫磊;基于有向項集圖的關(guān)聯(lián)規(guī)則挖掘算法研究與應用[D];天津大學;2004年
3 王建會;中文信息處理中若干關(guān)鍵技術(shù)的研究[D];復旦大學;2004年
4 許增福;DL環(huán)境下的信息資源管理及知識發(fā)現(xiàn)研究[D];哈爾濱工程大學;2005年
5 趙鵬;復雜網(wǎng)絡(luò)與互聯(lián)網(wǎng)個性化信息服務的研究[D];中國科學技術(shù)大學;2006年
6 熊云波;文本信息處理的若干關(guān)鍵技術(shù)研究[D];復旦大學;2006年
7 王桐;XML內(nèi)容路由關(guān)鍵技術(shù)研究[D];哈爾濱工程大學;2006年
8 錢鐵云;關(guān)聯(lián)文本分類關(guān)鍵技術(shù)研究[D];華中科技大學;2006年
相關(guān)碩士學位論文 前10條
1 譚義紅;關(guān)聯(lián)規(guī)則挖掘及其在概念檢索中的應用研究[D];湖南大學;2003年
2 段曉峰;網(wǎng)站日志的數(shù)據(jù)挖掘[D];重慶大學;2003年
3 余媛芳;面向產(chǎn)品創(chuàng)新設(shè)計的知識獲取研究[D];西北工業(yè)大學;2004年
4 徐永紅;基于專題信息服務的智能搜索引擎技術(shù)研究[D];國防科學技術(shù)大學;2004年
5 張全力;面向產(chǎn)品設(shè)計的中文web文本信息處理研究[D];西北工業(yè)大學;2005年
6 郭國印;數(shù)據(jù)挖掘技術(shù)的研究及其在PLM中的應用[D];西北工業(yè)大學;2005年
7 屈曉健;數(shù)據(jù)倉庫及其挖掘技術(shù)在企業(yè)CRM中的應用研究[D];西北工業(yè)大學;2005年
8 蘆立華;基于后綴樹的中文文本聚類算法研究[D];上海海事大學;2005年
9 田衛(wèi)東;保定市防偽稅控系統(tǒng)研究[D];天津大學;2005年
10 張煒瑋;基于Web日志的用戶訪問模式挖掘的研究[D];武漢理工大學;2006年
【相似文獻】
相關(guān)期刊論文 前10條
1 謝坤武;陳世強;畢曉玲;;關(guān)聯(lián)規(guī)則發(fā)現(xiàn)中的聚類方法[J];計算機科學;2007年08期
2 陸如松;閃四清;;基于抽樣策略的關(guān)聯(lián)規(guī)則算法[J];大眾科技;2006年02期
3 王波;王瀚波;;關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘算法淺析[J];科技情報開發(fā)與經(jīng)濟;2006年19期
4 毛德梅;丁瑞國;;對數(shù)據(jù)挖掘中關(guān)聯(lián)規(guī)則算法的比較研究[J];皖西學院學報;2006年05期
5 張志鋒;鄧璐娟;劉秀梅;;關(guān)聯(lián)規(guī)則算法在郵政商函客戶關(guān)系中的應用[J];計算機技術(shù)與發(fā)展;2008年12期
6 吳佳佳;;關(guān)聯(lián)規(guī)則算法在高職教學評價中的應用[J];信息與電腦(理論版);2010年04期
7 范文建;戴齊;陳明;;基于粗糙集的關(guān)聯(lián)規(guī)則算法的研究[J];福建電腦;2006年04期
8 劉凱;趙躍龍;;關(guān)聯(lián)規(guī)則挖掘在醫(yī);橹械膽醚芯縖J];科技信息(科學教研);2007年33期
9 曾志勇;;基于星型模型的關(guān)聯(lián)規(guī)則挖掘方法[J];現(xiàn)代計算機(專業(yè)版);2007年11期
10 韓開來;柳炳祥;;關(guān)聯(lián)規(guī)則在圖書館新書推薦中的研究[J];科技信息(學術(shù)研究);2007年34期
相關(guān)會議論文 前10條
1 劉保政;汪定偉;;基于多因素的相近距離聚類方法研究[A];Proceedings of the 2011 Chinese Control and Decision Conference(CCDC)[C];2011年
2 高冠東;賈克斌;肖珂;;一種新的基于特征點匹配的圖像拼接方法[A];第十三屆全國圖象圖形學學術(shù)會議論文集[C];2006年
3 樊迪;劉振明;金宏威;張亮仁;張禮和;;基于配體結(jié)合模式的輔酶A結(jié)合蛋白的分類方法研究[A];第十屆全國計算(機)化學學術(shù)會議論文摘要集[C];2009年
4 馬垣;張紅云;李曉瑞;劉剛;張小平;馬文勝;;關(guān)系數(shù)據(jù)庫中基于拓撲空間的聚類方法[A];第十八屆全國數(shù)據(jù)庫學術(shù)會議論文集(研究報告篇)[C];2001年
5 秦龍;吳義堅;王仁華;;基于HMM的說話人轉(zhuǎn)換中MLLR回歸矩陣綁定方法的研究[A];第八屆全國人機語音通訊學術(shù)會議論文集[C];2005年
6 謝毓湘;欒悉道;吳玲達;文軍;老松楊;;一種基于聚類的播音員鏡頭探測方法[A];第一屆建立和諧人機環(huán)境聯(lián)合學術(shù)會議(HHME2005)論文集[C];2005年
7 紀雅楠;魏愛敏;王爽;;關(guān)聯(lián)規(guī)則算法在學生成績分析中的應用[A];2010國際信息技術(shù)與應用論壇論文集[C];2010年
8 吳亞晶;狄增如;樊瑛;;基于資源分布矩陣的二分網(wǎng)聚類方法[A];第五屆全國復雜網(wǎng)絡(luò)學術(shù)會議論文(摘要)匯集[C];2009年
9 趙曉煜;康錦江;;基于客戶價值的客戶聚類及特征分析方法[A];中國市場學會2006年年會暨第四次全國會員代表大會論文集[C];2006年
10 朱琳;周水庚;;基于聚類的文本分類屬性加權(quán)[A];第二屆全國信息檢索與內(nèi)容安全學術(shù)會議(NCIRCS-2005)論文集[C];2005年
相關(guān)重要報紙文章 前5條
1 本刊特稿 陳巖;魯西南村名的文化解讀[N];濟寧日報;2007年
2 李海峰;優(yōu)化無功管理 實現(xiàn)電網(wǎng)安全運行[N];國家電網(wǎng)報;2008年
3 王國定 宋瑞卿 王永亮;山西上市公司綜合實力誰強?[N];山西日報;2001年
4 王宇喬;減肥品男性消費群不容忽視[N];民營經(jīng)濟報;2005年
5 本報實習生 龐仕影;權(quán)威榜單不能讓數(shù)字牽著走[N];國際金融報;2004年
相關(guān)博士學位論文 前10條
1 熊峗;生物序列模式挖掘與聚類研究[D];復旦大學;2007年
2 郝占剛;基于遺傳算法等技術(shù)的數(shù)據(jù)與文本聚分類研究[D];天津大學;2006年
3 李敏;蛋白質(zhì)網(wǎng)絡(luò)中復合物和功能模塊挖掘算法研究[D];中南大學;2008年
4 劉建偉;流數(shù)據(jù)查詢系統(tǒng)結(jié)構(gòu)及模式查詢算法的研究[D];東華大學;2005年
5 吳瑞;模糊和粗糙環(huán)境下的網(wǎng)絡(luò)用戶瀏覽模式研究[D];天津大學;2006年
6 殷瑞飛;數(shù)據(jù)挖掘中的聚類方法及其應用[D];廈門大學;2008年
7 王昱;考慮特征變量異質(zhì)性的分類方法及其在風險決策中的應用研究[D];中國科學技術(shù)大學;2009年
8 錢鵬江;大規(guī)模數(shù)據(jù)集聚類方法研究及應用[D];江南大學;2011年
9 易高翔;粗糙集在Web挖掘中的應用研究[D];華中科技大學;2006年
10 郝曉麗;粒度格矩陣空間模型及其應用研究[D];太原理工大學;2009年
相關(guān)碩士學位論文 前10條
1 盛文峰;面向數(shù)據(jù)挖掘的遺傳算法的研究與應用[D];上海交通大學;2007年
2 倪樂央;基于非參數(shù)方法的我國城市化水平聚類分析[D];浙江工商大學;2007年
3 李國宇;基于J2EE的數(shù)據(jù)挖掘系統(tǒng)的構(gòu)建及聚類技術(shù)研究[D];天津大學;2007年
4 吳孫丹;基于聚類的入侵檢測方法的研究[D];華中科技大學;2007年
5 金燕;多時間序列數(shù)據(jù)流聚類算法研究[D];國防科學技術(shù)大學;2007年
6 步新玉;基于數(shù)據(jù)挖掘的智能入侵檢測系統(tǒng)研究[D];西安電子科技大學;2009年
7 李敏;基于網(wǎng)格和密度的數(shù)據(jù)流聚類算法研究[D];武漢理工大學;2009年
8 司學鋒;基于聚類的BP神經(jīng)網(wǎng)絡(luò)在織物染色計算機配色中的應用研究[D];青島大學;2009年
9 梁敏君;分形聚類分析在證券客戶細分中的應用研究[D];合肥工業(yè)大學;2009年
10 楊俊杰;灰色聚類與灰靶決策的算法研究[D];廈門大學;2009年
,本文編號:2320513
本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2320513.html