天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁(yè) > 科技論文 > 搜索引擎論文 >

一種基于頻繁項(xiàng)集的搜索引擎聚類瀏覽算法

發(fā)布時(shí)間:2018-11-09 13:15
【摘要】:搜索引擎的聚類瀏覽技術(shù)可以幫助用戶更好地在搜索引擎返回的結(jié)果中定位自己感興趣的信息。TS-FIC算法通過(guò)加工關(guān)聯(lián)規(guī)則挖掘出來(lái)的頻繁項(xiàng)集作為類標(biāo)簽,形成初始聚類,利用頻繁項(xiàng)集之間的語(yǔ)義關(guān)系,把初始聚類組織成樹結(jié)構(gòu)。在形成最終聚類時(shí),引入語(yǔ)義相似度作為計(jì)算類相似度的一個(gè)考量方面,最后利用一種新的排序方案把最終結(jié)果排序顯示給用戶。實(shí)驗(yàn)表明,該算法具有一定可行性,并在效率與聚類精度方面有不錯(cuò)表現(xiàn)。
[Abstract]:The clustering and browsing technology of search engine can help users to locate the information they are interested in better in the results returned by search engines. TS-FIC algorithm uses frequent itemsets mined by processing association rules as cluster labels to form initial clustering. Using the semantic relation between frequent itemsets, the initial clustering is organized into tree structure. When the final clustering is formed, semantic similarity is introduced as an aspect of computing class similarity. Finally, a new sorting scheme is used to display the final results to users. Experiments show that the algorithm is feasible and has good performance in efficiency and clustering accuracy.
【作者單位】: 福州大學(xué)數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院;
【基金】:中科院軟件所開放課題基金資助項(xiàng)目(SYSKF0701) 國(guó)家自然科學(xué)基金資助項(xiàng)目(61070062)
【分類號(hào)】:TP391.1

【共引文獻(xiàn)】

相關(guān)期刊論文 前10條

1 段宏,張桂清,譚運(yùn)猛;一種基于Web挖掘的信息自動(dòng)分類系統(tǒng)[J];華中科技大學(xué)學(xué)報(bào)(自然科學(xué)版);2003年07期

2 王勛,劉君強(qiáng),魏貴義;智能學(xué)習(xí)中的知識(shí)表示和知識(shí)聚類[J];計(jì)算機(jī)工程與應(yīng)用;2003年07期

3 朱克斌,唐菁,楊炳儒;Web文本挖掘系統(tǒng)及聚類分析算法[J];計(jì)算機(jī)工程;2004年13期

4 梅馨,邢桂芬;文本挖掘技術(shù)綜述[J];江蘇大學(xué)學(xué)報(bào)(自然科學(xué)版);2003年05期

5 錢鐵云,王元珍,馮小年;結(jié)合類頻率的關(guān)聯(lián)中文文本分類[J];中文信息學(xué)報(bào);2004年06期

6 諶志群;張國(guó)煊;;文本挖掘與中文文本挖掘模型研究[J];情報(bào)科學(xué);2007年07期

7 王勛,劉君強(qiáng);基于文檔聚類的Web輔助瀏覽研究[J];情報(bào)學(xué)報(bào);2004年02期

8 王楠;基于聚類的全文檢索系統(tǒng)后處理[J];情報(bào)雜志;2005年01期

9 王建會(huì),申展,胡運(yùn)發(fā);一種實(shí)用高效的聚類算法[J];軟件學(xué)報(bào);2004年05期

10 王勛,費(fèi)玉蓮,魏貴義;基于智能學(xué)習(xí)的網(wǎng)絡(luò)輔助瀏覽技術(shù)研究[J];計(jì)算機(jī)工程與設(shè)計(jì);2003年02期

相關(guān)會(huì)議論文 前1條

1 曾依靈;許洪波;白碩;;改進(jìn)的OPTICS算法及其在文本聚類中的應(yīng)用[A];第三屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議論文集[C];2007年

相關(guān)博士學(xué)位論文 前8條

1 李學(xué)明;計(jì)算機(jī)數(shù)據(jù)的關(guān)聯(lián)規(guī)則挖掘理論和算法研究[D];重慶大學(xué);2003年

2 溫磊;基于有向項(xiàng)集圖的關(guān)聯(lián)規(guī)則挖掘算法研究與應(yīng)用[D];天津大學(xué);2004年

3 王建會(huì);中文信息處理中若干關(guān)鍵技術(shù)的研究[D];復(fù)旦大學(xué);2004年

4 許增福;DL環(huán)境下的信息資源管理及知識(shí)發(fā)現(xiàn)研究[D];哈爾濱工程大學(xué);2005年

5 趙鵬;復(fù)雜網(wǎng)絡(luò)與互聯(lián)網(wǎng)個(gè)性化信息服務(wù)的研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2006年

6 熊云波;文本信息處理的若干關(guān)鍵技術(shù)研究[D];復(fù)旦大學(xué);2006年

7 王桐;XML內(nèi)容路由關(guān)鍵技術(shù)研究[D];哈爾濱工程大學(xué);2006年

8 錢鐵云;關(guān)聯(lián)文本分類關(guān)鍵技術(shù)研究[D];華中科技大學(xué);2006年

相關(guān)碩士學(xué)位論文 前10條

1 譚義紅;關(guān)聯(lián)規(guī)則挖掘及其在概念檢索中的應(yīng)用研究[D];湖南大學(xué);2003年

2 段曉峰;網(wǎng)站日志的數(shù)據(jù)挖掘[D];重慶大學(xué);2003年

3 余媛芳;面向產(chǎn)品創(chuàng)新設(shè)計(jì)的知識(shí)獲取研究[D];西北工業(yè)大學(xué);2004年

4 徐永紅;基于專題信息服務(wù)的智能搜索引擎技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2004年

5 張全力;面向產(chǎn)品設(shè)計(jì)的中文web文本信息處理研究[D];西北工業(yè)大學(xué);2005年

6 郭國(guó)印;數(shù)據(jù)挖掘技術(shù)的研究及其在PLM中的應(yīng)用[D];西北工業(yè)大學(xué);2005年

7 屈曉健;數(shù)據(jù)倉(cāng)庫(kù)及其挖掘技術(shù)在企業(yè)CRM中的應(yīng)用研究[D];西北工業(yè)大學(xué);2005年

8 蘆立華;基于后綴樹的中文文本聚類算法研究[D];上海海事大學(xué);2005年

9 田衛(wèi)東;保定市防偽稅控系統(tǒng)研究[D];天津大學(xué);2005年

10 張煒瑋;基于Web日志的用戶訪問(wèn)模式挖掘的研究[D];武漢理工大學(xué);2006年

【相似文獻(xiàn)】

相關(guān)期刊論文 前10條

1 謝坤武;陳世強(qiáng);畢曉玲;;關(guān)聯(lián)規(guī)則發(fā)現(xiàn)中的聚類方法[J];計(jì)算機(jī)科學(xué);2007年08期

2 陸如松;閃四清;;基于抽樣策略的關(guān)聯(lián)規(guī)則算法[J];大眾科技;2006年02期

3 王波;王瀚波;;關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘算法淺析[J];科技情報(bào)開發(fā)與經(jīng)濟(jì);2006年19期

4 毛德梅;丁瑞國(guó);;對(duì)數(shù)據(jù)挖掘中關(guān)聯(lián)規(guī)則算法的比較研究[J];皖西學(xué)院學(xué)報(bào);2006年05期

5 張志鋒;鄧璐娟;劉秀梅;;關(guān)聯(lián)規(guī)則算法在郵政商函客戶關(guān)系中的應(yīng)用[J];計(jì)算機(jī)技術(shù)與發(fā)展;2008年12期

6 吳佳佳;;關(guān)聯(lián)規(guī)則算法在高職教學(xué)評(píng)價(jià)中的應(yīng)用[J];信息與電腦(理論版);2010年04期

7 范文建;戴齊;陳明;;基于粗糙集的關(guān)聯(lián)規(guī)則算法的研究[J];福建電腦;2006年04期

8 劉凱;趙躍龍;;關(guān)聯(lián)規(guī)則挖掘在醫(yī);橹械膽(yīng)用研究[J];科技信息(科學(xué)教研);2007年33期

9 曾志勇;;基于星型模型的關(guān)聯(lián)規(guī)則挖掘方法[J];現(xiàn)代計(jì)算機(jī)(專業(yè)版);2007年11期

10 韓開來(lái);柳炳祥;;關(guān)聯(lián)規(guī)則在圖書館新書推薦中的研究[J];科技信息(學(xué)術(shù)研究);2007年34期

相關(guān)會(huì)議論文 前10條

1 劉保政;汪定偉;;基于多因素的相近距離聚類方法研究[A];Proceedings of the 2011 Chinese Control and Decision Conference(CCDC)[C];2011年

2 高冠東;賈克斌;肖珂;;一種新的基于特征點(diǎn)匹配的圖像拼接方法[A];第十三屆全國(guó)圖象圖形學(xué)學(xué)術(shù)會(huì)議論文集[C];2006年

3 樊迪;劉振明;金宏威;張亮仁;張禮和;;基于配體結(jié)合模式的輔酶A結(jié)合蛋白的分類方法研究[A];第十屆全國(guó)計(jì)算(機(jī))化學(xué)學(xué)術(shù)會(huì)議論文摘要集[C];2009年

4 馬垣;張紅云;李曉瑞;劉剛;張小平;馬文勝;;關(guān)系數(shù)據(jù)庫(kù)中基于拓?fù)淇臻g的聚類方法[A];第十八屆全國(guó)數(shù)據(jù)庫(kù)學(xué)術(shù)會(huì)議論文集(研究報(bào)告篇)[C];2001年

5 秦龍;吳義堅(jiān);王仁華;;基于HMM的說(shuō)話人轉(zhuǎn)換中MLLR回歸矩陣綁定方法的研究[A];第八屆全國(guó)人機(jī)語(yǔ)音通訊學(xué)術(shù)會(huì)議論文集[C];2005年

6 謝毓湘;欒悉道;吳玲達(dá);文軍;老松楊;;一種基于聚類的播音員鏡頭探測(cè)方法[A];第一屆建立和諧人機(jī)環(huán)境聯(lián)合學(xué)術(shù)會(huì)議(HHME2005)論文集[C];2005年

7 紀(jì)雅楠;魏愛敏;王爽;;關(guān)聯(lián)規(guī)則算法在學(xué)生成績(jī)分析中的應(yīng)用[A];2010國(guó)際信息技術(shù)與應(yīng)用論壇論文集[C];2010年

8 吳亞晶;狄增如;樊瑛;;基于資源分布矩陣的二分網(wǎng)聚類方法[A];第五屆全國(guó)復(fù)雜網(wǎng)絡(luò)學(xué)術(shù)會(huì)議論文(摘要)匯集[C];2009年

9 趙曉煜;康錦江;;基于客戶價(jià)值的客戶聚類及特征分析方法[A];中國(guó)市場(chǎng)學(xué)會(huì)2006年年會(huì)暨第四次全國(guó)會(huì)員代表大會(huì)論文集[C];2006年

10 朱琳;周水庚;;基于聚類的文本分類屬性加權(quán)[A];第二屆全國(guó)信息檢索與內(nèi)容安全學(xué)術(shù)會(huì)議(NCIRCS-2005)論文集[C];2005年

相關(guān)重要報(bào)紙文章 前5條

1 本刊特稿 陳巖;魯西南村名的文化解讀[N];濟(jì)寧日?qǐng)?bào);2007年

2 李海峰;優(yōu)化無(wú)功管理 實(shí)現(xiàn)電網(wǎng)安全運(yùn)行[N];國(guó)家電網(wǎng)報(bào);2008年

3 王國(guó)定 宋瑞卿 王永亮;山西上市公司綜合實(shí)力誰(shuí)強(qiáng)?[N];山西日?qǐng)?bào);2001年

4 王宇喬;減肥品男性消費(fèi)群不容忽視[N];民營(yíng)經(jīng)濟(jì)報(bào);2005年

5 本報(bào)實(shí)習(xí)生 龐仕影;權(quán)威榜單不能讓數(shù)字牽著走[N];國(guó)際金融報(bào);2004年

相關(guān)博士學(xué)位論文 前10條

1 熊峗;生物序列模式挖掘與聚類研究[D];復(fù)旦大學(xué);2007年

2 郝占剛;基于遺傳算法等技術(shù)的數(shù)據(jù)與文本聚分類研究[D];天津大學(xué);2006年

3 李敏;蛋白質(zhì)網(wǎng)絡(luò)中復(fù)合物和功能模塊挖掘算法研究[D];中南大學(xué);2008年

4 劉建偉;流數(shù)據(jù)查詢系統(tǒng)結(jié)構(gòu)及模式查詢算法的研究[D];東華大學(xué);2005年

5 吳瑞;模糊和粗糙環(huán)境下的網(wǎng)絡(luò)用戶瀏覽模式研究[D];天津大學(xué);2006年

6 殷瑞飛;數(shù)據(jù)挖掘中的聚類方法及其應(yīng)用[D];廈門大學(xué);2008年

7 王昱;考慮特征變量異質(zhì)性的分類方法及其在風(fēng)險(xiǎn)決策中的應(yīng)用研究[D];中國(guó)科學(xué)技術(shù)大學(xué);2009年

8 錢鵬江;大規(guī)模數(shù)據(jù)集聚類方法研究及應(yīng)用[D];江南大學(xué);2011年

9 易高翔;粗糙集在Web挖掘中的應(yīng)用研究[D];華中科技大學(xué);2006年

10 郝曉麗;粒度格矩陣空間模型及其應(yīng)用研究[D];太原理工大學(xué);2009年

相關(guān)碩士學(xué)位論文 前10條

1 盛文峰;面向數(shù)據(jù)挖掘的遺傳算法的研究與應(yīng)用[D];上海交通大學(xué);2007年

2 倪樂(lè)央;基于非參數(shù)方法的我國(guó)城市化水平聚類分析[D];浙江工商大學(xué);2007年

3 李國(guó)宇;基于J2EE的數(shù)據(jù)挖掘系統(tǒng)的構(gòu)建及聚類技術(shù)研究[D];天津大學(xué);2007年

4 吳孫丹;基于聚類的入侵檢測(cè)方法的研究[D];華中科技大學(xué);2007年

5 金燕;多時(shí)間序列數(shù)據(jù)流聚類算法研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2007年

6 步新玉;基于數(shù)據(jù)挖掘的智能入侵檢測(cè)系統(tǒng)研究[D];西安電子科技大學(xué);2009年

7 李敏;基于網(wǎng)格和密度的數(shù)據(jù)流聚類算法研究[D];武漢理工大學(xué);2009年

8 司學(xué)鋒;基于聚類的BP神經(jīng)網(wǎng)絡(luò)在織物染色計(jì)算機(jī)配色中的應(yīng)用研究[D];青島大學(xué);2009年

9 梁敏君;分形聚類分析在證券客戶細(xì)分中的應(yīng)用研究[D];合肥工業(yè)大學(xué);2009年

10 楊俊杰;灰色聚類與灰靶決策的算法研究[D];廈門大學(xué);2009年



本文編號(hào):2320513

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2320513.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶1e756***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com