天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 搜索引擎論文 >

基于頻繁詞義序列的檢索結(jié)果聚類算法研究

發(fā)布時間:2017-07-15 22:25

  本文關(guān)鍵詞:基于頻繁詞義序列的檢索結(jié)果聚類算法研究


  更多相關(guān)文章: 聚類算法 頻繁項 信息檢索 Word Net


【摘要】:目前大多搜索引擎結(jié)果聚類算法針對用戶查詢生成的網(wǎng)頁摘要進行聚類,由于網(wǎng)頁摘要較短且質(zhì)量良莠不齊,聚類效果難以保證。提出了一種基于頻繁詞義序列的檢索結(jié)果聚類算法,利用Word Net結(jié)合句法和語義特征對搜索結(jié)果構(gòu)建聚類及標(biāo)簽。不像傳統(tǒng)的基于向量空間模型的聚類算法,考慮了詞語在文檔中的序列模式。算法首先對文本進行預(yù)處理,生成壓縮文檔以降低文本數(shù)據(jù)維度,構(gòu)建廣義后綴樹,挖掘出最大頻繁項集,然后獲取頻繁詞義序列。從文檔中獲取的有序頻繁項集可以更好地反映文檔的主題,把相同主題的搜索結(jié)果聚類在一起,與用戶查詢相關(guān)度高的優(yōu)先排序。實驗表明,該算法可以獲得與查詢相關(guān)的高質(zhì)量聚類及基于語義的聚類標(biāo)簽,具有更高的聚類準(zhǔn)確度和更高的運行效率,并且可擴展性良好。
【作者單位】: 中科院新疆理化技術(shù)研究所多語種信息技術(shù)研究室;
【關(guān)鍵詞】聚類算法 頻繁項 信息檢索 Word Net
【基金】:中國科學(xué)院戰(zhàn)略先導(dǎo)專項(No.XDA06030400) 新疆維吾爾族自治區(qū)“十二五”重大專項(No.201230118) 中科院西部之光項目(No.YB201304)
【分類號】:TP391.3
【正文快照】: 1引言隨著網(wǎng)絡(luò)信息的爆炸式增長,搜索引擎日益成為信息時代不可或缺的工具。現(xiàn)在大部分通用的搜索引擎將與用戶查詢相關(guān)的網(wǎng)頁按照其與用戶查詢的相關(guān)度進行排序,返回給用戶一個列表形式的網(wǎng)頁查詢結(jié)果,用戶需要對每個網(wǎng)頁逐一判斷是否滿足自己的要求。研究[1]表明大多數(shù)用戶

【參考文獻】

中國期刊全文數(shù)據(jù)庫 前1條

1 何波;閆河;;分布式數(shù)據(jù)庫全局最大頻繁項集增量更新算法[J];四川大學(xué)學(xué)報(工程科學(xué)版);2012年03期

【共引文獻】

中國期刊全文數(shù)據(jù)庫 前2條

1 朱清香;于欣;劉晶;劉彥凱;尹佳;;基于加權(quán)關(guān)聯(lián)增量更新模型的設(shè)備故障診斷研究[J];燕山大學(xué)學(xué)報;2014年04期

2 徐紅艷;陳鋒;張森林;馮勇;;一種存在全局站點的分布式增量挖掘算法[J];遼寧大學(xué)學(xué)報(自然科學(xué)版);2013年01期

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前1條

1 陳鋒;分布式流行病數(shù)據(jù)增量挖掘方法研究[D];遼寧大學(xué);2013年

【二級參考文獻】

中國期刊全文數(shù)據(jù)庫 前8條

1 宋余慶,朱玉全,孫志揮,楊鶴標(biāo);一種基于頻繁模式樹的約束最大頻繁項目集挖掘及其更新算法[J];計算機研究與發(fā)展;2005年05期

2 王黎明;趙輝;;基于FP樹的全局最大頻繁項集挖掘算法[J];計算機研究與發(fā)展;2007年03期

3 吉根林,楊明,趙斌,孫志揮;基于DDMINER分布式數(shù)據(jù)庫系統(tǒng)中頻繁項目集的更新[J];計算機學(xué)報;2003年10期

4 吉根林,楊明,宋余慶,孫志揮;最大頻繁項目集的快速更新[J];計算機學(xué)報;2005年01期

5 何波;;快速挖掘分布式數(shù)據(jù)庫全局最大頻繁項集[J];控制與決策;2011年08期

6 宋余慶,朱玉全,孫志揮,陳耿;基于FP-Tree的最大頻繁項目集挖掘及更新算法[J];軟件學(xué)報;2003年09期

7 楊明,孫志揮,宋余慶;快速更新全局頻繁項目集[J];軟件學(xué)報;2004年08期

8 陸介平,楊明,孫志揮,鞠時光;快速挖掘全局最大頻繁項目集[J];軟件學(xué)報;2005年04期

【相似文獻】

中國期刊全文數(shù)據(jù)庫 前10條

1 王自強,馮博琴;頻繁項集的簡潔表示方法研究[J];系統(tǒng)工程理論與實踐;2004年07期

2 顏躍進;李舟軍;陳火旺;;頻繁項集挖掘算法[J];計算機科學(xué);2004年03期

3 劉曉玲,李玉忱;一種利用邏輯“與”運算挖掘頻繁項集的算法[J];中國科技信息;2005年15期

4 陳凱 ,馮全源;基于矩陣偽投影策略的頻繁項集挖掘方法[J];微計算機信息;2005年23期

5 阮幼林;李慶華;楊世達;;一種基于事務(wù)樹的快速頻繁項集挖掘與更新算法[J];計算機科學(xué);2005年02期

6 袁鼎榮,李波;頻繁項集挖掘技術(shù)述評[J];廣西民族學(xué)院學(xué)報(自然科學(xué)版);2005年01期

7 馬猛,倪志偉;基于異集產(chǎn)生頻繁項集的研究[J];計算機工程與應(yīng)用;2005年08期

8 陳慧萍;王建東;王煜;;頻繁項集挖掘的研究與進展[J];計算機仿真;2006年04期

9 樊玫;段隆振;陳桂香;黃龍軍;;基于事務(wù)壓縮的頻繁項集挖掘和更新算法[J];南昌大學(xué)學(xué)報(理科版);2006年05期

10 章志明;黃龍軍;余敏;黃明和;;一種動態(tài)的頻繁項集挖掘算法[J];計算機工程;2006年24期

中國重要會議論文全文數(shù)據(jù)庫 前10條

1 欒鸞;李云;盛艷;;多關(guān)系頻繁項集的并行獲取[A];2008年全國開放式分布與并行計算機學(xué)術(shù)會議論文集(下冊)[C];2008年

2 楊曉明;王晨;汪衛(wèi);張守志;施伯樂;;頻繁項集的精簡表達與還原問題研究[A];第二十一屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2004年

3 鄧傳國;;頻繁項集挖掘與學(xué)生素質(zhì)測評應(yīng)用研究[A];2007系統(tǒng)仿真技術(shù)及其應(yīng)用學(xué)術(shù)會議論文集[C];2007年

4 李彤巖;李興明;;基于分布式關(guān)聯(lián)規(guī)則挖掘的告警相關(guān)性研究[A];2007通信理論與技術(shù)新發(fā)展——第十二屆全國青年通信學(xué)術(shù)會議論文集(下冊)[C];2007年

5 王洪利;馮玉強;;頻繁項集挖掘算法Apriori的改進研究[A];全國第九屆企業(yè)信息化與工業(yè)工程學(xué)術(shù)會議論文集[C];2005年

6 陳曉云;李龍杰;馬志新;白伸伸;王磊;;AFP-Miner:一種新高效的頻繁項集挖掘算法[A];2006年全國理論計算機科學(xué)學(xué)術(shù)年會論文集[C];2006年

7 李坤;王永炎;王宏安;;一種基于樂觀裁剪策略的挖掘數(shù)據(jù)流滑動窗口上閉合頻繁項集的算法[A];第二十五屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(二)[C];2008年

8 鄒遠(yuǎn)婭;周皓峰;王晨;汪衛(wèi);施伯樂;;FSC——利用頻繁項集挖掘估算視圖大小[A];第二十一屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(研究報告篇)[C];2004年

9 楊曉雪;衡紅軍;;一種對XML數(shù)據(jù)進行關(guān)聯(lián)規(guī)則挖掘的方法研究[A];第二十二屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2005年

10 謝志軍;陳紅;;EFIM——數(shù)據(jù)流上頻繁項集挖掘的高性能算法[A];第二十三屆中國數(shù)據(jù)庫學(xué)術(shù)會議論文集(技術(shù)報告篇)[C];2006年

中國博士學(xué)位論文全文數(shù)據(jù)庫 前3條

1 溫磊;基于有向項集圖的關(guān)聯(lián)規(guī)則挖掘算法研究與應(yīng)用[D];天津大學(xué);2004年

2 董杰;基于位表的關(guān)聯(lián)規(guī)則挖掘及關(guān)聯(lián)分類研究[D];大連理工大學(xué);2009年

3 賈彩燕;關(guān)聯(lián)規(guī)則挖掘的取樣復(fù)雜性分析[D];中國科學(xué)院研究生院(計算技術(shù)研究所);2004年

中國碩士學(xué)位論文全文數(shù)據(jù)庫 前10條

1 郭靜;最大和最長頻繁項集增量更新研究[D];燕山大學(xué);2010年

2 熊金芬;一種高效頻繁項集挖掘算法的研究[D];哈爾濱工程大學(xué);2006年

3 劉衛(wèi);基于剪枝概念格模型的頻繁項集表示及挖掘研究[D];合肥工業(yè)大學(xué);2007年

4 王洪波;基于矩陣的頻繁項集挖掘算法研究[D];蘭州大學(xué);2007年

5 王春凱;挖掘正相關(guān)的頻繁項集[D];鄭州大學(xué);2007年

6 王春麗;基于頻繁項集的互補替代關(guān)系挖掘算法[D];鄭州大學(xué);2011年

7 李偉民;基于頻繁項集的馬爾可夫網(wǎng)構(gòu)建及其系統(tǒng)設(shè)計與實現(xiàn)[D];云南大學(xué);2012年

8 馮沙沙;基于位表的頻繁項集挖掘算法研究[D];燕山大學(xué);2012年

9 姚曉玲;快速頻繁項集挖掘算法研究[D];湖南大學(xué);2011年

10 宛婉;基于抽樣的云頻繁項集挖掘算法研究[D];合肥工業(yè)大學(xué);2013年



本文編號:546056

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/546056.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶40002***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com