天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 搜索引擎論文 >

一種基于關(guān)聯(lián)規(guī)則挖掘的查詢擴展算法及應(yīng)用研究

發(fā)布時間:2024-04-02 23:29
  在當今這個信息爆炸的時代,信息迷失、信息過量已成為許多人在進行查詢時面對的問題。而隨著互聯(lián)網(wǎng)使用的普及,搜索引擎作為一種查詢工具,已經(jīng)應(yīng)用的越來越廣泛了。但是,目前大部分搜索引擎的技術(shù)是依賴于關(guān)鍵詞進行檢索,因此常常會返回大量無用信息,致使查詢效率低下。因此,如何通過關(guān)聯(lián)規(guī)則挖掘,提高擴展查詢中的查全率和查準率,已經(jīng)成為近年來研究的一大熱點和難點。 關(guān)聯(lián)規(guī)則挖掘是數(shù)據(jù)挖掘中最基本、也是最重要的功能。通過關(guān)聯(lián)規(guī)則挖掘發(fā)現(xiàn)更多的查詢詞,從而提高查詢擴展的效率,是查詢擴展的主要研究方向之一。本文首先對關(guān)聯(lián)規(guī)則、關(guān)聯(lián)規(guī)則挖掘及查詢擴展的相關(guān)基礎(chǔ)理論進行了梳理;然后著重對關(guān)聯(lián)規(guī)則挖掘各個算法進行了深入研究,并對FP-growth算法的性質(zhì)與優(yōu)缺點進行了剖析;在此基礎(chǔ)上,本文設(shè)計了一種基于關(guān)聯(lián)規(guī)則挖掘的查詢擴展算法,新算法對FP-growth中挖掘頻繁模式的方法進行了改進,降低了時間復(fù)雜度,并設(shè)計了一個基于網(wǎng)頁標記信息的查詢擴展模型,將新發(fā)現(xiàn)的關(guān)鍵詞應(yīng)用到查詢擴展中,該模型通過對網(wǎng)頁關(guān)聯(lián)度進行量化表示,從而對擴展得到的結(jié)果集進行篩選。本算法通過實現(xiàn)關(guān)聯(lián)規(guī)則挖掘-擴展查詢的循環(huán),在保證了關(guān)聯(lián)規(guī)則挖掘...

【文章頁數(shù)】:70 頁

【學位級別】:碩士

【部分圖文】:

圖1.1本文的技術(shù)路線

圖1.1本文的技術(shù)路線

圖1.1本文的技術(shù)路線網(wǎng)頁數(shù)量增加,從而導(dǎo)致系統(tǒng)開銷過,并將改進后的挖掘算法應(yīng)用到其中效率。


圖3.1FP-growth算法流程

圖3.1FP-growth算法流程

用函數(shù)Fp-growth(βtree,β);}GROWTH算法的過程的研究,我們可以看出:無論是法都表現(xiàn)出了較強的可伸縮性,同時,由于在算法的之以Apriori為代表的一類算法相比,有了較大程度種數(shù)據(jù)結(jié)構(gòu),它初始的根節(jié)點為null,分枝由各個項頻繁1-項集的項頭....


圖3.3FP-tree的生成3)將事務(wù)數(shù)據(jù)庫中所有的信息成功壓縮到一棵FP樹上之后,下一步即開始對Fp樹的挖掘,具體方法如下:先從頻繁1-項集開始挖掘,首先構(gòu)建其頻繁1-項集的條件模式基

圖3.3FP-tree的生成3)將事務(wù)數(shù)據(jù)庫中所有的信息成功壓縮到一棵FP樹上之后,下一步即開始對Fp樹的挖掘,具體方法如下:先從頻繁1-項集開始挖掘,首先構(gòu)建其頻繁1-項集的條件模式基

樹中重新構(gòu)建一個分枝:<b:1,d:1>。以此類推,當依次掃描完數(shù)據(jù)庫D中的所有事務(wù)之后,F(xiàn)p樹的主體部分也就構(gòu)建完成了。為了在下一步對Fp樹進行遍歷操作時可方便進行,在圖3.2右側(cè)頻繁1-項集L的基礎(chǔ)上,算法針對表中的各個項目,建立了與各項目相對應(yīng)的項頭表(....


圖3.4數(shù)據(jù)庫D的形成

圖3.4數(shù)據(jù)庫D的形成

據(jù)鏈表組V{V1,V2,…},然后,將新事的首項,保存到數(shù)據(jù)鏈表組V中的各個數(shù)數(shù)據(jù)庫的全部信息都保存在數(shù)據(jù)鏈表組Vedbaeebbcdbcbc圖3.5數(shù)據(jù)鏈表組集中各頻繁項的排列順序,進行倒序遍歷示,根據(jù)頻繁1-項集L,首先將頭項為a的數(shù)



本文編號:3946362

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/3946362.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶3746c***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com