健康醫(yī)療數(shù)據(jù)隱式關(guān)聯(lián)關(guān)系的發(fā)現(xiàn)與度量
【文章頁數(shù)】:64 頁
【學位級別】:碩士
【部分圖文】:
圖2-1?Apriori算法過程??
2.1.2?Apr?i?or?i?算法??Apriori算法是第一個基于支持度的剪枝策略,以避免候選項目集呈指數(shù)增長??的算法[34]。圖2-1描述了使用Apriori算法對上表中超市購物籃分析的部分后續(xù)??步驟。假設最小支持計數(shù)等于3?(即,支持度=3/5?=?60%)。將最初....
圖3-1示例數(shù)據(jù)集的FP-Tree與HeaderTable??以表3-1中的數(shù)據(jù)為例,設最小支持度minSup=0.4,則PNFP-Growth算法第??
完整頻繁項目集合為{-e,?b,?e,g,-b,?-m,h,?j,m,?-j}。??第二次遍歷數(shù)據(jù)集時,以T001為例,將其按支持度排序并過濾后為{g,h,e,??-b,j,?m},接著講T001按此順序插入到PNFP-Tree中。最終PNFP-Tree如圖3-1??所示。最終頻....
圖3-2不同支持度下的運行時間??26??
Zl?::零等々黃々?今??::??〒〇申4??4??c:?-m?m??圖3-1示例數(shù)據(jù)集的FP-Tree與HeaderTable??以表3-1中的數(shù)據(jù)為例,設最小支持度minSup=0.4,則PNFP-Growth算法第??一次遍歷數(shù)據(jù)庫可得到正相關(guān)的頻繁項目集合及頻繁數(shù)為:{....
圖3-3不同最小支持度下平均每秒產(chǎn)生的頻繁項目集數(shù)量??圖3-3給出了不同最小支持度下FP-Growth算法和PNFP-Growth算法平??均每秒產(chǎn)生頻繁項目集的數(shù)量對比
健康醫(yī)療數(shù)據(jù)隱式關(guān)聯(lián)關(guān)系發(fā)現(xiàn)與度量??不同最小支持度minSup下算法的運行時間對比見圖3-2。從圖中可看出當??最小支持度大于等于0.5時,FP-Growth算法和PNFP-Growth算法的執(zhí)行時間非??常接近;而當最小支持度小于0.5時,二者的執(zhí)行時間隨最小支持度的減小,差....
本文編號:4027275
本文鏈接:http://sikaile.net/yixuelunwen/yiyuanguanlilunwen/4027275.html