天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 搜索引擎論文 >

基于高平均效用的模式挖掘算法研究

發(fā)布時間:2020-03-21 00:04
【摘要】:數(shù)據(jù)挖掘的主要目標是從不同類型的數(shù)據(jù)集中挖掘出重要的,有意義的,具有潛在價值的信息。頻繁項集和關聯(lián)規(guī)則挖掘是模式挖掘中經(jīng)典的課題之一,其主要考慮項集的頻繁度并對得到的項集進行關聯(lián)分析。頻繁項集挖掘僅考慮項集在數(shù)據(jù)集中出現(xiàn)的頻繁度,沒有涉及其他維度的信息。為發(fā)現(xiàn)更多有意義的模式,例如高利潤的商品組合,通過綜合考慮項集的數(shù)量和利潤,高效用項集挖掘被提出用于挖掘出具有高效用的項集。高效用項集挖掘的缺點在于其沒有考慮項集的長度,容易挖掘出無效的長模式,其中組成長模式的項的效用非常低。因此,通過綜合考慮效用和長度,高平均效用項集挖掘被提出,在高平均效用的概念框架下,本文主要解決目前存在的三個問題。針對現(xiàn)有算法在挖掘增量式數(shù)據(jù)集時效率低下問題,本文提出了一個基于HAUP-tree樹模式的算法。該算法在內(nèi)存中維護一個特殊的樹結構,用于保存歷史數(shù)據(jù)集的必要信息。每當有新數(shù)據(jù)插入時,算法只需要對新增數(shù)據(jù)進行遍歷獲取必要信息,然后基于設計的快速更新策略,更新內(nèi)存中的樹結構,并執(zhí)行挖掘算法。相比現(xiàn)有算法,該算法僅需要很少次數(shù)的數(shù)據(jù)集遍歷就能達到和現(xiàn)有算法一樣的挖掘效果。由于現(xiàn)有算法采用的上限模型過于寬松,因此本文提出了一個更加高效的算法,該算法通過設計的二個新上限模型和基于該模型的剪枝策略,減小了搜索空間,提升了項集挖掘的效率。新的上限模型從理論上保證了新算法的搜索空間小于采用舊上限模型的算法。由于現(xiàn)有算法都是在設置單一閾值的情況下挖掘項集,忽略了數(shù)據(jù)集中不同項的特點,容易導致稀有項解問題,即設置過大的閾值容易漏掉有意義的項集,而設置過小則又易挖掘出許多無意義的項集。針對該問題,本文提出了基于多閾值的高平均效用項集算法,該算法能夠克服現(xiàn)有算法低效的弱點,通過設計的排序搜索樹保證上限模型的向下封閉性,并基于優(yōu)化的平均效用表結構設計剪枝策略,減小搜索空間,避免現(xiàn)有算法頻繁掃描數(shù)據(jù)庫的缺點。本文針對性的解決了高平均效用項集中的三個基本問題,并設計和運行大量實驗驗證了本文所提出算法的有效性,其均能克服現(xiàn)有算法的缺點,達到更高效更節(jié)省內(nèi)存的目標。
【學位授予單位】:哈爾濱工業(yè)大學
【學位級別】:碩士
【學位授予年份】:2018
【分類號】:TP311.13

【相似文獻】

相關期刊論文 前10條

1 徐涵;黃衛(wèi)東;劉國祥;張歆;劉帥;吳群紅;徐岳;;成本-效用分析中效用值的測量方法[J];中國衛(wèi)生經(jīng)濟;2016年01期

2 徐喜卿;王珉;李順平;陳鋼;;乳腺癌患者健康效用值測量研究[J];中國衛(wèi)生經(jīng)濟;2016年03期

3 伍紅艷;孫利華;;時間權衡法在測量健康狀態(tài)效用值中的應用及問題探討[J];中國藥房;2012年44期

4 王倬彥;一種確定效用值的隸屬函數(shù)[J];系統(tǒng)工程理論與實踐;1988年03期

5 高振峰;劉喜更;;效用值決策法在分析品種區(qū)域結果中的應用[J];河北農(nóng)業(yè)大學學報;1988年04期

6 付希婧;梁敏洪;孫茂;高鵬;孔彩;朱文濤;;映射法在健康效用值測量中的應用研究[J];中國衛(wèi)生經(jīng)濟;2014年10期

7 周挺;馬愛霞;;不同時間權衡法在健康效用值研究中的應用[J];中國衛(wèi)生經(jīng)濟;2017年01期

8 孫園園;余正;李洪超;;健康效用值測量中的映射法及其相關模型概述[J];中國藥房;2017年29期

9 伍紅艷;孫利華;;歐洲五維健康量表效用值積分體系構建方法及結果的國際比較[J];中國新藥雜志;2012年06期

10 邢文榮,邵元福,張純,陳盛新;健康效用值及其測量方法的選擇[J];藥物流行病學雜志;1999年04期

相關會議論文 前3條

1 楊東升;苗永強;;改進模糊Borda法在風險分析過程中應用研究[A];2012年中國航空學會管理科學分會學術交流會論文集[C];2012年

2 張培培;韓明亮;;旅客運輸綜合交通網(wǎng)絡運能分配優(yōu)化[A];中國企業(yè)運籌學第十屆學術年會論文集[C];2015年

3 張雨;李漢文;;政府采購多目標風險型概率決策[A];第二屆全國大學生政府采購論壇論文集[C];2014年

相關重要報紙文章 前6條

1 華高萊斯國際地產(chǎn)顧問(北京)有限公司;地產(chǎn)行業(yè)的深度調研[N];中國房地產(chǎn)報;2004年

2 廖聯(lián)明 黃靜;QALY脫穎而出[N];醫(yī)藥經(jīng)濟報;2018年

3 馮剛耀;藥品怎能不看市場的臉色?[N];醫(yī)藥經(jīng)濟報;2003年

4 記者 劉小微;環(huán)境風險管理“利器”效用值得期待[N];金融時報;2013年

5 劉秀羅 劉寶宏;數(shù)字化真實世界[N];計算機世界;2001年

6 哈爾濱工業(yè)大學 董雪艷 王鐵男 趙超;合理利用企業(yè)資源的效用度量和匹配測度模型促進龍江經(jīng)濟可持續(xù)發(fā)展[N];哈爾濱日報;2017年

相關博士學位論文 前4條

1 伍紅艷;健康效用值測量研究[D];沈陽藥科大學;2012年

2 吳春眉;EQ-5D效用值中國積分體系應用于中國人群的可適性研究[D];華中科技大學;2017年

3 楊君;支持敏捷服務優(yōu)化的綠色云計算關鍵技術研究[D];南京大學;2017年

4 周歡;機會移動網(wǎng)絡中的數(shù)據(jù)傳輸機制研究[D];浙江大學;2014年

相關碩士學位論文 前10條

1 任師鋒;基于高平均效用的模式挖掘算法研究[D];哈爾濱工業(yè)大學;2018年

2 管娟中;基于時間權衡法的安徽省農(nóng)村人群健康效用值測量研究[D];安徽醫(yī)科大學;2018年

3 劉利;成本效用分析中效用值測量方法的應用研究[D];北京中醫(yī)藥大學;2012年

4 徐喜卿;乳腺癌患者不同健康效用值測量方式的比較研究[D];山東大學;2015年

5 付希婧;映射法在健康效用值測量中的應用研究[D];北京中醫(yī)藥大學;2015年

6 呂存?zhèn)?面向效用的模式挖掘算法研究[D];浙江工業(yè)大學;2017年

7 徐斌;中國上市公司財務指標評估體系研究[D];清華大學;2005年

8 Geoffrey Eustace Mtui;面向最優(yōu)效用的機器學習隱私模型[D];哈爾濱工業(yè)大學;2017年

9 叢建輝;品牌、價格與綠色認證:食用油消費影響因素的聯(lián)合分析[D];山東師范大學;2011年

10 李霆;基于不確定數(shù)據(jù)的高平均效用序列模式挖掘算法的研究[D];哈爾濱工業(yè)大學;2016年

,

本文編號:2592408

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/sousuoyinqinglunwen/2592408.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權申明:資料由用戶b7d65***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com