天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

基于Spark的Top-k對(duì)比序列模式挖掘

發(fā)布時(shí)間:2021-11-12 23:56
  對(duì)比序列模式(distinguishing sequential pattern,DSP)指在目標(biāo)類序列集合中頻繁出現(xiàn),而在非目標(biāo)類序列集合中不頻繁出現(xiàn)的序列.對(duì)比序列模式能夠描述2個(gè)序列集合間的差異,有著廣泛的應(yīng)用,例如:構(gòu)建序列分類器,識(shí)別DNA序列的生物特征,特定人群行為分析.與挖掘滿足支持度閾值要求的對(duì)比序列模式相比,挖掘?qū)Ρ榷萾op-k對(duì)比序列模式能避免用戶設(shè)置不恰當(dāng)?shù)闹С侄乳撝?因而,更易于用戶使用.但是現(xiàn)有的top-k對(duì)比序列模式挖掘算法難以處理大規(guī)模序列數(shù)據(jù).對(duì)此,設(shè)計(jì)了一種基于Spark的top-k對(duì)比序列模式并行挖掘算法,稱為SP-kDSP-Miner.此外,為了提高SP-kDSPMiner的效率,針對(duì)Spark結(jié)構(gòu)的特點(diǎn),設(shè)計(jì)了候選模式生成策略和若干剪枝策略,以及候選模式對(duì)比度的并行計(jì)算方法.通過在真實(shí)數(shù)據(jù)集與合成數(shù)據(jù)集上的實(shí)驗(yàn),驗(yàn)證了SP-kDSP-Miner的有效性、執(zhí)行效率和可擴(kuò)展性. 

【文章來源】:計(jì)算機(jī)研究與發(fā)展. 2017,54(07)北大核心EICSCD

【文章頁數(shù)】:13 頁

【部分圖文】:

基于Spark的Top-k對(duì)比序列模式挖掘


圖2集合枚舉樹示例Fig.2Anexampleofasetenumerationtree

對(duì)比度,計(jì)算過程,序列模式


列模式集合Cl生成長度為l+1的候選對(duì)比序列模式集合Cl+1.步驟②利用剪枝策略2,移除不可能成為top-k對(duì)比序列模式的候選模式.步驟③~⑦生成長度為l+1的候選對(duì)比序列模式.步驟⑧返回利用算法1生成的候選對(duì)比序列模式集合.算法1的算法復(fù)雜度為O(|Cl|),其中|Cl|是長度為l的候選對(duì)比序列模式的個(gè)數(shù).Fig.3ContrastcalculationprocessinSP-kDSP-Miner圖3SP-kDSP-Miner中對(duì)比度計(jì)算過程3.2對(duì)比度并行計(jì)算SP-kDSP-Miner使用Spark分布式框架將大規(guī)模數(shù)據(jù)分片并讀入計(jì)算節(jié)點(diǎn),然后各計(jì)算結(jié)點(diǎn)獲。保矗担窂堸i等:基于Spark的Top-k對(duì)比序列模式挖掘

執(zhí)行時(shí)間,執(zhí)行效率,算法


Miner的執(zhí)行效率,本文使用kDSP-Miner進(jìn)行對(duì)比.與kDSP-Miner一樣,SP-kDSP-Miner需要設(shè)定的參數(shù)為γ與k.圖4~5展示了參數(shù)對(duì)SP-kDSP-Miner算法的影響.因?yàn)椋耄模樱校停椋睿澹蛩惴y以適用于大規(guī)模序列數(shù)據(jù)集,所以只對(duì)ABC-2與Actin兩個(gè)序列集進(jìn)行了實(shí)驗(yàn).進(jìn)行此實(shí)驗(yàn)時(shí),SP-kDSP-Miner算法用到Spark集群的4個(gè)節(jié)點(diǎn),kDSP-Miner所用線程數(shù)為5.圖4展示了當(dāng)設(shè)置k=10時(shí),間隔約束γ對(duì)算法執(zhí)行效率的影響,并與kDSP-Miner進(jìn)行了比較.隨著間隔約束的范圍增大,候選元素之間有效的組合變多,kDSP-Miner與SP-kDSP-Miner運(yùn)行時(shí)間都會(huì)隨之增加.相較于kDSP-Miner,SP-kDSP-Miner變化趨勢(shì)緩慢一些.因?yàn)殚g隔約束的范圍比較小,候選模式少,Spark集群計(jì)算能力沒有被充分利用.并且SP-kDSP-Miner在計(jì)算對(duì)比度過程中,設(shè)計(jì)了減枝策略3,降低了計(jì)算量.總體來說,對(duì)于任意的間隔約束γ,具有集群優(yōu)勢(shì)的SP-kDSP-Miner執(zhí)行時(shí)間較kDSP-Miner更短,并且隨著間隔約束γ的范圍變大,SP-kDSP-Miner所用集群的計(jì)算能力被充分利用,執(zhí)行效率會(huì)有一定程度提高.圖5展示了當(dāng)設(shè)置γ=[0,2]時(shí)k值對(duì)算法執(zhí)行效率的影響,并與kDSP-Miner進(jìn)行了比較.隨著k值增大,SP-kDSP-Miner與kDSP-Miner執(zhí)行時(shí)間

【參考文獻(xiàn)】:
期刊論文
[1]帶間隔約束的Top-k對(duì)比序列模式挖掘[J]. 楊皓,段磊,胡斌,鄧松,王文韜,秦攀.  軟件學(xué)報(bào). 2015(11)
[2]FSMBUS:一種基于Spark的大規(guī)模頻繁子圖挖掘算法[J]. 嚴(yán)玉良,董一鴻,何賢芒,汪衛(wèi).  計(jì)算機(jī)研究與發(fā)展. 2015(08)



本文編號(hào):3491893

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3491893.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶45806***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com
欧美成人免费一级特黄| 久久亚洲午夜精品毛片| 国产精品午夜小视频观看| 国产精品午夜小视频观看| 国产又粗又猛又爽又黄| 日本特黄特色大片免费观看 | 成人免费观看视频免费| 欧美亚洲三级视频在线观看| 午夜精品一区二区av| 麻豆在线观看一区二区| 成人亚洲国产精品一区不卡 | 国产精品一级香蕉一区| 欧美综合色婷婷欧美激情| 国产一区二区三区av在线| 国产日韩欧美国产欧美日韩| 亚洲第一香蕉视频在线| 国产一区二区不卡在线视频| 国产精品一区二区不卡中文| 日韩一区二区三区18| 91欧美亚洲精品在线观看| 自拍偷拍一区二区三区| 五月激情婷婷丁香六月网| 亚洲黄片在线免费小视频| 国产av一二三区在线观看| 国产综合一区二区三区av| 国产成人精品一区二三区在线观看| 婷婷色香五月综合激激情| 午夜福利直播在线视频| 2019年国产最新视频| 黄片在线观看一区二区三区| 国产丝袜美女诱惑一区二区| 国产一级片内射视频免费播放| 日本高清一道一二三区四五区| 一本色道久久综合狠狠躁| 九九热精彩视频在线播放| 亚洲国产四季欧美一区| 又黄又硬又爽又色的视频| 亚洲国产成人爱av在线播放下载| 国产精品国产亚洲区久久| 久久精品色妇熟妇丰满人妻91| 国产精品十八禁亚洲黄污免费观看|