天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 軟件論文 >

基于Spark的Top-k對比序列模式挖掘

發(fā)布時間:2021-11-12 23:56
  對比序列模式(distinguishing sequential pattern,DSP)指在目標類序列集合中頻繁出現(xiàn),而在非目標類序列集合中不頻繁出現(xiàn)的序列.對比序列模式能夠描述2個序列集合間的差異,有著廣泛的應用,例如:構(gòu)建序列分類器,識別DNA序列的生物特征,特定人群行為分析.與挖掘滿足支持度閾值要求的對比序列模式相比,挖掘?qū)Ρ榷萾op-k對比序列模式能避免用戶設置不恰當?shù)闹С侄乳撝?因而,更易于用戶使用.但是現(xiàn)有的top-k對比序列模式挖掘算法難以處理大規(guī)模序列數(shù)據(jù).對此,設計了一種基于Spark的top-k對比序列模式并行挖掘算法,稱為SP-kDSP-Miner.此外,為了提高SP-kDSPMiner的效率,針對Spark結(jié)構(gòu)的特點,設計了候選模式生成策略和若干剪枝策略,以及候選模式對比度的并行計算方法.通過在真實數(shù)據(jù)集與合成數(shù)據(jù)集上的實驗,驗證了SP-kDSP-Miner的有效性、執(zhí)行效率和可擴展性. 

【文章來源】:計算機研究與發(fā)展. 2017,54(07)北大核心EICSCD

【文章頁數(shù)】:13 頁

【部分圖文】:

基于Spark的Top-k對比序列模式挖掘


圖2集合枚舉樹示例Fig.2Anexampleofasetenumerationtree

對比度,計算過程,序列模式


列模式集合Cl生成長度為l+1的候選對比序列模式集合Cl+1.步驟②利用剪枝策略2,移除不可能成為top-k對比序列模式的候選模式.步驟③~⑦生成長度為l+1的候選對比序列模式.步驟⑧返回利用算法1生成的候選對比序列模式集合.算法1的算法復雜度為O(|Cl|),其中|Cl|是長度為l的候選對比序列模式的個數(shù).Fig.3ContrastcalculationprocessinSP-kDSP-Miner圖3SP-kDSP-Miner中對比度計算過程3.2對比度并行計算SP-kDSP-Miner使用Spark分布式框架將大規(guī)模數(shù)據(jù)分片并讀入計算節(jié)點,然后各計算結(jié)點獲。保矗担窂堸i等:基于Spark的Top-k對比序列模式挖掘

執(zhí)行時間,執(zhí)行效率,算法


Miner的執(zhí)行效率,本文使用kDSP-Miner進行對比.與kDSP-Miner一樣,SP-kDSP-Miner需要設定的參數(shù)為γ與k.圖4~5展示了參數(shù)對SP-kDSP-Miner算法的影響.因為kDSP-Miner算法難以適用于大規(guī)模序列數(shù)據(jù)集,所以只對ABC-2與Actin兩個序列集進行了實驗.進行此實驗時,SP-kDSP-Miner算法用到Spark集群的4個節(jié)點,kDSP-Miner所用線程數(shù)為5.圖4展示了當設置k=10時,間隔約束γ對算法執(zhí)行效率的影響,并與kDSP-Miner進行了比較.隨著間隔約束的范圍增大,候選元素之間有效的組合變多,kDSP-Miner與SP-kDSP-Miner運行時間都會隨之增加.相較于kDSP-Miner,SP-kDSP-Miner變化趨勢緩慢一些.因為間隔約束的范圍比較小,候選模式少,Spark集群計算能力沒有被充分利用.并且SP-kDSP-Miner在計算對比度過程中,設計了減枝策略3,降低了計算量.總體來說,對于任意的間隔約束γ,具有集群優(yōu)勢的SP-kDSP-Miner執(zhí)行時間較kDSP-Miner更短,并且隨著間隔約束γ的范圍變大,SP-kDSP-Miner所用集群的計算能力被充分利用,執(zhí)行效率會有一定程度提高.圖5展示了當設置γ=[0,2]時k值對算法執(zhí)行效率的影響,并與kDSP-Miner進行了比較.隨著k值增大,SP-kDSP-Miner與kDSP-Miner執(zhí)行時間

【參考文獻】:
期刊論文
[1]帶間隔約束的Top-k對比序列模式挖掘[J]. 楊皓,段磊,胡斌,鄧松,王文韜,秦攀.  軟件學報. 2015(11)
[2]FSMBUS:一種基于Spark的大規(guī)模頻繁子圖挖掘算法[J]. 嚴玉良,董一鴻,何賢芒,汪衛(wèi).  計算機研究與發(fā)展. 2015(08)



本文編號:3491893

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/3491893.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶45806***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com