天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 科技論文 > 軟件論文 >

基于子序列分布變化的對(duì)比序列模式挖掘研究

發(fā)布時(shí)間:2021-08-04 20:31
  對(duì)比序列模式挖掘是數(shù)據(jù)挖掘中的一項(xiàng)重要研究任務(wù),旨在發(fā)現(xiàn)不同類別的序列數(shù)據(jù)之間的差異。如何從序列數(shù)據(jù)中高效地挖掘有意義且易于分析的模式是當(dāng)前研究需要解決的一大難題。目前研究人員已經(jīng)設(shè)計(jì)了許多關(guān)于對(duì)比序列模式挖掘的算法,然而大多數(shù)算法都是基于出現(xiàn)次數(shù)或支持度框架,忽略了子序列的分布對(duì)模式的影響。雖然已有算法在顯露序列模式挖掘中考慮了子序列的位置信息,但是該算法使用固定位置來識(shí)別不同子序列在不同類別的序列數(shù)據(jù)中的分布差異,即,子序列模式在一類序列數(shù)據(jù)集中頻繁出現(xiàn)在給定區(qū)分位置之前,而在另一類序列數(shù)據(jù)集中頻繁出現(xiàn)在該給定位置之后。在沒有足夠先驗(yàn)知識(shí)的情況下,用戶很難設(shè)置恰當(dāng)?shù)奈恢瞄撝?并且不同的子序列其區(qū)分位置可能不同,因此,設(shè)置固定位置閾值可能會(huì)忽略許多有意義的模式?紤]到大量序列數(shù)據(jù)包含時(shí)間標(biāo)簽,在分析序列數(shù)據(jù)時(shí)其時(shí)間屬性也是不可忽略的一個(gè)要素,設(shè)計(jì)一種能夠自動(dòng)分析事件時(shí)間分布差異的算法將有助于決策者做出正確的決策。此外,隨著大量生物數(shù)據(jù)的產(chǎn)生,研究能夠自動(dòng)地分析不同類別的生物序列差異的方法是亟待解決的難題。然而,之前以對(duì)比序列模式挖掘?yàn)橹行牡南嚓P(guān)研究均未考慮基因/氨基酸的空間位置分布對(duì)... 

【文章來源】:湖南大學(xué)湖南省 211工程院校 985工程院校 教育部直屬院校

【文章頁數(shù)】:67 頁

【學(xué)位級(jí)別】:碩士

【文章目錄】:
摘要
Abstract
第1章 緒論
    1.1 研究背景及研究意義
    1.2 國內(nèi)外研究現(xiàn)狀
        1.2.1 序列模式及其局限性
        1.2.2 序列模式在生物中的應(yīng)用研究現(xiàn)狀
        1.2.3 對(duì)比序列模式研究現(xiàn)狀
    1.3 主要研究內(nèi)容
    1.4 本文組織結(jié)構(gòu)
第2章 相關(guān)理論基礎(chǔ)
    2.1 序列模式挖掘基本概念
    2.2 典型的序列模式挖掘方法
        2.2.1 基于廣度優(yōu)先搜索的方法
        2.2.2 基于深度優(yōu)先搜索的方法
        2.2.3 基于模式增長的方法
    2.3 對(duì)比序列模式挖掘方法
        2.3.1 基于集合枚舉樹的方法
        2.3.2 基于基因表達(dá)編程的方法
        2.3.3 基于樹型結(jié)構(gòu)的方法
        2.3.4 剪枝策略
        2.3.5 特征選擇
    2.4 本章小結(jié)
第3章 基于時(shí)間分布的模式挖掘算法
    3.1 引言
    3.2 問題定義
    3.3 基于時(shí)間分布的模式挖掘算法
        3.3.1 算法思想
        3.3.2 TDCSP-tree的構(gòu)建
        3.3.3 對(duì)比序列模式STDV-CSP挖掘算法
        3.3.4 時(shí)間復(fù)雜度分析
    3.4 實(shí)驗(yàn)結(jié)果與分析
        3.4.1 實(shí)驗(yàn)方案
        3.4.2 參數(shù)對(duì)模式數(shù)量的影響
        3.4.3 參數(shù)對(duì)運(yùn)行時(shí)間的影響
        3.4.4 有效性分析
        3.4.5 分類準(zhǔn)確率
        3.4.6 可伸縮性分析
        3.4.7 內(nèi)存使用情況
    3.5 本章小結(jié)
第4章 基于空間位置分布的模式挖掘算法
    4.1 引言
    4.2 問題定義
    4.3 基于空間位置分布的模式挖掘算法
        4.3.1 算法思想
        4.3.2 SLD-tree的構(gòu)建
        4.3.3 對(duì)比序列模式SLD-CSP挖掘算法
        4.3.4 時(shí)間復(fù)雜度分析
    4.4 實(shí)驗(yàn)結(jié)果與分析
        4.4.1 實(shí)驗(yàn)方案
        4.4.2 有效性分析
        4.4.3 分類性能
        4.4.4 參數(shù)對(duì)模式數(shù)量的影響
        4.4.5 參數(shù)對(duì)分類性能的影響
        4.4.6 參數(shù)對(duì)運(yùn)行時(shí)間的影響
        4.4.7 可伸縮性分析
    4.5 本章小結(jié)
結(jié)論
參考文獻(xiàn)
附錄A 發(fā)表論文和參加科研情況說明
致謝


【參考文獻(xiàn)】:
期刊論文
[1]去冗余Top-k對(duì)比序列模式挖掘[J]. 江冰,谷飛洋,何增有.  智能系統(tǒng)學(xué)報(bào). 2018(05)
[2]基于Spark的Top-k對(duì)比序列模式挖掘[J]. 張鵬,段磊,秦攀,左劼,唐常杰,元昌安,彭艦.  計(jì)算機(jī)研究與發(fā)展. 2017(07)
[3]基于位置信息的顯露序列模式挖掘研究[J]. 陳湘濤,肖碧文.  計(jì)算機(jī)科學(xué). 2017(07)
[4]基于時(shí)序數(shù)據(jù)的top-k時(shí)間區(qū)間對(duì)比序列模式挖掘算法[J]. 晏力.  現(xiàn)代計(jì)算機(jī)(專業(yè)版). 2017(09)
[5]免預(yù)設(shè)間隔約束的對(duì)比序列模式高效挖掘[J]. 王慧鋒,段磊,左劼,王文韜,李鐘麒,唐常杰.  計(jì)算機(jī)學(xué)報(bào). 2016(10)
[6]帶間隔約束的Top-k對(duì)比序列模式挖掘[J]. 楊皓,段磊,胡斌,鄧松,王文韜,秦攀.  軟件學(xué)報(bào). 2015(11)
[7]帶有間隔約束的多序列模式挖掘[J]. 王華東,楊杰,李亞娟.  計(jì)算機(jī)應(yīng)用. 2014(09)



本文編號(hào):3322358

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/3322358.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶62ea5***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com