天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當前位置:主頁 > 科技論文 > 軟件論文 >

基于子序列分布變化的對比序列模式挖掘研究

發(fā)布時間:2021-08-04 20:31
  對比序列模式挖掘是數(shù)據(jù)挖掘中的一項重要研究任務,旨在發(fā)現(xiàn)不同類別的序列數(shù)據(jù)之間的差異。如何從序列數(shù)據(jù)中高效地挖掘有意義且易于分析的模式是當前研究需要解決的一大難題。目前研究人員已經設計了許多關于對比序列模式挖掘的算法,然而大多數(shù)算法都是基于出現(xiàn)次數(shù)或支持度框架,忽略了子序列的分布對模式的影響。雖然已有算法在顯露序列模式挖掘中考慮了子序列的位置信息,但是該算法使用固定位置來識別不同子序列在不同類別的序列數(shù)據(jù)中的分布差異,即,子序列模式在一類序列數(shù)據(jù)集中頻繁出現(xiàn)在給定區(qū)分位置之前,而在另一類序列數(shù)據(jù)集中頻繁出現(xiàn)在該給定位置之后。在沒有足夠先驗知識的情況下,用戶很難設置恰當?shù)奈恢瞄撝?并且不同的子序列其區(qū)分位置可能不同,因此,設置固定位置閾值可能會忽略許多有意義的模式?紤]到大量序列數(shù)據(jù)包含時間標簽,在分析序列數(shù)據(jù)時其時間屬性也是不可忽略的一個要素,設計一種能夠自動分析事件時間分布差異的算法將有助于決策者做出正確的決策。此外,隨著大量生物數(shù)據(jù)的產生,研究能夠自動地分析不同類別的生物序列差異的方法是亟待解決的難題。然而,之前以對比序列模式挖掘為中心的相關研究均未考慮基因/氨基酸的空間位置分布對... 

【文章來源】:湖南大學湖南省 211工程院校 985工程院校 教育部直屬院校

【文章頁數(shù)】:67 頁

【學位級別】:碩士

【文章目錄】:
摘要
Abstract
第1章 緒論
    1.1 研究背景及研究意義
    1.2 國內外研究現(xiàn)狀
        1.2.1 序列模式及其局限性
        1.2.2 序列模式在生物中的應用研究現(xiàn)狀
        1.2.3 對比序列模式研究現(xiàn)狀
    1.3 主要研究內容
    1.4 本文組織結構
第2章 相關理論基礎
    2.1 序列模式挖掘基本概念
    2.2 典型的序列模式挖掘方法
        2.2.1 基于廣度優(yōu)先搜索的方法
        2.2.2 基于深度優(yōu)先搜索的方法
        2.2.3 基于模式增長的方法
    2.3 對比序列模式挖掘方法
        2.3.1 基于集合枚舉樹的方法
        2.3.2 基于基因表達編程的方法
        2.3.3 基于樹型結構的方法
        2.3.4 剪枝策略
        2.3.5 特征選擇
    2.4 本章小結
第3章 基于時間分布的模式挖掘算法
    3.1 引言
    3.2 問題定義
    3.3 基于時間分布的模式挖掘算法
        3.3.1 算法思想
        3.3.2 TDCSP-tree的構建
        3.3.3 對比序列模式STDV-CSP挖掘算法
        3.3.4 時間復雜度分析
    3.4 實驗結果與分析
        3.4.1 實驗方案
        3.4.2 參數(shù)對模式數(shù)量的影響
        3.4.3 參數(shù)對運行時間的影響
        3.4.4 有效性分析
        3.4.5 分類準確率
        3.4.6 可伸縮性分析
        3.4.7 內存使用情況
    3.5 本章小結
第4章 基于空間位置分布的模式挖掘算法
    4.1 引言
    4.2 問題定義
    4.3 基于空間位置分布的模式挖掘算法
        4.3.1 算法思想
        4.3.2 SLD-tree的構建
        4.3.3 對比序列模式SLD-CSP挖掘算法
        4.3.4 時間復雜度分析
    4.4 實驗結果與分析
        4.4.1 實驗方案
        4.4.2 有效性分析
        4.4.3 分類性能
        4.4.4 參數(shù)對模式數(shù)量的影響
        4.4.5 參數(shù)對分類性能的影響
        4.4.6 參數(shù)對運行時間的影響
        4.4.7 可伸縮性分析
    4.5 本章小結
結論
參考文獻
附錄A 發(fā)表論文和參加科研情況說明
致謝


【參考文獻】:
期刊論文
[1]去冗余Top-k對比序列模式挖掘[J]. 江冰,谷飛洋,何增有.  智能系統(tǒng)學報. 2018(05)
[2]基于Spark的Top-k對比序列模式挖掘[J]. 張鵬,段磊,秦攀,左劼,唐常杰,元昌安,彭艦.  計算機研究與發(fā)展. 2017(07)
[3]基于位置信息的顯露序列模式挖掘研究[J]. 陳湘濤,肖碧文.  計算機科學. 2017(07)
[4]基于時序數(shù)據(jù)的top-k時間區(qū)間對比序列模式挖掘算法[J]. 晏力.  現(xiàn)代計算機(專業(yè)版). 2017(09)
[5]免預設間隔約束的對比序列模式高效挖掘[J]. 王慧鋒,段磊,左劼,王文韜,李鐘麒,唐常杰.  計算機學報. 2016(10)
[6]帶間隔約束的Top-k對比序列模式挖掘[J]. 楊皓,段磊,胡斌,鄧松,王文韜,秦攀.  軟件學報. 2015(11)
[7]帶有間隔約束的多序列模式挖掘[J]. 王華東,楊杰,李亞娟.  計算機應用. 2014(09)



本文編號:3322358

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3322358.html


Copyright(c)文論論文網All Rights Reserved | 網站地圖 |

版權申明:資料由用戶62ea5***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com