流數(shù)據(jù)概念漂移及演化的檢測方法研究
發(fā)布時間:2024-04-27 05:16
隨著信息采集和數(shù)據(jù)處理技術(shù)的深入推進,流數(shù)據(jù)已成為數(shù)據(jù)挖掘領域的一種重要存在形式,其最大的特點就是帶有時間標記,因此也稱作時間序列數(shù)據(jù)。由于流數(shù)據(jù)的動態(tài)多變特性,其所蘊含的概念分布會隨著時間或環(huán)境變化而發(fā)生改變,如:數(shù)據(jù)源的分布變化可能導致隱含的概念知識與原始數(shù)據(jù)不同,即發(fā)生概念漂移;數(shù)據(jù)源產(chǎn)生機制變化可能導致數(shù)據(jù)中有新的模式類別出現(xiàn),即發(fā)生概念演化。針對非穩(wěn)態(tài)環(huán)境下流數(shù)據(jù)存在的不同概念變化問題,設計有效的流數(shù)據(jù)概念漂移及演化檢測方法,有助于深入研究概念漂移及演化的本質(zhì)特征,對于流數(shù)據(jù)的深入分析挖掘具有重要意義。本文針對概念漂移及概念演化的檢測問題開展研究,具體研究內(nèi)容包括兩個方面:(1)針對流數(shù)據(jù)中同時存在的由樣本分布穩(wěn)定變化引起的真實概念漂移和由樣本噪聲及隨機波動引起的偽概念漂移,提出一種基于在線性能測試的真?zhèn)胃拍钇茩z測方法。該方法主要包括通過監(jiān)測分類性能捕獲有效波動位點、通過分組交叉測試提取一致波動位點和通過漂移位點的后續(xù)參考位點進行真?zhèn)涡耘卸ㄈ齻核心模塊。該方法采用分組交叉測試對流數(shù)據(jù)的測試性能分布波動進行分析,消除了流數(shù)據(jù)中存在的正常隨機波動導致的偽概念漂移對真實概念漂移檢...
【文章頁數(shù)】:70 頁
【學位級別】:碩士
【文章目錄】:
中文摘要
Abstract
第一章 引言
1.1 研究背景
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 概念漂移研究現(xiàn)狀
1.2.2 概念演化研究現(xiàn)狀
1.3 論文主要工作
第二章 背景知識
2.1 概念漂移
2.1.1 概念漂移定義
2.1.2 概念漂移檢測
2.2 概念演化
2.2.1 概念演化定義
2.2.2 概念演化檢測
2.3 本章小結(jié)
第三章 基于在線性能測試的真?zhèn)胃拍钇茩z測
3.1 真?zhèn)胃拍钇泼枋雠c分析
3.2 基于在線性能測試的真?zhèn)胃拍钇茩z測方法
3.2.1 有效波動位點檢測
3.2.2 一致波動位點提取
3.2.3 概念漂移位點判定
3.2.4 基于在線性能測試的真?zhèn)胃拍钇茩z測算法
3.3 實驗與結(jié)果分析
3.3.1 數(shù)據(jù)描述與實驗設置
3.3.2 概念漂移檢測評測指標
3.3.3 實驗結(jié)果及分析
3.4 本章小結(jié)
第四章 基于完全隨機森林的概念演化檢測
4.1 隨機森林模型
4.2 基于完全隨機森林的概念演化檢測
4.2.1 異常樣本檢測
4.2.2 新類樣本標記
4.2.3 在線異常檢測更新
4.3 實驗與結(jié)果分析
4.3.1 數(shù)據(jù)描述與實驗設置
4.3.2 概念演化評測指標
4.3.3 實驗結(jié)果及分析
4.4 本章小結(jié)
第五章 結(jié)論及展望
參考文獻
研究成果
致謝
個人簡況及聯(lián)系方式
本文編號:3965409
【文章頁數(shù)】:70 頁
【學位級別】:碩士
【文章目錄】:
中文摘要
Abstract
第一章 引言
1.1 研究背景
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 概念漂移研究現(xiàn)狀
1.2.2 概念演化研究現(xiàn)狀
1.3 論文主要工作
第二章 背景知識
2.1 概念漂移
2.1.1 概念漂移定義
2.1.2 概念漂移檢測
2.2 概念演化
2.2.1 概念演化定義
2.2.2 概念演化檢測
2.3 本章小結(jié)
第三章 基于在線性能測試的真?zhèn)胃拍钇茩z測
3.1 真?zhèn)胃拍钇泼枋雠c分析
3.2 基于在線性能測試的真?zhèn)胃拍钇茩z測方法
3.2.1 有效波動位點檢測
3.2.2 一致波動位點提取
3.2.3 概念漂移位點判定
3.2.4 基于在線性能測試的真?zhèn)胃拍钇茩z測算法
3.3 實驗與結(jié)果分析
3.3.1 數(shù)據(jù)描述與實驗設置
3.3.2 概念漂移檢測評測指標
3.3.3 實驗結(jié)果及分析
3.4 本章小結(jié)
第四章 基于完全隨機森林的概念演化檢測
4.1 隨機森林模型
4.2 基于完全隨機森林的概念演化檢測
4.2.1 異常樣本檢測
4.2.2 新類樣本標記
4.2.3 在線異常檢測更新
4.3 實驗與結(jié)果分析
4.3.1 數(shù)據(jù)描述與實驗設置
4.3.2 概念演化評測指標
4.3.3 實驗結(jié)果及分析
4.4 本章小結(jié)
第五章 結(jié)論及展望
參考文獻
研究成果
致謝
個人簡況及聯(lián)系方式
本文編號:3965409
本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/3965409.html
最近更新
教材專著