基于實(shí)驗(yàn)的分類挖掘若干問(wèn)題研究
發(fā)布時(shí)間:2023-05-06 22:05
分類是數(shù)據(jù)挖掘領(lǐng)域研究的重點(diǎn)內(nèi)容之一。分類挖掘的主要目標(biāo)是在已知類別的樣本集中訓(xùn)練出一個(gè)具有較強(qiáng)泛化能力的模型,以便對(duì)新數(shù)據(jù)能有一個(gè)準(zhǔn)確的預(yù)測(cè)。目前,雖然研究者們?yōu)榱颂岣哳A(yù)測(cè)準(zhǔn)確度已經(jīng)做了大量研究,并取得了一系列成果,但仍存在很多問(wèn)題值得深入研究與探討。本文主要對(duì)分類數(shù)據(jù)的特征選擇、分類算法的比較分析以及分類算法的集成等方面的相關(guān)問(wèn)題進(jìn)行了探索研究,并對(duì)研究結(jié)果進(jìn)行了實(shí)驗(yàn)驗(yàn)證。論文首先探討了分類數(shù)據(jù)的特征選擇問(wèn)題。針對(duì)mRMR特征選擇算法對(duì)所有數(shù)據(jù)集的特征評(píng)價(jià)標(biāo)準(zhǔn)固定,而忽略了不同數(shù)據(jù)集的冗余性與相關(guān)性不同的問(wèn)題,提出了一種改進(jìn)的mRMR算法。該算法通過(guò)加入權(quán)重因子,調(diào)節(jié)不同數(shù)據(jù)集評(píng)價(jià)標(biāo)準(zhǔn)中最大相關(guān)性D與最小冗余性R的比例,從而更好擬合不同數(shù)據(jù)集的特性,并運(yùn)用UCI數(shù)據(jù)集進(jìn)行了實(shí)驗(yàn)分析,實(shí)驗(yàn)結(jié)果驗(yàn)證了該方法的有效性。然后,針對(duì)分類算法種類多,人們面對(duì)實(shí)際問(wèn)題不知道如何確定算法的問(wèn)題,對(duì)其中的9種典型分類算法,從數(shù)據(jù)集類別數(shù)這一分類性能影響因素入手,運(yùn)用實(shí)驗(yàn)方法分析了其在解決二分類問(wèn)題與多分類問(wèn)題時(shí)的性能差異。在對(duì)比實(shí)驗(yàn)中,論文針對(duì)這兩方面的問(wèn)題,從UCI數(shù)據(jù)集中各選出17個(gè)數(shù)據(jù)集,在對(duì)...
【文章頁(yè)數(shù)】:94 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
1 緒論
1.1 研究背景與意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀及文獻(xiàn)綜述
1.2.1 分類數(shù)據(jù)特征選擇方案的研究現(xiàn)狀
1.2.2 分類算法比較分析研究現(xiàn)狀
1.2.3 分類算法集成方法研究現(xiàn)狀
1.2.4 研究評(píng)述
1.3 研究?jī)?nèi)容及技術(shù)路線
1.3.1 研究?jī)?nèi)容
1.3.2 研究方法
1.3.3 技術(shù)路線
1.4 本章小結(jié)
2 相關(guān)理論概述
2.1 分類挖掘的概念與過(guò)程
2.2 分類性能評(píng)估準(zhǔn)則與方法
2.2.1 評(píng)價(jià)準(zhǔn)則
2.2.2 性能評(píng)估方法
2.3 集成學(xué)習(xí)理論
2.3.1 集成學(xué)習(xí)的基本概念
2.3.2 集成學(xué)習(xí)的作用
2.3.3 集成學(xué)習(xí)的過(guò)程
2.3.4 集成學(xué)習(xí)的主要算法
2.4 粒子群算法
2.5 本章小結(jié)
3 對(duì)特征選擇算法MRMR的改進(jìn)研究
3.1 特征選擇算法MRMR的功能特點(diǎn)及描述
3.1.1 特征選擇算法mRMR的功能
3.1.2 特征選擇算法mRMR描述
3.2 對(duì)MRMR算法的改進(jìn)思路及方案
3.2.1 對(duì)mRMR算法改進(jìn)的必要性
3.2.2 對(duì)mRMR算法的改進(jìn)方案
3.3 改進(jìn)MRMR特征選擇算法的實(shí)驗(yàn)驗(yàn)證
3.3.1 實(shí)驗(yàn)環(huán)境與實(shí)驗(yàn)數(shù)據(jù)
3.3.2 實(shí)驗(yàn)過(guò)程設(shè)計(jì)
3.3.3 實(shí)驗(yàn)參數(shù)設(shè)置
3.3.4 實(shí)驗(yàn)與結(jié)果分析
3.4 本章小結(jié)
4 典型分類算法的實(shí)驗(yàn)對(duì)比分析
4.1 參與對(duì)比的分類算法選擇
4.2 實(shí)驗(yàn)環(huán)境構(gòu)建與實(shí)驗(yàn)數(shù)據(jù)選擇
4.2.1 實(shí)驗(yàn)環(huán)境
4.2.2 實(shí)驗(yàn)數(shù)據(jù)的選擇
4.2.3 數(shù)據(jù)預(yù)處理
4.3 分類算法參數(shù)的選擇與設(shè)置
4.4 實(shí)驗(yàn)結(jié)果分析
4.4.1 分類精度的比較分析
4.4.2 分類效率的比較分析
4.4.3 可伸縮性的比較分析
4.4.4 魯棒性的比較分析
4.5 本章小結(jié)
5 基于改進(jìn)粒子群算法的分類算法集成研究
5.1 分類算法集成方法比較
5.2 粒子群算法改進(jìn)的背景及策略
5.3 實(shí)驗(yàn)方法分析
5.3.1 改進(jìn)粒子群算法優(yōu)化權(quán)重的過(guò)程
5.3.2 基于改進(jìn)粒子群算法集成分類算法的實(shí)施過(guò)程
5.4 實(shí)驗(yàn)與結(jié)果分析
5.4.1 實(shí)驗(yàn)環(huán)境與實(shí)驗(yàn)數(shù)據(jù)
5.4.2 實(shí)驗(yàn)內(nèi)容設(shè)計(jì)
5.4.3 實(shí)驗(yàn)結(jié)果與分析
5.5 本章小結(jié)
6 結(jié)論與展望
6.1 研究結(jié)論
6.2 研究不足與展望
致謝
參考文獻(xiàn)
附錄 :典型分類算法性能的原始實(shí)驗(yàn)測(cè)試結(jié)果
攻讀碩士學(xué)位期間的主要研究成果及獎(jiǎng)勵(lì)情況
本文編號(hào):3809688
【文章頁(yè)數(shù)】:94 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
abstract
1 緒論
1.1 研究背景與意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀及文獻(xiàn)綜述
1.2.1 分類數(shù)據(jù)特征選擇方案的研究現(xiàn)狀
1.2.2 分類算法比較分析研究現(xiàn)狀
1.2.3 分類算法集成方法研究現(xiàn)狀
1.2.4 研究評(píng)述
1.3 研究?jī)?nèi)容及技術(shù)路線
1.3.1 研究?jī)?nèi)容
1.3.2 研究方法
1.3.3 技術(shù)路線
1.4 本章小結(jié)
2 相關(guān)理論概述
2.1 分類挖掘的概念與過(guò)程
2.2 分類性能評(píng)估準(zhǔn)則與方法
2.2.1 評(píng)價(jià)準(zhǔn)則
2.2.2 性能評(píng)估方法
2.3 集成學(xué)習(xí)理論
2.3.1 集成學(xué)習(xí)的基本概念
2.3.2 集成學(xué)習(xí)的作用
2.3.3 集成學(xué)習(xí)的過(guò)程
2.3.4 集成學(xué)習(xí)的主要算法
2.4 粒子群算法
2.5 本章小結(jié)
3 對(duì)特征選擇算法MRMR的改進(jìn)研究
3.1 特征選擇算法MRMR的功能特點(diǎn)及描述
3.1.1 特征選擇算法mRMR的功能
3.1.2 特征選擇算法mRMR描述
3.2 對(duì)MRMR算法的改進(jìn)思路及方案
3.2.1 對(duì)mRMR算法改進(jìn)的必要性
3.2.2 對(duì)mRMR算法的改進(jìn)方案
3.3 改進(jìn)MRMR特征選擇算法的實(shí)驗(yàn)驗(yàn)證
3.3.1 實(shí)驗(yàn)環(huán)境與實(shí)驗(yàn)數(shù)據(jù)
3.3.2 實(shí)驗(yàn)過(guò)程設(shè)計(jì)
3.3.3 實(shí)驗(yàn)參數(shù)設(shè)置
3.3.4 實(shí)驗(yàn)與結(jié)果分析
3.4 本章小結(jié)
4 典型分類算法的實(shí)驗(yàn)對(duì)比分析
4.1 參與對(duì)比的分類算法選擇
4.2 實(shí)驗(yàn)環(huán)境構(gòu)建與實(shí)驗(yàn)數(shù)據(jù)選擇
4.2.1 實(shí)驗(yàn)環(huán)境
4.2.2 實(shí)驗(yàn)數(shù)據(jù)的選擇
4.2.3 數(shù)據(jù)預(yù)處理
4.3 分類算法參數(shù)的選擇與設(shè)置
4.4 實(shí)驗(yàn)結(jié)果分析
4.4.1 分類精度的比較分析
4.4.2 分類效率的比較分析
4.4.3 可伸縮性的比較分析
4.4.4 魯棒性的比較分析
4.5 本章小結(jié)
5 基于改進(jìn)粒子群算法的分類算法集成研究
5.1 分類算法集成方法比較
5.2 粒子群算法改進(jìn)的背景及策略
5.3 實(shí)驗(yàn)方法分析
5.3.1 改進(jìn)粒子群算法優(yōu)化權(quán)重的過(guò)程
5.3.2 基于改進(jìn)粒子群算法集成分類算法的實(shí)施過(guò)程
5.4 實(shí)驗(yàn)與結(jié)果分析
5.4.1 實(shí)驗(yàn)環(huán)境與實(shí)驗(yàn)數(shù)據(jù)
5.4.2 實(shí)驗(yàn)內(nèi)容設(shè)計(jì)
5.4.3 實(shí)驗(yàn)結(jié)果與分析
5.5 本章小結(jié)
6 結(jié)論與展望
6.1 研究結(jié)論
6.2 研究不足與展望
致謝
參考文獻(xiàn)
附錄 :典型分類算法性能的原始實(shí)驗(yàn)測(cè)試結(jié)果
攻讀碩士學(xué)位期間的主要研究成果及獎(jiǎng)勵(lì)情況
本文編號(hào):3809688
本文鏈接:http://sikaile.net/guanlilunwen/lindaojc/3809688.html
最近更新
教材專著