關(guān)聯(lián)分類的改進(jìn)及多標(biāo)簽分類的特征選擇研究
發(fā)布時(shí)間:2023-04-05 20:47
分類問(wèn)題是機(jī)器學(xué)習(xí)領(lǐng)域的一個(gè)重要研究方向,它通過(guò)學(xué)習(xí)數(shù)據(jù)發(fā)現(xiàn)其中的規(guī)律來(lái)構(gòu)建一個(gè)分類模型,該模型將用于預(yù)測(cè)待分類數(shù)據(jù)的類別。傳統(tǒng)意義上的分類多指單標(biāo)簽分類,即每個(gè)待分類樣本被分類器指定唯一的標(biāo)簽作為類標(biāo)簽,根據(jù)數(shù)據(jù)集的特性,又分為平衡數(shù)據(jù)和不平衡數(shù)據(jù)。準(zhǔn)確率是評(píng)價(jià)算法性能好壞的一個(gè)重要指標(biāo),算法的準(zhǔn)確率越高代表算法的分類性能越好。關(guān)聯(lián)分類算法是一種挖掘關(guān)聯(lián)規(guī)則用于分類的算法,具有規(guī)則多、分類精度較高的優(yōu)點(diǎn)。然而關(guān)聯(lián)分類算法雖然產(chǎn)生的規(guī)則多,但是其中高質(zhì)量的規(guī)則少,尤其是針對(duì)不平衡數(shù)據(jù)難以有效地提取高質(zhì)量地小類規(guī)則,不能很好的兼顧整體準(zhǔn)確率和小類分類性能。此外,現(xiàn)實(shí)中許多數(shù)據(jù)往往具有不止一個(gè)標(biāo)簽,這類數(shù)據(jù)被稱為多標(biāo)簽數(shù)據(jù),多標(biāo)簽數(shù)據(jù)的分類的就是要為每一個(gè)樣本盡可能地標(biāo)注出所有與其相關(guān)的標(biāo)簽,但是多標(biāo)簽數(shù)據(jù)往往數(shù)據(jù)量龐大且維數(shù)眾多,難以直接進(jìn)行有效進(jìn)行學(xué)習(xí)。因此需要對(duì)數(shù)據(jù)集進(jìn)行降維。傳統(tǒng)的一些特征選擇算法對(duì)部分標(biāo)簽沒(méi)有保留足夠的重要特征,導(dǎo)致分類算法難以有效對(duì)特征選擇后的數(shù)據(jù)集進(jìn)行學(xué)習(xí)。本文針對(duì)以上問(wèn)題在算法層面上做了以下三個(gè)研究。首先,針對(duì)傳統(tǒng)的關(guān)聯(lián)分類算法產(chǎn)生的冗余規(guī)則較多,而高質(zhì)量規(guī)...
【文章頁(yè)數(shù)】:61 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 課題的研究背景及意義
1.2 關(guān)聯(lián)分類的研究現(xiàn)狀
1.3 多標(biāo)簽特征選擇的國(guó)內(nèi)外研究現(xiàn)狀
1.4 論文主要研究?jī)?nèi)容與組織結(jié)構(gòu)
第2章 基于多次學(xué)習(xí)和關(guān)聯(lián)度的關(guān)聯(lián)分類改進(jìn)算法
2.1 關(guān)聯(lián)分類的不足
2.2 基于多次學(xué)習(xí)和關(guān)聯(lián)度的關(guān)聯(lián)分類算法IAMC
2.2.1 相關(guān)的標(biāo)記及定義
2.2.2 IAMC算法分類器構(gòu)建
2.3 實(shí)驗(yàn)設(shè)計(jì)與結(jié)果
2.4 本章小結(jié)
第3章 基于各類支持度閾值獨(dú)立挖掘的關(guān)聯(lián)改進(jìn)算法
3.1 改進(jìn)的關(guān)聯(lián)分類算法ACCS
3.1.1 相關(guān)定義
3.1.2 ACCS算法的規(guī)則挖掘
3.1.3 規(guī)則排序、剪枝與新實(shí)例預(yù)測(cè)
3.1.4 算法的偽代碼及流程圖
3.2 實(shí)驗(yàn)設(shè)計(jì)與結(jié)果
3.3 本章小結(jié)
第4章 基于標(biāo)簽重要性的多標(biāo)簽特征選擇算法
4.1 多標(biāo)簽特征選擇算法研究
4.2 改進(jìn)的基于標(biāo)簽重要性的多標(biāo)簽的特征選擇算法MILR
4.3 實(shí)驗(yàn)設(shè)計(jì)與結(jié)果
4.4 本章小結(jié)
第5章 論文的總結(jié)和展望
5.1 論文總結(jié)
5.2 今后工作展望
參考文獻(xiàn)
致謝
攻讀碩士學(xué)位期間承擔(dān)的科研任務(wù)與主要成果
本文編號(hào):3784103
【文章頁(yè)數(shù)】:61 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
第1章 緒論
1.1 課題的研究背景及意義
1.2 關(guān)聯(lián)分類的研究現(xiàn)狀
1.3 多標(biāo)簽特征選擇的國(guó)內(nèi)外研究現(xiàn)狀
1.4 論文主要研究?jī)?nèi)容與組織結(jié)構(gòu)
第2章 基于多次學(xué)習(xí)和關(guān)聯(lián)度的關(guān)聯(lián)分類改進(jìn)算法
2.1 關(guān)聯(lián)分類的不足
2.2 基于多次學(xué)習(xí)和關(guān)聯(lián)度的關(guān)聯(lián)分類算法IAMC
2.2.1 相關(guān)的標(biāo)記及定義
2.2.2 IAMC算法分類器構(gòu)建
2.3 實(shí)驗(yàn)設(shè)計(jì)與結(jié)果
2.4 本章小結(jié)
第3章 基于各類支持度閾值獨(dú)立挖掘的關(guān)聯(lián)改進(jìn)算法
3.1 改進(jìn)的關(guān)聯(lián)分類算法ACCS
3.1.1 相關(guān)定義
3.1.2 ACCS算法的規(guī)則挖掘
3.1.3 規(guī)則排序、剪枝與新實(shí)例預(yù)測(cè)
3.1.4 算法的偽代碼及流程圖
3.2 實(shí)驗(yàn)設(shè)計(jì)與結(jié)果
3.3 本章小結(jié)
第4章 基于標(biāo)簽重要性的多標(biāo)簽特征選擇算法
4.1 多標(biāo)簽特征選擇算法研究
4.2 改進(jìn)的基于標(biāo)簽重要性的多標(biāo)簽的特征選擇算法MILR
4.3 實(shí)驗(yàn)設(shè)計(jì)與結(jié)果
4.4 本章小結(jié)
第5章 論文的總結(jié)和展望
5.1 論文總結(jié)
5.2 今后工作展望
參考文獻(xiàn)
致謝
攻讀碩士學(xué)位期間承擔(dān)的科研任務(wù)與主要成果
本文編號(hào):3784103
本文鏈接:http://sikaile.net/kejilunwen/zidonghuakongzhilunwen/3784103.html
最近更新
教材專著