天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

基于決策樹(shù)的單調(diào)分類算法研究

發(fā)布時(shí)間:2017-06-01 22:07

  本文關(guān)鍵詞:基于決策樹(shù)的單調(diào)分類算法研究,由筆耕文化傳播整理發(fā)布。


【摘要】:決策樹(shù)算法是應(yīng)用最廣泛的歸納學(xué)習(xí)算法之一,是一種逼近離散值目標(biāo)函數(shù)的方法,它自頂向下運(yùn)用遞歸方式,構(gòu)造一棵揭示數(shù)據(jù)內(nèi)部關(guān)系的樹(shù),進(jìn)而得出決策規(guī)則。單調(diào)分類是一種重要的分類任務(wù),在這種任務(wù)中需要考慮條件屬性和決策之間的單調(diào)性約束:當(dāng)一個(gè)對(duì)象的所有條件屬性上的取值都不比另一個(gè)對(duì)象差時(shí),它的決策也不會(huì)比另一個(gè)對(duì)象的決策差。Hu等人提出基于有序信息熵的決策樹(shù)算法REMT,該算法用于單調(diào)分類問(wèn)題,只要訓(xùn)練數(shù)據(jù)是單調(diào)的,就能生成單調(diào)一致的決策樹(shù),即使數(shù)據(jù)中包含噪聲,也能夠獲得較好的結(jié)果。為了得到精度和分類效率更高的分類器,本文在REMT算法的基礎(chǔ)上,研究了基于決策樹(shù)的單調(diào)分類算法,主要工作如下:(1)在決策樹(shù)算法中引入了前向有序互信息和后向有序互信息,討論了它們?cè)诓煌肼暤燃?jí)下的變化情況,提出用前向和后向有序互信息分別構(gòu)造前向和后向有序決策樹(shù)的決策樹(shù)生成算法,并利用規(guī)則精度將兩者集結(jié)構(gòu)造了分類器。在人造數(shù)據(jù)集和真實(shí)數(shù)據(jù)集中分別進(jìn)行了實(shí)驗(yàn),實(shí)驗(yàn)證明該算法不但保證了單調(diào)分類問(wèn)題上決策規(guī)則的單調(diào)一致性,還提高了分類器的分類精度,并通過(guò)適當(dāng)放寬決策樹(shù)的終止條件,減少了決策樹(shù)的深度以及分類規(guī)則的長(zhǎng)度,避免了決策樹(shù)的過(guò)度擬合。(2)借鑒決策森林的思想,提出了基于決策森林的單調(diào)分類算法,算法中引入了重采樣技術(shù),對(duì)訓(xùn)練集進(jìn)行重采樣獲得多個(gè)訓(xùn)練子集,從不同的角度構(gòu)造決策森林中的每棵決策樹(shù),得到了既有一定的相似性,又能較大程度的覆蓋原始訓(xùn)練集中數(shù)據(jù)對(duì)象的多棵決策樹(shù)。在人造數(shù)據(jù)集和真實(shí)數(shù)據(jù)集中分別進(jìn)行了實(shí)驗(yàn),實(shí)驗(yàn)證明由于決策森林減小了訓(xùn)練子集的規(guī)模,因而縮短了分類器的分類規(guī)則,避免了過(guò)度擬合,也可以用于數(shù)據(jù)集稍大的情況。本文中構(gòu)造多個(gè)有序決策樹(shù)再集結(jié)的算法都能夠在單調(diào)的訓(xùn)練樣本上得到單調(diào)一致的決策樹(shù),相對(duì)于單棵有序決策樹(shù),本文算法不僅提高了分類精度,降低了平均絕對(duì)誤差,還縮短了分類規(guī)則的長(zhǎng)度,提高了分類效率,避免了過(guò)度擬合。
【關(guān)鍵詞】:決策樹(shù) 單調(diào)分類 有序互信息 決策森林
【學(xué)位授予單位】:山西大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2014
【分類號(hào)】:C934
【目錄】:
  • 中文摘要8-9
  • Abstract9-11
  • 第一章 引言11-15
  • 1.1 選題背景及意義11-12
  • 1.2 決策樹(shù)算法研究現(xiàn)狀12
  • 1.3 單調(diào)分類問(wèn)題研究現(xiàn)狀12-14
  • 1.4 論文研究?jī)?nèi)容與組織結(jié)構(gòu)14-15
  • 第二章 單調(diào)分類問(wèn)題相關(guān)基礎(chǔ)15-21
  • 2.1 決策樹(shù)及相關(guān)概念15-16
  • 2.2 單調(diào)分類問(wèn)題16-17
  • 2.3 有序信息熵與有序互信息17-19
  • 2.4 單調(diào)分類算法REMT19-21
  • 第三章 基于雙向有序互信息的單調(diào)分類算法21-35
  • 3.1 雙向有序互信息分析21-22
  • 3.2 基于雙向有序互信息的決策樹(shù)生成及集結(jié)方法22-23
  • 3.3 基于雙向有序互信息的單調(diào)分類算法23-27
  • 3.4 實(shí)驗(yàn)分析27-33
  • 3.5 本章小結(jié)33-35
  • 第四章 基于決策森林的單調(diào)分類算法35-47
  • 4.1 決策森林35-36
  • 4.2 基于決策森林的單調(diào)分類算法36-42
  • 4.2.1 單棵決策樹(shù)的訓(xùn)練集采樣方法36-37
  • 4.2.2 樣本量的確定方法37-40
  • 4.2.3 決策結(jié)果的集結(jié)方法40-42
  • 4.3 實(shí)驗(yàn)分析42-45
  • 4.4 本章小結(jié)45-47
  • 第五章 結(jié)束語(yǔ)47-49
  • 參考文獻(xiàn)49-53
  • 攻讀學(xué)位期間取得的研究成果53-55
  • 致謝55-57
  • 個(gè)人簡(jiǎn)況及聯(lián)系方式57-61

【參考文獻(xiàn)】

中國(guó)期刊全文數(shù)據(jù)庫(kù) 前1條

1 許行;梁吉業(yè);王寶麗;;基于雙向有序互信息的單調(diào)分類決策樹(shù)算法[J];南京大學(xué)學(xué)報(bào)(自然科學(xué)版);2013年05期


  本文關(guān)鍵詞:基于決策樹(shù)的單調(diào)分類算法研究,,由筆耕文化傳播整理發(fā)布。



本文編號(hào):413573

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/guanlilunwen/tongjijuecelunwen/413573.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶ba27e***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請(qǐng)E-mail郵箱bigeng88@qq.com