基于決策樹(shù)算法的高校就業(yè)數(shù)據(jù)分析
【文章頁(yè)數(shù)】:85 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
圖1.1論文框架
圖1.1論文框架1.4.2研究?jī)?nèi)容本文主要研究以下幾個(gè)問(wèn)題:(1)研究填充屬性空缺值的方法,提出延伸貝葉斯分類(lèi)算法一次性填充多維空缺屬性值的方法;(2)研究決策樹(shù)分類(lèi)算法,提出在屬性選取過(guò)程中考慮進(jìn)一步劃分深層結(jié)點(diǎn),利用具有最大信息增益率的子集炮代替深層結(jié)點(diǎn)的信息增益值,實(shí)....
圖2.1數(shù)據(jù)庫(kù)與數(shù)據(jù)挖掘的關(guān)系
第二章數(shù)據(jù)挖掘和決策樹(shù)概念2.1數(shù)據(jù)挖掘的概念2.1.1數(shù)據(jù)挖掘定義數(shù)據(jù)挖掘源于稱(chēng)數(shù)據(jù)庫(kù)中的知識(shí)發(fā)現(xiàn),數(shù)據(jù)挖掘是目前研究的熱點(diǎn)領(lǐng)域,量的真實(shí)的數(shù)據(jù)、含有噪聲的數(shù)據(jù)、有變數(shù)的數(shù)據(jù)、混合型的數(shù)據(jù)中找出有價(jià)知的、潛在的數(shù)據(jù)之前的聯(lián)系的信息手段。它涉及機(jī)器學(xué)習(xí)、統(tǒng)計(jì)學(xué)、數(shù)據(jù)庫(kù)現(xiàn)等。....
圖2.2數(shù)據(jù)挖掘的一般過(guò)程
圖2.2數(shù)據(jù)挖掘的一般過(guò)程(1)數(shù)據(jù)選擇和采集,該階段的主要任務(wù)是從數(shù)據(jù)庫(kù)或數(shù)據(jù)倉(cāng)庫(kù)中選擇相關(guān)的數(shù)據(jù),建立一個(gè)目標(biāo)數(shù)據(jù)集,該目標(biāo)數(shù)據(jù)集存放的格式需要做處理,使得數(shù)據(jù)挖掘算法能夠直接訪(fǎng)問(wèn)。(2)數(shù)據(jù)的預(yù)處理,該階段的主要是因數(shù)據(jù)的大量性,使得數(shù)據(jù)存在不完整性、不一致性和復(fù)雜性。....
圖2.3數(shù)據(jù)挖掘的分類(lèi)
景德鎮(zhèn)陶瓷大學(xué)碩士學(xué)位論文第二章數(shù)據(jù)挖掘和決策樹(shù)概念聚類(lèi)模式(Clustering)的主要目的,是把數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù),按照數(shù)據(jù)的類(lèi)別、數(shù)據(jù)的相似度、數(shù)據(jù)的差異性歸成多個(gè)類(lèi)。使得同一個(gè)類(lèi)別的數(shù)據(jù)之間相識(shí)度大,不同類(lèi)別之間的數(shù)據(jù)差異性大。聚類(lèi)模式一般采用統(tǒng)計(jì)方法、神經(jīng)網(wǎng)絡(luò)方法等來(lái)實(shí)....
本文編號(hào):3948868
本文鏈接:http://sikaile.net/kejilunwen/ruanjiangongchenglunwen/3948868.html