天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 碩博論文 > 信息類碩士論文 >

基于決策樹算法的研發(fā)項(xiàng)目管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)

發(fā)布時(shí)間:2021-11-02 02:32
  隨著大數(shù)據(jù)時(shí)代的到來,數(shù)據(jù)挖掘技術(shù)被應(yīng)用到各個(gè)領(lǐng)域中。尤其是現(xiàn)代企業(yè)管理中,利用數(shù)據(jù)挖掘技術(shù)分析企業(yè)大數(shù)據(jù)潛在信息,并基于此建立良好的項(xiàng)目管理制度以及績效考核評價(jià)體系,提高企業(yè)的經(jīng)濟(jì)效益,幫助企業(yè)在復(fù)雜的市場環(huán)境下生存和發(fā)展。本文以數(shù)據(jù)挖掘技術(shù)中的決策樹算法為技術(shù)核心,通過實(shí)現(xiàn)項(xiàng)目以及員工管理模塊,生成績效考核數(shù)據(jù)集,進(jìn)而生成決策樹,根據(jù)對決策樹的評價(jià)與分析,幫助員工提升自己及管理人員實(shí)施管理。此外,基于績效考核成績以及項(xiàng)目管理信息對企業(yè)的成本進(jìn)行分析,生成多維度的成本分析報(bào)表,幫助管理層更加清晰的了解公司運(yùn)營狀況。綜合以上功能設(shè)計(jì),編程實(shí)現(xiàn)了一款軟件研發(fā)項(xiàng)目的管理系統(tǒng)。決策樹算法是數(shù)據(jù)挖掘技術(shù)中常用的分類算法,其結(jié)果通常以if-then的規(guī)則形式進(jìn)行表達(dá)。其中C4.5算法是決策樹算法中的一種,具有易于理解且準(zhǔn)確率高的優(yōu)點(diǎn),與其前身ID3算法相比較,增加了信息增益率的概念。經(jīng)過理論分析后,本文選用C4.5算法對績效考核結(jié)果進(jìn)行分析,通過收集數(shù)據(jù)、數(shù)據(jù)預(yù)處理、計(jì)算信息增益率、確定分裂屬性以及后剪枝等步驟,生成用于績效考核的決策樹。進(jìn)而利用測試數(shù)據(jù)集對決策樹進(jìn)行檢驗(yàn),得出決策樹的準(zhǔn)確率在9... 

【文章來源】:北京建筑大學(xué)北京市

【文章頁數(shù)】:71 頁

【學(xué)位級別】:碩士

【部分圖文】:

基于決策樹算法的研發(fā)項(xiàng)目管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)


數(shù)據(jù)挖掘步驟示意圖

分類圖,數(shù)據(jù)挖掘,分類圖,算法


第2章相關(guān)理論和研究方法7視化工具進(jìn)行展示[18]。數(shù)據(jù)挖掘的主要方法有分類、估值、預(yù)測、關(guān)聯(lián)規(guī)則以及聚類,其中分類、估值、預(yù)測屬于有指導(dǎo)的數(shù)據(jù)挖掘,這些方法可以通過數(shù)據(jù)建立一個(gè)可以對特定屬性進(jìn)行描述的模型,關(guān)聯(lián)規(guī)則以及聚類分析屬于無指導(dǎo)的數(shù)據(jù)挖掘,這類方法使用過所有屬性尋找某種關(guān)系。不同的數(shù)據(jù)挖掘方法有著屬于自己的數(shù)據(jù)挖掘算法,例如分類中的決策樹算法、預(yù)測中的回歸分析、聚類中的K-means聚類,具體算法介紹如圖2-2:圖2-2數(shù)據(jù)挖掘算法分類圖Fig.2-2Dataminingalgorithmclassificationgraph本文根據(jù)績效考核的相關(guān)需求,選用分類方法中的決策樹算法作為數(shù)據(jù)挖掘的算法,通過對系統(tǒng)數(shù)據(jù)的分析,得出有關(guān)于績效考核體系的決策樹,幫助管理人員更方便的對員工進(jìn)行考核分析。2.1.2決策樹算法本文所使用的的算法是分類算法中的決策樹算法。在數(shù)據(jù)挖掘[19]的分類算法中,與其他的分類方法相比,決策樹分類方法有著簡單易懂、不用過于專業(yè)的背景知識等優(yōu)點(diǎn)。決策樹生成的結(jié)果通常是以if-then的規(guī)則形式進(jìn)行表達(dá)的,這種方式清晰且簡單,被廣泛應(yīng)用在金融行業(yè)、氣象分析、交通管理等多個(gè)領(lǐng)域中[20]。決策樹是一種樹結(jié)構(gòu),包括根節(jié)點(diǎn)、分支、葉子三部分,根節(jié)點(diǎn)表示樹的一個(gè)屬性,葉子表示分類的標(biāo)記,分支表示輸出的結(jié)果。該方法從根節(jié)點(diǎn)開始循環(huán)反復(fù)遍歷,根據(jù)測試所得出的結(jié)果,將實(shí)例分配到其子節(jié)點(diǎn),每個(gè)子節(jié)點(diǎn)都會(huì)對應(yīng)該特征的一個(gè)取值,通過遞歸的方法,繼續(xù)對實(shí)例進(jìn)行測試與分配,直到到達(dá)葉節(jié)點(diǎn),最后將實(shí)例分到葉節(jié)點(diǎn)的類中。在決策樹中,有樣本數(shù)據(jù)集以及測試數(shù)據(jù)集兩種,樣本數(shù)據(jù)集是一個(gè)數(shù)據(jù)集

流程圖,流程圖,算法,信息增益


第2章相關(guān)理論和研究方法10||||log||||(X)SplitInfo21AXXXXjijj(2-4)接著根據(jù)屬性A的分裂之后的樣本集的信息增益:ain(X(X)H-H(X)A),InfoGA(2-5)屬性A分裂之后的樣本集的信息增益率:)(),(),(XSplitInfoainAXInfoGatioAXGainRA(2-6)在C4.5算法執(zhí)行之后,得到有屬性信息增益率的結(jié)果,選取信息增益率最大的屬性作為當(dāng)前節(jié)點(diǎn)的分裂屬性[31]。其他屬性將會(huì)繼續(xù)進(jìn)行遞歸計(jì)算。隨著屬性逐漸的計(jì)算,信息增益率將會(huì)變得越來越小,選擇相對較大的信息增益率的屬性作為分類屬性。直到最終決策樹的生成。C4.5的具體流程圖如下圖2-3:圖2-3C4.5算法流程圖


本文編號:3471163

資料下載
論文發(fā)表

本文鏈接:http://sikaile.net/shoufeilunwen/xixikjs/3471163.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶2dfaf***提供,本站僅收錄摘要或目錄,作者需要?jiǎng)h除請E-mail郵箱bigeng88@qq.com