基于決策樹(shù)算法的研發(fā)項(xiàng)目管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
發(fā)布時(shí)間:2021-11-02 02:32
隨著大數(shù)據(jù)時(shí)代的到來(lái),數(shù)據(jù)挖掘技術(shù)被應(yīng)用到各個(gè)領(lǐng)域中。尤其是現(xiàn)代企業(yè)管理中,利用數(shù)據(jù)挖掘技術(shù)分析企業(yè)大數(shù)據(jù)潛在信息,并基于此建立良好的項(xiàng)目管理制度以及績(jī)效考核評(píng)價(jià)體系,提高企業(yè)的經(jīng)濟(jì)效益,幫助企業(yè)在復(fù)雜的市場(chǎng)環(huán)境下生存和發(fā)展。本文以數(shù)據(jù)挖掘技術(shù)中的決策樹(shù)算法為技術(shù)核心,通過(guò)實(shí)現(xiàn)項(xiàng)目以及員工管理模塊,生成績(jī)效考核數(shù)據(jù)集,進(jìn)而生成決策樹(shù),根據(jù)對(duì)決策樹(shù)的評(píng)價(jià)與分析,幫助員工提升自己及管理人員實(shí)施管理。此外,基于績(jī)效考核成績(jī)以及項(xiàng)目管理信息對(duì)企業(yè)的成本進(jìn)行分析,生成多維度的成本分析報(bào)表,幫助管理層更加清晰的了解公司運(yùn)營(yíng)狀況。綜合以上功能設(shè)計(jì),編程實(shí)現(xiàn)了一款軟件研發(fā)項(xiàng)目的管理系統(tǒng)。決策樹(shù)算法是數(shù)據(jù)挖掘技術(shù)中常用的分類(lèi)算法,其結(jié)果通常以if-then的規(guī)則形式進(jìn)行表達(dá)。其中C4.5算法是決策樹(shù)算法中的一種,具有易于理解且準(zhǔn)確率高的優(yōu)點(diǎn),與其前身ID3算法相比較,增加了信息增益率的概念。經(jīng)過(guò)理論分析后,本文選用C4.5算法對(duì)績(jī)效考核結(jié)果進(jìn)行分析,通過(guò)收集數(shù)據(jù)、數(shù)據(jù)預(yù)處理、計(jì)算信息增益率、確定分裂屬性以及后剪枝等步驟,生成用于績(jī)效考核的決策樹(shù)。進(jìn)而利用測(cè)試數(shù)據(jù)集對(duì)決策樹(shù)進(jìn)行檢驗(yàn),得出決策樹(shù)的準(zhǔn)確率在9...
【文章來(lái)源】:北京建筑大學(xué)北京市
【文章頁(yè)數(shù)】:71 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
數(shù)據(jù)挖掘步驟示意圖
第2章相關(guān)理論和研究方法7視化工具進(jìn)行展示[18]。數(shù)據(jù)挖掘的主要方法有分類(lèi)、估值、預(yù)測(cè)、關(guān)聯(lián)規(guī)則以及聚類(lèi),其中分類(lèi)、估值、預(yù)測(cè)屬于有指導(dǎo)的數(shù)據(jù)挖掘,這些方法可以通過(guò)數(shù)據(jù)建立一個(gè)可以對(duì)特定屬性進(jìn)行描述的模型,關(guān)聯(lián)規(guī)則以及聚類(lèi)分析屬于無(wú)指導(dǎo)的數(shù)據(jù)挖掘,這類(lèi)方法使用過(guò)所有屬性尋找某種關(guān)系。不同的數(shù)據(jù)挖掘方法有著屬于自己的數(shù)據(jù)挖掘算法,例如分類(lèi)中的決策樹(shù)算法、預(yù)測(cè)中的回歸分析、聚類(lèi)中的K-means聚類(lèi),具體算法介紹如圖2-2:圖2-2數(shù)據(jù)挖掘算法分類(lèi)圖Fig.2-2Dataminingalgorithmclassificationgraph本文根據(jù)績(jī)效考核的相關(guān)需求,選用分類(lèi)方法中的決策樹(shù)算法作為數(shù)據(jù)挖掘的算法,通過(guò)對(duì)系統(tǒng)數(shù)據(jù)的分析,得出有關(guān)于績(jī)效考核體系的決策樹(shù),幫助管理人員更方便的對(duì)員工進(jìn)行考核分析。2.1.2決策樹(shù)算法本文所使用的的算法是分類(lèi)算法中的決策樹(shù)算法。在數(shù)據(jù)挖掘[19]的分類(lèi)算法中,與其他的分類(lèi)方法相比,決策樹(shù)分類(lèi)方法有著簡(jiǎn)單易懂、不用過(guò)于專(zhuān)業(yè)的背景知識(shí)等優(yōu)點(diǎn)。決策樹(shù)生成的結(jié)果通常是以if-then的規(guī)則形式進(jìn)行表達(dá)的,這種方式清晰且簡(jiǎn)單,被廣泛應(yīng)用在金融行業(yè)、氣象分析、交通管理等多個(gè)領(lǐng)域中[20]。決策樹(shù)是一種樹(shù)結(jié)構(gòu),包括根節(jié)點(diǎn)、分支、葉子三部分,根節(jié)點(diǎn)表示樹(shù)的一個(gè)屬性,葉子表示分類(lèi)的標(biāo)記,分支表示輸出的結(jié)果。該方法從根節(jié)點(diǎn)開(kāi)始循環(huán)反復(fù)遍歷,根據(jù)測(cè)試所得出的結(jié)果,將實(shí)例分配到其子節(jié)點(diǎn),每個(gè)子節(jié)點(diǎn)都會(huì)對(duì)應(yīng)該特征的一個(gè)取值,通過(guò)遞歸的方法,繼續(xù)對(duì)實(shí)例進(jìn)行測(cè)試與分配,直到到達(dá)葉節(jié)點(diǎn),最后將實(shí)例分到葉節(jié)點(diǎn)的類(lèi)中。在決策樹(shù)中,有樣本數(shù)據(jù)集以及測(cè)試數(shù)據(jù)集兩種,樣本數(shù)據(jù)集是一個(gè)數(shù)據(jù)集
第2章相關(guān)理論和研究方法10||||log||||(X)SplitInfo21AXXXXjijj(2-4)接著根據(jù)屬性A的分裂之后的樣本集的信息增益:ain(X(X)H-H(X)A),InfoGA(2-5)屬性A分裂之后的樣本集的信息增益率:)(),(),(XSplitInfoainAXInfoGatioAXGainRA(2-6)在C4.5算法執(zhí)行之后,得到有屬性信息增益率的結(jié)果,選取信息增益率最大的屬性作為當(dāng)前節(jié)點(diǎn)的分裂屬性[31]。其他屬性將會(huì)繼續(xù)進(jìn)行遞歸計(jì)算。隨著屬性逐漸的計(jì)算,信息增益率將會(huì)變得越來(lái)越小,選擇相對(duì)較大的信息增益率的屬性作為分類(lèi)屬性。直到最終決策樹(shù)的生成。C4.5的具體流程圖如下圖2-3:圖2-3C4.5算法流程圖
本文編號(hào):3471163
【文章來(lái)源】:北京建筑大學(xué)北京市
【文章頁(yè)數(shù)】:71 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
數(shù)據(jù)挖掘步驟示意圖
第2章相關(guān)理論和研究方法7視化工具進(jìn)行展示[18]。數(shù)據(jù)挖掘的主要方法有分類(lèi)、估值、預(yù)測(cè)、關(guān)聯(lián)規(guī)則以及聚類(lèi),其中分類(lèi)、估值、預(yù)測(cè)屬于有指導(dǎo)的數(shù)據(jù)挖掘,這些方法可以通過(guò)數(shù)據(jù)建立一個(gè)可以對(duì)特定屬性進(jìn)行描述的模型,關(guān)聯(lián)規(guī)則以及聚類(lèi)分析屬于無(wú)指導(dǎo)的數(shù)據(jù)挖掘,這類(lèi)方法使用過(guò)所有屬性尋找某種關(guān)系。不同的數(shù)據(jù)挖掘方法有著屬于自己的數(shù)據(jù)挖掘算法,例如分類(lèi)中的決策樹(shù)算法、預(yù)測(cè)中的回歸分析、聚類(lèi)中的K-means聚類(lèi),具體算法介紹如圖2-2:圖2-2數(shù)據(jù)挖掘算法分類(lèi)圖Fig.2-2Dataminingalgorithmclassificationgraph本文根據(jù)績(jī)效考核的相關(guān)需求,選用分類(lèi)方法中的決策樹(shù)算法作為數(shù)據(jù)挖掘的算法,通過(guò)對(duì)系統(tǒng)數(shù)據(jù)的分析,得出有關(guān)于績(jī)效考核體系的決策樹(shù),幫助管理人員更方便的對(duì)員工進(jìn)行考核分析。2.1.2決策樹(shù)算法本文所使用的的算法是分類(lèi)算法中的決策樹(shù)算法。在數(shù)據(jù)挖掘[19]的分類(lèi)算法中,與其他的分類(lèi)方法相比,決策樹(shù)分類(lèi)方法有著簡(jiǎn)單易懂、不用過(guò)于專(zhuān)業(yè)的背景知識(shí)等優(yōu)點(diǎn)。決策樹(shù)生成的結(jié)果通常是以if-then的規(guī)則形式進(jìn)行表達(dá)的,這種方式清晰且簡(jiǎn)單,被廣泛應(yīng)用在金融行業(yè)、氣象分析、交通管理等多個(gè)領(lǐng)域中[20]。決策樹(shù)是一種樹(shù)結(jié)構(gòu),包括根節(jié)點(diǎn)、分支、葉子三部分,根節(jié)點(diǎn)表示樹(shù)的一個(gè)屬性,葉子表示分類(lèi)的標(biāo)記,分支表示輸出的結(jié)果。該方法從根節(jié)點(diǎn)開(kāi)始循環(huán)反復(fù)遍歷,根據(jù)測(cè)試所得出的結(jié)果,將實(shí)例分配到其子節(jié)點(diǎn),每個(gè)子節(jié)點(diǎn)都會(huì)對(duì)應(yīng)該特征的一個(gè)取值,通過(guò)遞歸的方法,繼續(xù)對(duì)實(shí)例進(jìn)行測(cè)試與分配,直到到達(dá)葉節(jié)點(diǎn),最后將實(shí)例分到葉節(jié)點(diǎn)的類(lèi)中。在決策樹(shù)中,有樣本數(shù)據(jù)集以及測(cè)試數(shù)據(jù)集兩種,樣本數(shù)據(jù)集是一個(gè)數(shù)據(jù)集
第2章相關(guān)理論和研究方法10||||log||||(X)SplitInfo21AXXXXjijj(2-4)接著根據(jù)屬性A的分裂之后的樣本集的信息增益:ain(X(X)H-H(X)A),InfoGA(2-5)屬性A分裂之后的樣本集的信息增益率:)(),(),(XSplitInfoainAXInfoGatioAXGainRA(2-6)在C4.5算法執(zhí)行之后,得到有屬性信息增益率的結(jié)果,選取信息增益率最大的屬性作為當(dāng)前節(jié)點(diǎn)的分裂屬性[31]。其他屬性將會(huì)繼續(xù)進(jìn)行遞歸計(jì)算。隨著屬性逐漸的計(jì)算,信息增益率將會(huì)變得越來(lái)越小,選擇相對(duì)較大的信息增益率的屬性作為分類(lèi)屬性。直到最終決策樹(shù)的生成。C4.5的具體流程圖如下圖2-3:圖2-3C4.5算法流程圖
本文編號(hào):3471163
本文鏈接:http://www.sikaile.net/shoufeilunwen/xixikjs/3471163.html
最近更新
教材專(zhuān)著