天堂国产午夜亚洲专区-少妇人妻综合久久蜜臀-国产成人户外露出视频在线-国产91传媒一区二区三区

當(dāng)前位置:主頁 > 教育論文 > 教育體制論文 >

DDTR:大數(shù)據(jù)背景下的學(xué)生就業(yè)率預(yù)測模型

發(fā)布時間:2020-12-16 19:08
  伴隨大數(shù)據(jù)驅(qū)動的深入感知及預(yù)測方法的飛速發(fā)展,分析及研究學(xué)生就業(yè)率的變化趨勢,對調(diào)整課程結(jié)構(gòu)、提高學(xué)生就業(yè)率,均有較好的促進作用。本文基于在校學(xué)生的多項課程成績,利用貪心選擇策略,建立了采用自學(xué)習(xí)模式的就業(yè)率預(yù)測模型DDTR,通過混淆矩陣各項系數(shù)驗證,該預(yù)測模型具有較高的就業(yè)預(yù)見性,對學(xué)校課程規(guī)劃及學(xué)生就業(yè)具有一定的指導(dǎo)意義。 

【文章來源】:中國教育信息化. 2018年21期

【文章頁數(shù)】:3 頁

【部分圖文】:

DDTR:大數(shù)據(jù)背景下的學(xué)生就業(yè)率預(yù)測模型


就業(yè)率預(yù)測模型功能模塊

框架圖,就業(yè)率,框架


萄е柿亢陀?煅??芰?的指標(biāo),對于學(xué)校和社會間良性作用的程度具有客觀的反映。影響畢業(yè)生就業(yè)的因素具有多樣性,通過對畢業(yè)生和招聘單位的調(diào)查,學(xué)生的學(xué)業(yè)成績是就業(yè)率一個非常重要的影響因素,本文旨在建立一種基于學(xué)生學(xué)業(yè)成績的就業(yè)率預(yù)測模型,通過歷史數(shù)據(jù)的比對,審查和規(guī)劃學(xué)校的發(fā)展。同時,通過產(chǎn)生可能就業(yè)困難學(xué)生名單,學(xué)?蓪@些學(xué)生進行針對性指導(dǎo),幫助學(xué)生就業(yè)。基于成績的就業(yè)率預(yù)測框架DDTR(datanormalization-dimensionspecifi-cation-decisiontree-employmentrate)是一個自學(xué)習(xí)系統(tǒng),如圖1所示,每一次預(yù)測后,預(yù)測報告都要和真實報告進行分析匹配并最終給出反饋意見,進一步修改和完善預(yù)測模型。三、DDTR模塊分析DDTR中的學(xué)生成績主要來自于課程成績,基于此,本文將學(xué)生的課程成績作為模型的訓(xùn)練樣本。系統(tǒng)的功能模塊如圖2所示,由3大模塊組成,其中決策樹模型模塊負(fù)責(zé)將輸入的數(shù)據(jù)根據(jù)相應(yīng)算法進行分析后生成預(yù)測文件;原始數(shù)據(jù)處理模塊負(fù)責(zé)將學(xué)生的課程成績處理成預(yù)測模型需要的數(shù)據(jù)格式;測試與分析模塊則負(fù)責(zé)將預(yù)測后的數(shù)據(jù)進行分析,以便進一步改善預(yù)測模型。[1]1.決策樹模型決策樹[2]是一種由結(jié)點和有向邊組成的層次結(jié)構(gòu),DDTR:大數(shù)據(jù)背景下的學(xué)生就業(yè)率預(yù)測模型席菁(蘇州市教育科學(xué)研究院,江蘇蘇州215004)摘要:伴隨大數(shù)據(jù)驅(qū)動的深入感知及預(yù)測方法的飛速發(fā)展,分析及研究學(xué)生就業(yè)率的變化趨勢,對調(diào)整課程結(jié)構(gòu)、提高學(xué)生就業(yè)率,均有較好的促進作用。本文基于在校學(xué)生的多項課程成績,利用貪心選擇策略,建立了采用自學(xué)習(xí)模式的就業(yè)率預(yù)測模型DDTR,通過混淆矩陣各項系數(shù)驗證,該預(yù)測模型具有較高的就業(yè)預(yù)見性,對學(xué)校課程規(guī)劃及學(xué)生就業(yè)具有一定的指導(dǎo)意義。關(guān)鍵詞:大數(shù)據(jù);就業(yè)?

模型圖,決策樹,模型


將結(jié)點中的記錄分布到創(chuàng)建好的孩子結(jié)點中。模型使用Weka提供的J48決策樹工具來實現(xiàn),其中決策樹算法采用的是C4.5的實現(xiàn)。Weka[3]是使用Java編寫的開源機器學(xué)習(xí)工具和數(shù)據(jù)挖掘軟件。作為公開的數(shù)據(jù)挖掘平臺,集合了數(shù)據(jù)預(yù)處理、分類、回歸、聚類和關(guān)聯(lián)規(guī)則等算法。決策樹模型生成過程如下:首先進入explorer功能,使用preprocess選項卡導(dǎo)入轉(zhuǎn)換好格式后的Weka輸入文件,轉(zhuǎn)至classify選項卡選擇tree分類器下的J48工具,填入自定義的決策樹參數(shù)。這里使用參數(shù)J48-C0.25-M2,點擊Start,Weka將訓(xùn)練模型生成決策樹模型,如圖3所示。其中每一個屬性的數(shù)據(jù)類型都是numeric,對于這種連續(xù)的屬性,決策樹需要找到相應(yīng)的劃分點,將實數(shù)軸上的區(qū)域進行二分。如圖3中的0.54、0.38這些數(shù)值,即選取劃分點,從而對于連續(xù)屬性而言,屬性測試條件變成了具有二元輸出的比較測試。二元劃分父結(jié)點,產(chǎn)生一棵二叉的決策樹。2.原始數(shù)據(jù)處理根據(jù)上文中預(yù)測模型需要的輸入文件格式,需要對數(shù)據(jù)進行預(yù)處理[4],首先進行數(shù)據(jù)清洗,剔除缺失數(shù)據(jù)和無用信息,然后對數(shù)據(jù)進行歸一化處理,利用相似性度量對課程進行歸類,將同一類下的課程成績利用學(xué)分進行合并,最終將所有課程劃分為13個聚類,聚類內(nèi)科目成績關(guān)于學(xué)分的加權(quán)平均作為此聚類的得分。聚類作為分類器的輸入屬性,聚類得分/表現(xiàn)作為屬性下的值并以此作為訓(xùn)練決策樹分類器的輸入。(1)數(shù)據(jù)清洗在實際應(yīng)用中,數(shù)據(jù)往往不夠“干凈”,需要通過一系列步驟來對“臟”數(shù)據(jù)進行清洗,首先填補缺失值,然后確定并刪除“噪聲”數(shù)據(jù),以確保數(shù)據(jù)質(zhì)量。如果有些重要的屬性由于各種原因?qū)е聸]有數(shù)值,那么在數(shù)據(jù)清洗時要對這些空缺屬性值按照約定進行處理:如果一條記錄中多個屬性值空缺,或者關(guān)鍵屬性值

【參考文獻】:
期刊論文
[1]面向大數(shù)據(jù)分析的決策樹算法[J]. 張棪,曹健.  計算機科學(xué). 2016(S1)
[2]網(wǎng)絡(luò)大數(shù)據(jù):現(xiàn)狀與展望[J]. 王元卓,靳小龍,程學(xué)旗.  計算機學(xué)報. 2013(06)
[3]WEKA環(huán)境下基于模糊理論的聚類算法[J]. 鄭世明,苗壯,宋自林,高志年.  解放軍理工大學(xué)學(xué)報(自然科學(xué)版). 2012(01)

碩士論文
[1]基于數(shù)據(jù)挖掘的數(shù)據(jù)清洗及其評估模型的研究[D]. 鄒杰.北京郵電大學(xué) 2017



本文編號:2920637

資料下載
論文發(fā)表

本文鏈接:http://www.sikaile.net/jiaoyulunwen/jiaoyutizhilunwen/2920637.html


Copyright(c)文論論文網(wǎng)All Rights Reserved | 網(wǎng)站地圖 |

版權(quán)申明:資料由用戶9d1bd***提供,本站僅收錄摘要或目錄,作者需要刪除請E-mail郵箱bigeng88@qq.com