基于改進(jìn)隨機(jī)森林算法的研究與應(yīng)用
發(fā)布時(shí)間:2023-03-19 15:02
在高校教學(xué)管理工作中,學(xué)校教學(xué)質(zhì)量優(yōu)劣重要評估指標(biāo)之一是學(xué)生課程成績,存在多種因素影響學(xué)生課程成績。利用數(shù)據(jù)挖掘工具對學(xué)生的學(xué)習(xí)課程成績進(jìn)行預(yù)測分析,進(jìn)而利用預(yù)測分析結(jié)果及時(shí)指正學(xué)生出現(xiàn)的不良學(xué)習(xí)行為,同時(shí)檢查老師的教學(xué)效果,這具有非常重要的研究意義。為了完成學(xué)生課程成績預(yù)測工作,本文首先對于傳統(tǒng)隨機(jī)森林算法的研究現(xiàn)狀進(jìn)行分析,并結(jié)合模擬退火算法提出在特征選擇、參數(shù)優(yōu)化以及權(quán)重設(shè)定方向進(jìn)行優(yōu)化的改進(jìn)隨機(jī)森林算法IRFC(Improved Random Forest Classifier)。改進(jìn)的隨機(jī)森林算法對于相關(guān)參數(shù)(特征個(gè)數(shù)、樹規(guī)模、樹決策權(quán)重)進(jìn)行二進(jìn)制編碼作為算法優(yōu)化的目標(biāo)變量,并以袋外誤差(Out of Bag,OOB)作為優(yōu)化目標(biāo)函數(shù),全面優(yōu)化算法分類性能。在進(jìn)行改進(jìn)隨機(jī)森林算法的驗(yàn)證過程中,作者采集多年歷史學(xué)生行為記錄以及學(xué)科成績(三年數(shù)據(jù))構(gòu)造學(xué)生成績數(shù)據(jù)集,從而根據(jù)學(xué)生行為信息進(jìn)行學(xué)生成績(兩類:合格與不合格)預(yù)測的工作。目前已經(jīng)完成改進(jìn)隨機(jī)森林算法在此數(shù)據(jù)集以及心臟病數(shù)據(jù)集兩個(gè)數(shù)據(jù)集上的仿真驗(yàn)證工作,實(shí)驗(yàn)結(jié)果證明本文提出改進(jìn)隨機(jī)森林算法具有更高的泛化能力、較小的OO...
【文章頁數(shù)】:62 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 研究背景
1.2 研究現(xiàn)狀
1.2.1 教育數(shù)據(jù)挖掘
1.2.2 數(shù)據(jù)挖掘算法
1.3 研究目標(biāo)與方向
1.3.1 關(guān)鍵技術(shù)路線
1.3.2 本文主要工作
1.4 論文結(jié)構(gòu)安排
第2章 相關(guān)背景及技術(shù)
2.1 理論介紹
2.1.1 分類算法
2.1.2 決策樹算法
2.1.3 隨機(jī)森林算法
2.1.4 模擬退火算法
2.2 分類算法評價(jià)指標(biāo)
2.3 數(shù)據(jù)平臺技術(shù)
2.3.1 R語言
2.3.2 PostgreSQL數(shù)據(jù)庫
2.4 本章小結(jié)
第3章 改進(jìn)算法介紹
3.1 傳統(tǒng)隨機(jī)森林算法
3.1.1 Bagging方法
3.1.2 CART算法
3.1.3 隨機(jī)森林算法流程
3.2 改進(jìn)算法
3.2.1 改進(jìn)思路
3.2.2 改進(jìn)算法流程
3.3 本章小結(jié)
第4章 UCI數(shù)據(jù)集上的算法評估
4.1 UCI數(shù)據(jù)集
4.2 算法基礎(chǔ)評估
4.3 本章小結(jié)
第5章 算法在學(xué)生課程成績預(yù)測上的應(yīng)用
5.1 學(xué)生成績數(shù)據(jù)集說明
5.1.1 特征規(guī)范化
5.1.2 傳統(tǒng)算法結(jié)果對比
5.2 平臺環(huán)境
5.3 算法評估
5.3.1 算法基礎(chǔ)評估
5.3.2 最優(yōu)參數(shù)決策時(shí)長分析
5.3.3 特征選擇結(jié)果分析
5.3.4 OOB誤差分析
5.3.5 算法并行化對比
5.4 本章小結(jié)
第6章 總結(jié)與展望
6.1 總結(jié)
6.2 展望
參考文獻(xiàn)
致謝
個(gè)人簡歷及在學(xué)期間發(fā)表的學(xué)術(shù)論文與研究成果
本文編號:3765459
【文章頁數(shù)】:62 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
abstract
第1章 緒論
1.1 研究背景
1.2 研究現(xiàn)狀
1.2.1 教育數(shù)據(jù)挖掘
1.2.2 數(shù)據(jù)挖掘算法
1.3 研究目標(biāo)與方向
1.3.1 關(guān)鍵技術(shù)路線
1.3.2 本文主要工作
1.4 論文結(jié)構(gòu)安排
第2章 相關(guān)背景及技術(shù)
2.1 理論介紹
2.1.1 分類算法
2.1.2 決策樹算法
2.1.3 隨機(jī)森林算法
2.1.4 模擬退火算法
2.2 分類算法評價(jià)指標(biāo)
2.3 數(shù)據(jù)平臺技術(shù)
2.3.1 R語言
2.3.2 PostgreSQL數(shù)據(jù)庫
2.4 本章小結(jié)
第3章 改進(jìn)算法介紹
3.1 傳統(tǒng)隨機(jī)森林算法
3.1.1 Bagging方法
3.1.2 CART算法
3.1.3 隨機(jī)森林算法流程
3.2 改進(jìn)算法
3.2.1 改進(jìn)思路
3.2.2 改進(jìn)算法流程
3.3 本章小結(jié)
第4章 UCI數(shù)據(jù)集上的算法評估
4.1 UCI數(shù)據(jù)集
4.2 算法基礎(chǔ)評估
4.3 本章小結(jié)
第5章 算法在學(xué)生課程成績預(yù)測上的應(yīng)用
5.1 學(xué)生成績數(shù)據(jù)集說明
5.1.1 特征規(guī)范化
5.1.2 傳統(tǒng)算法結(jié)果對比
5.2 平臺環(huán)境
5.3 算法評估
5.3.1 算法基礎(chǔ)評估
5.3.2 最優(yōu)參數(shù)決策時(shí)長分析
5.3.3 特征選擇結(jié)果分析
5.3.4 OOB誤差分析
5.3.5 算法并行化對比
5.4 本章小結(jié)
第6章 總結(jié)與展望
6.1 總結(jié)
6.2 展望
參考文獻(xiàn)
致謝
個(gè)人簡歷及在學(xué)期間發(fā)表的學(xué)術(shù)論文與研究成果
本文編號:3765459
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/3765459.html
最近更新
教材專著