基于K-Means的慕課用戶行為分析研究
發(fā)布時(shí)間:2019-09-20 01:55
【摘要】:隨著“互聯(lián)網(wǎng)+教育”的全民普及,慕課(大規(guī)模在線開放課程)的發(fā)展如火如茶,為人們接受在線教育提供了一個(gè)廣闊的平臺(tái),而國(guó)內(nèi)慕課的實(shí)踐研究遠(yuǎn)早于理論研究,眾多慕課平臺(tái)紛紛涌現(xiàn)。慕課用戶的知識(shí)背景和學(xué)習(xí)動(dòng)機(jī)呈多樣性分布,并在學(xué)習(xí)的過(guò)程中產(chǎn)生豐富的學(xué)習(xí)行為數(shù)據(jù),為了探索蘊(yùn)含在數(shù)據(jù)中的規(guī)律,針對(duì)不同的用戶群體提供個(gè)性化的環(huán)境和學(xué)習(xí)指導(dǎo),分析和研究用戶的行為數(shù)據(jù)是十分有必要的。聚類分析是一種常用的探索性數(shù)據(jù)挖掘方法,是無(wú)監(jiān)督機(jī)器學(xué)習(xí)的典型應(yīng)用,不僅可以用于分類數(shù)據(jù)的多元統(tǒng)計(jì)分析,也可以為其他算法提供預(yù)處理。在研究和歸納用戶行為分析方法的基礎(chǔ)上,本文選擇K-Means算法進(jìn)行聚類分析,通過(guò)進(jìn)行算法的優(yōu)化和構(gòu)建成績(jī)預(yù)測(cè)模型,成功實(shí)現(xiàn)了慕課用戶的成績(jī)預(yù)測(cè),并構(gòu)建成績(jī)預(yù)測(cè)模塊,實(shí)現(xiàn)成績(jī)預(yù)測(cè)值的可視化展示。本文的主要研究工作有:(1)基于慕課用戶行為數(shù)據(jù),對(duì)用戶的學(xué)習(xí)行為數(shù)據(jù)的基本信息、用戶類型、影響成績(jī)的因素等三個(gè)方面進(jìn)行深入地分析和探索,得出一些相關(guān)結(jié)論。(2)本文利用特征選擇和初始聚類中心的優(yōu)化選取算法,提出了一種K-Means特征選擇算法,并提出一個(gè)均衡判別函數(shù)平衡類簇內(nèi)差異和類簇間差異。(3)將K-Means特征選擇算法得到的聚類中心作為神經(jīng)網(wǎng)絡(luò)的中心,設(shè)置預(yù)測(cè)模型的參數(shù)和輸入輸出變量,選擇RBF神經(jīng)網(wǎng)絡(luò)構(gòu)建一個(gè)成績(jī)預(yù)測(cè)模型,并動(dòng)態(tài)更新該模型,以更為準(zhǔn)確地實(shí)現(xiàn)成績(jī)的預(yù)測(cè)。本文設(shè)計(jì)了仿真實(shí)驗(yàn)驗(yàn)證算法的高效性,對(duì)比K-Means特征選擇算法和基于密度的K-Means算法,證明了本文算法性能的改進(jìn)。同時(shí),使用仿真實(shí)驗(yàn)證明了成績(jī)預(yù)測(cè)模型對(duì)慕課用戶的成績(jī)具有較高的預(yù)測(cè)精度。最后利用預(yù)測(cè)模型設(shè)計(jì)和實(shí)現(xiàn)了一個(gè)成績(jī)預(yù)測(cè)模塊,可以直觀地輸出用戶的成績(jī)預(yù)測(cè)值,并對(duì)成績(jī)較低的用戶進(jìn)行預(yù)警、建議和輔導(dǎo)。
【圖文】:
邐邋Table邋3-2邋Age邋Distribution邋of邋Users邐逡逑區(qū)間序號(hào)邐年齡分布區(qū)間邐邐逡逑1邐{19-34}邐14574邐19-34歲的用戶數(shù)量逡逑2邐{34-54}邐16923邐34-54歲的用戶數(shù)量逡逑3邐{55邋or邋older}邐5583邐55歲以上的用戶數(shù)量逡逑邐4邐{}邐288119邐屬性為空的用戶數(shù)量逡逑如表3-2所示,年齡分布于34歲到54歲的人數(shù)最多,占比45.6%,其次分布逡逑于19歲到34歲,最后是分布于55歲以上的用戶數(shù)量,僅有5583條數(shù)據(jù)。前兩逡逑個(gè)區(qū)間的用戶數(shù)量差距不大,但是遠(yuǎn)遠(yuǎn)高于后者區(qū)間的用戶數(shù)量。這說(shuō)明,慕課逡逑用戶偏年輕化,熟悉網(wǎng)絡(luò)平臺(tái),有強(qiáng)烈的求知欲和學(xué)習(xí)目標(biāo)。逡逑(2)教育水平分析逡逑慕課用戶的教育水平分布能夠在一定程度上解釋慕課的用戶群體,如圖3-1逡逑所示,慕課用戶主要集中于學(xué)士學(xué)歷和碩士學(xué)歷,占用戶數(shù)量的83.4%,而博士逡逑學(xué)歷和中學(xué)及以下學(xué)歷的人群占比極少,這說(shuō)明慕課所吸引的用戶基本都是接受逡逑過(guò)良好的高等教育,,且慕課流行于擁有較高文化水準(zhǔn)的人群中。逡逑
圖3-2用戶的參與原因逡逑Figure邋3-2邋Reasons邋for邋Participation邋of邋Users逡逑
【學(xué)位授予單位】:北京交通大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類號(hào)】:TP311.13
【圖文】:
邐邋Table邋3-2邋Age邋Distribution邋of邋Users邐逡逑區(qū)間序號(hào)邐年齡分布區(qū)間邐邐逡逑1邐{19-34}邐14574邐19-34歲的用戶數(shù)量逡逑2邐{34-54}邐16923邐34-54歲的用戶數(shù)量逡逑3邐{55邋or邋older}邐5583邐55歲以上的用戶數(shù)量逡逑邐4邐{}邐288119邐屬性為空的用戶數(shù)量逡逑如表3-2所示,年齡分布于34歲到54歲的人數(shù)最多,占比45.6%,其次分布逡逑于19歲到34歲,最后是分布于55歲以上的用戶數(shù)量,僅有5583條數(shù)據(jù)。前兩逡逑個(gè)區(qū)間的用戶數(shù)量差距不大,但是遠(yuǎn)遠(yuǎn)高于后者區(qū)間的用戶數(shù)量。這說(shuō)明,慕課逡逑用戶偏年輕化,熟悉網(wǎng)絡(luò)平臺(tái),有強(qiáng)烈的求知欲和學(xué)習(xí)目標(biāo)。逡逑(2)教育水平分析逡逑慕課用戶的教育水平分布能夠在一定程度上解釋慕課的用戶群體,如圖3-1逡逑所示,慕課用戶主要集中于學(xué)士學(xué)歷和碩士學(xué)歷,占用戶數(shù)量的83.4%,而博士逡逑學(xué)歷和中學(xué)及以下學(xué)歷的人群占比極少,這說(shuō)明慕課所吸引的用戶基本都是接受逡逑過(guò)良好的高等教育,,且慕課流行于擁有較高文化水準(zhǔn)的人群中。逡逑
圖3-2用戶的參與原因逡逑Figure邋3-2邋Reasons邋for邋Participation邋of邋Users逡逑
【學(xué)位授予單位】:北京交通大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2017
【分類號(hào)】:TP311.13
【參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 孫利雷;秦進(jìn);;基于隨機(jī)擾動(dòng)的K-Means聚類中心優(yōu)化方法[J];貴州大學(xué)學(xué)報(bào)(自然科學(xué)版);2016年04期
2 賀超凱;吳蒙;;edX平臺(tái)教育大數(shù)據(jù)的學(xué)習(xí)行為分析與預(yù)測(cè)[J];中國(guó)遠(yuǎn)程教育;2016年06期
3 孫丙仁;楊敏;;基于機(jī)器學(xué)習(xí)聚類算法的學(xué)習(xí)者自動(dòng)分類研究[J];天津電大學(xué)報(bào);2016年02期
4 賈瑞玉;宋建林;;基于聚類中心優(yōu)化的k-means最佳聚類數(shù)確定方法[J];微電子學(xué)與計(jì)算機(jī);2016年05期
5 姜丹;王美娜;周麗;;基于聚類分析技術(shù)的智能型MOOC平臺(tái)的研究與設(shè)計(jì)[J];現(xiàn)代計(jì)算機(jī)(專業(yè)版);2016年13期
6 孫洪濤;李秋R
本文編號(hào):2538475
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/2538475.html
最近更新
教材專著