時間序列聚類在學習行為分析上的應用研究
發(fā)布時間:2021-07-22 04:02
隨著MOOC技術的發(fā)展,各高校也開始建立自己的云課堂學習平臺,云課堂上有大量的學習數(shù)據(jù),而在大數(shù)據(jù)時代,對數(shù)據(jù)的挖掘和分析顯得尤為重要。聚類分析也是無監(jiān)督學習,模糊聚類提出后被廣泛應用,模糊C均值聚類算法(Fuzzy C-Means,FCM)是一種重要的模糊聚類方法。時間序列分析是一個古老的課題,發(fā)展到現(xiàn)在已被廣泛應用于各領域。時間序列聚類雖然應用廣泛,但在教育領域的應用還較少。時間序列模型用曲線擬合時間序列數(shù)據(jù),并可預測序列未來趨勢。本文根據(jù)分析結果采取自回歸移動平均(Auto-Regressive and Moving Avergae,ARMA)模型進行擬合預測。本文通過分析某高校云課堂學習行為數(shù)據(jù),發(fā)現(xiàn)了云課堂學習平臺數(shù)據(jù)的特性。學習行為數(shù)據(jù)是一個時間序列,在對學習用戶進行聚類的時候,使用樣本點與聚類中心的時間序列相似距離來代替樣本點與聚類中心的歐式距離,根據(jù)數(shù)據(jù)特征采用動態(tài)時間彎曲距離(Dynamics Time Wraping,DTW)來計算樣本點與聚類中心的時間序列相似距離,設計出基于DTW的模糊C均值聚類算法(DTW-FCM),并對經(jīng)過預處理的學習用戶數(shù)據(jù)進行基于DTW的...
【文章來源】:華中師范大學湖北省 211工程院校 教育部直屬院校
【文章頁數(shù)】:57 頁
【學位級別】:碩士
【部分圖文】:
圖3.1學習數(shù)據(jù)表(data)??
女?文字陜?漢語密文字(蹄范)_420?86??201321?茫?sr?(mm)?_42〇?as??201321?m?V'?文字疾?漢遙客又字(_通}?_420?S2??201321?徐?女?文字^?漢il宮文字(蹄范)_420?S9??201321?張?女?cmm.)?_42〇?&s??201521?茲?女?文字聯(lián)?漢語賽文字(師范)_42〇?87??201321?張?女?域市與5^墳衫字字曉人文鄉(xiāng)規(guī)劃_41?5?82??圖3.2學生信息表(userinfo)??2)預處理數(shù)據(jù)??分析數(shù)據(jù)表中的內容,可以根據(jù)現(xiàn)有的信息,運用mysql和excel進行處理,??得到每個學生學習總時長和學習次數(shù),放進表stuTotaltime中,如圖3.3所示,包含??了學號(userid)、姓名(username)、性別(sex)、學院(college)、專業(yè)(major)、??云課堂系統(tǒng)id?(SysAppId)、設備系統(tǒng)(SysOs)、學習總時長(totaltime,以秒為??單位)、總學習次數(shù)(studycount)、分數(shù)(score)等字段。還可以得到每天的學??習時長,放進表stuBehavior中,如圖3.4所示,stuBehavior表中包含了學號(userid)、??姓名(username)、性別(sex)、云課堂系統(tǒng)id?(SysAppId)、設備系統(tǒng)(SysOs)、??事件發(fā)生時間(eventtime,包含的事件發(fā)生的早期和時間點)、學院(college)、??專業(yè)(major)、日期(date,是通過eventtime得到的)、時間(time,對應日期的??
女?文字陜?漢語密文字(蹄范)_420?86??201321?茫?sr?(mm)?_42〇?as??201321?m?V'?文字疾?漢遙客又字(_通}?_420?S2??201321?徐?女?文字^?漢il宮文字(蹄范)_420?S9??201321?張?女?cmm.)?_42〇?&s??201521?茲?女?文字聯(lián)?漢語賽文字(師范)_42〇?87??201321?張?女?域市與5^墳衫字字曉人文鄉(xiāng)規(guī)劃_41?5?82??圖3.2學生信息表(userinfo)??2)預處理數(shù)據(jù)??分析數(shù)據(jù)表中的內容,可以根據(jù)現(xiàn)有的信息,運用mysql和excel進行處理,??得到每個學生學習總時長和學習次數(shù),放進表stuTotaltime中,如圖3.3所示,包含??了學號(userid)、姓名(username)、性別(sex)、學院(college)、專業(yè)(major)、??云課堂系統(tǒng)id?(SysAppId)、設備系統(tǒng)(SysOs)、學習總時長(totaltime,以秒為??單位)、總學習次數(shù)(studycount)、分數(shù)(score)等字段。還可以得到每天的學??習時長,放進表stuBehavior中,如圖3.4所示,stuBehavior表中包含了學號(userid)、??姓名(username)、性別(sex)、云課堂系統(tǒng)id?(SysAppId)、設備系統(tǒng)(SysOs)、??事件發(fā)生時間(eventtime,包含的事件發(fā)生的早期和時間點)、學院(college)、??專業(yè)(major)、日期(date,是通過eventtime得到的)、時間(time,對應日期的??
【參考文獻】:
期刊論文
[1]基于時間序列的電能表月故障數(shù)預測方法[J]. 李媛,鄭安剛,譚煌,陳昊,程淑亞,蔡慧,王黎欣. 中國電力. 2020(06)
[2]時間序列預測方法綜述[J]. 楊海民,潘志松,白瑋. 計算機科學. 2019(01)
[3]時間序列數(shù)據(jù)挖掘的相似性度量綜述[J]. 陳海燕,劉晨暉,孫博. 控制與決策. 2017(01)
[4]教育數(shù)據(jù)挖掘研究進展綜述[J]. 周慶,牟超,楊丹. 軟件學報. 2015(11)
[5]時間序列的表示與分類算法綜述[J]. 原繼東,王志海. 計算機科學. 2015(03)
[6]不確定時間序列的降維及相似性匹配[J]. 王偉,劉國華,徐斌. 計算機科學與探索. 2015(04)
[7]模糊C均值聚類下的醫(yī)學圖像分割探討[J]. 辛國江,占艷,韋昌法,穆珺,周燃犀. 硅谷. 2014(13)
[8]基于SARMA模型的我國粗鋼產(chǎn)量時間序列分析與預測[J]. 廖冰清. 企業(yè)導報. 2012(24)
[9]一種基于關鍵點的時間序列聚類算法[J]. 謝福鼎,李迎,孫巖,張永. 計算機科學. 2012(03)
[10]基于方差波動多重分形特征的金融時間序列聚類[J]. 黃超,吳清烈,武忠,朱揚勇. 系統(tǒng)工程. 2006(06)
博士論文
[1]時間序列數(shù)據(jù)分類、檢索方法及應用研究[D]. 鄭毅.中國科學技術大學 2015
[2]時間序列數(shù)據(jù)挖掘若干關鍵問題研究[D]. 何曉旭.中國科學技術大學 2014
[3]時間序列數(shù)據(jù)挖掘中的維數(shù)約簡與預測方法研究[D]. 孫友強.中國科學技術大學 2014
碩士論文
[1]基于密度度量的大樣本時間序列聚類分析和預測方法研究[D]. 程佳宇.武漢大學 2018
[2]基于特性分析的交通流時間序列聚類[D]. 吳冕.北京交通大學 2017
[3]交通流時間序列的聚類分析方法及應用[D]. 李強.北京交通大學 2012
[4]模糊聚類分析技術及其應用研究[D]. 葉海軍.合肥工業(yè)大學 2006
本文編號:3296393
【文章來源】:華中師范大學湖北省 211工程院校 教育部直屬院校
【文章頁數(shù)】:57 頁
【學位級別】:碩士
【部分圖文】:
圖3.1學習數(shù)據(jù)表(data)??
女?文字陜?漢語密文字(蹄范)_420?86??201321?茫?sr?(mm)?_42〇?as??201321?m?V'?文字疾?漢遙客又字(_通}?_420?S2??201321?徐?女?文字^?漢il宮文字(蹄范)_420?S9??201321?張?女?cmm.)?_42〇?&s??201521?茲?女?文字聯(lián)?漢語賽文字(師范)_42〇?87??201321?張?女?域市與5^墳衫字字曉人文鄉(xiāng)規(guī)劃_41?5?82??圖3.2學生信息表(userinfo)??2)預處理數(shù)據(jù)??分析數(shù)據(jù)表中的內容,可以根據(jù)現(xiàn)有的信息,運用mysql和excel進行處理,??得到每個學生學習總時長和學習次數(shù),放進表stuTotaltime中,如圖3.3所示,包含??了學號(userid)、姓名(username)、性別(sex)、學院(college)、專業(yè)(major)、??云課堂系統(tǒng)id?(SysAppId)、設備系統(tǒng)(SysOs)、學習總時長(totaltime,以秒為??單位)、總學習次數(shù)(studycount)、分數(shù)(score)等字段。還可以得到每天的學??習時長,放進表stuBehavior中,如圖3.4所示,stuBehavior表中包含了學號(userid)、??姓名(username)、性別(sex)、云課堂系統(tǒng)id?(SysAppId)、設備系統(tǒng)(SysOs)、??事件發(fā)生時間(eventtime,包含的事件發(fā)生的早期和時間點)、學院(college)、??專業(yè)(major)、日期(date,是通過eventtime得到的)、時間(time,對應日期的??
女?文字陜?漢語密文字(蹄范)_420?86??201321?茫?sr?(mm)?_42〇?as??201321?m?V'?文字疾?漢遙客又字(_通}?_420?S2??201321?徐?女?文字^?漢il宮文字(蹄范)_420?S9??201321?張?女?cmm.)?_42〇?&s??201521?茲?女?文字聯(lián)?漢語賽文字(師范)_42〇?87??201321?張?女?域市與5^墳衫字字曉人文鄉(xiāng)規(guī)劃_41?5?82??圖3.2學生信息表(userinfo)??2)預處理數(shù)據(jù)??分析數(shù)據(jù)表中的內容,可以根據(jù)現(xiàn)有的信息,運用mysql和excel進行處理,??得到每個學生學習總時長和學習次數(shù),放進表stuTotaltime中,如圖3.3所示,包含??了學號(userid)、姓名(username)、性別(sex)、學院(college)、專業(yè)(major)、??云課堂系統(tǒng)id?(SysAppId)、設備系統(tǒng)(SysOs)、學習總時長(totaltime,以秒為??單位)、總學習次數(shù)(studycount)、分數(shù)(score)等字段。還可以得到每天的學??習時長,放進表stuBehavior中,如圖3.4所示,stuBehavior表中包含了學號(userid)、??姓名(username)、性別(sex)、云課堂系統(tǒng)id?(SysAppId)、設備系統(tǒng)(SysOs)、??事件發(fā)生時間(eventtime,包含的事件發(fā)生的早期和時間點)、學院(college)、??專業(yè)(major)、日期(date,是通過eventtime得到的)、時間(time,對應日期的??
【參考文獻】:
期刊論文
[1]基于時間序列的電能表月故障數(shù)預測方法[J]. 李媛,鄭安剛,譚煌,陳昊,程淑亞,蔡慧,王黎欣. 中國電力. 2020(06)
[2]時間序列預測方法綜述[J]. 楊海民,潘志松,白瑋. 計算機科學. 2019(01)
[3]時間序列數(shù)據(jù)挖掘的相似性度量綜述[J]. 陳海燕,劉晨暉,孫博. 控制與決策. 2017(01)
[4]教育數(shù)據(jù)挖掘研究進展綜述[J]. 周慶,牟超,楊丹. 軟件學報. 2015(11)
[5]時間序列的表示與分類算法綜述[J]. 原繼東,王志海. 計算機科學. 2015(03)
[6]不確定時間序列的降維及相似性匹配[J]. 王偉,劉國華,徐斌. 計算機科學與探索. 2015(04)
[7]模糊C均值聚類下的醫(yī)學圖像分割探討[J]. 辛國江,占艷,韋昌法,穆珺,周燃犀. 硅谷. 2014(13)
[8]基于SARMA模型的我國粗鋼產(chǎn)量時間序列分析與預測[J]. 廖冰清. 企業(yè)導報. 2012(24)
[9]一種基于關鍵點的時間序列聚類算法[J]. 謝福鼎,李迎,孫巖,張永. 計算機科學. 2012(03)
[10]基于方差波動多重分形特征的金融時間序列聚類[J]. 黃超,吳清烈,武忠,朱揚勇. 系統(tǒng)工程. 2006(06)
博士論文
[1]時間序列數(shù)據(jù)分類、檢索方法及應用研究[D]. 鄭毅.中國科學技術大學 2015
[2]時間序列數(shù)據(jù)挖掘若干關鍵問題研究[D]. 何曉旭.中國科學技術大學 2014
[3]時間序列數(shù)據(jù)挖掘中的維數(shù)約簡與預測方法研究[D]. 孫友強.中國科學技術大學 2014
碩士論文
[1]基于密度度量的大樣本時間序列聚類分析和預測方法研究[D]. 程佳宇.武漢大學 2018
[2]基于特性分析的交通流時間序列聚類[D]. 吳冕.北京交通大學 2017
[3]交通流時間序列的聚類分析方法及應用[D]. 李強.北京交通大學 2012
[4]模糊聚類分析技術及其應用研究[D]. 葉海軍.合肥工業(yè)大學 2006
本文編號:3296393
本文鏈接:http://www.sikaile.net/jiaoyulunwen/ktjx/3296393.html
教材專著