基于機(jī)器學(xué)習(xí)的慕課論壇主題分類(lèi)研究
發(fā)布時(shí)間:2021-04-12 12:10
慕課(Massive open online courses,MOOC)的興起和發(fā)展,使得在線教育成為了現(xiàn)在最受歡迎的教育模式之一,如何改善在線教育的教學(xué)質(zhì)量也成為了數(shù)據(jù)挖掘中一個(gè)比較熱門(mén)的應(yīng)用研究方向。慕課論壇是慕課課程中學(xué)生與老師、助教進(jìn)行交流的唯一平臺(tái),是直接關(guān)乎到整個(gè)課程質(zhì)量的重要因素。對(duì)慕課論壇的主題進(jìn)行合理準(zhǔn)確的分類(lèi)可以幫助學(xué)生更好地交流和提問(wèn)問(wèn)題,更加有效率地解決學(xué)習(xí)中遇到的困難。以往對(duì)慕課論壇主題分類(lèi)的研究多是用自然語(yǔ)言處理或者文本分析的技術(shù),首先提取論壇文本的關(guān)鍵詞,然后利用關(guān)鍵詞構(gòu)建文本特征對(duì)論壇主題進(jìn)行分類(lèi)。但是由于不同課程的論壇內(nèi)容差異巨大,論壇用戶交流使用的語(yǔ)言多種多樣,導(dǎo)致在一個(gè)課程上訓(xùn)練好的主題分類(lèi)模型,很難直接從特定的論壇推廣應(yīng)用到其他論壇。針對(duì)這些問(wèn)題,本文提出了一種基于用戶行為特征的慕課論壇主題分類(lèi)框架。本文首先分析了最大的慕課平臺(tái)Coursera上60門(mén)課程的論壇用戶行為特征數(shù)據(jù),并收集分析了3門(mén)最熱的Coursera中英文課程的論壇文本數(shù)據(jù),證明了用戶行為特征數(shù)據(jù)也可以較好地區(qū)分不同種類(lèi)的慕課論壇主題。接著從主題的結(jié)構(gòu),主題的潛在社會(huì)網(wǎng)絡(luò),主題的...
【文章來(lái)源】:大連理工大學(xué)遼寧省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:65 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景與意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 基于論壇文本特征的慕課論壇主題分類(lèi)
1.2.2 基于用戶行為特征的慕課論壇主題分類(lèi)
1.3 主要內(nèi)容及章節(jié)安排
1.3.1 主要內(nèi)容
1.3.2 章節(jié)安排
2 相關(guān)理論及定義
2.1 引言
2.2 欠采樣學(xué)習(xí)算法
2.2.1 隨機(jī)欠采樣
2.2.2 原型生成欠采樣
2.2.3 原型選擇欠采樣
2.3 過(guò)采樣學(xué)習(xí)算法
2.3.1 隨機(jī)過(guò)采樣
2.3.2 樣本合成過(guò)采樣
2.4 代價(jià)敏感學(xué)習(xí)
2.4.1 代價(jià)敏感支持向量機(jī)
2.4.2 自適應(yīng)提升代價(jià)敏感算法
3 基于用戶行為特征的慕課論壇主題分類(lèi)
3.1 引言
3.2 主題文本特征
3.3 用戶行為特征
3.3.1 用戶行為特征分析
3.3.2 用戶行為特征選取
3.3.3 用戶行為特征可視化
3.4 主題分類(lèi)實(shí)驗(yàn)結(jié)果與分析
3.4.1 實(shí)驗(yàn)設(shè)置
3.4.2 評(píng)估準(zhǔn)則
3.4.3 實(shí)驗(yàn)結(jié)果分析
3.5 本章小結(jié)
4 基于特征融合的慕課論壇主題分類(lèi)
4.1 引言
4.2 梯度提升樹(shù)特征融合算法
4.2.1 梯度提升樹(shù)
4.2.2 單棵決策樹(shù)特征融合
4.2.3 梯度提升樹(shù)特征融合
4.3 主題分類(lèi)實(shí)驗(yàn)結(jié)果與分析
4.3.1 實(shí)驗(yàn)設(shè)置
4.3.2 實(shí)驗(yàn)結(jié)果與分析
4.4 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表學(xué)術(shù)論文情況
致謝
【參考文獻(xiàn)】:
期刊論文
[1]基于MOOC數(shù)據(jù)的學(xué)習(xí)行為分析與預(yù)測(cè)[J]. 蔣卓軒,張巖,李曉明. 計(jì)算機(jī)研究與發(fā)展. 2015(03)
[2]文本分類(lèi)中詞語(yǔ)權(quán)重計(jì)算方法的改進(jìn)與應(yīng)用[J]. 熊忠陽(yáng),黎剛,陳小莉,陳偉. 計(jì)算機(jī)工程與應(yīng)用. 2008(05)
[3]基于信息增益的特征詞權(quán)重調(diào)整算法研究[J]. 張玉芳,陳小莉,熊忠陽(yáng). 計(jì)算機(jī)工程與應(yīng)用. 2007(35)
[4]基于文本分類(lèi)TFIDF方法的改進(jìn)與應(yīng)用[J]. 張玉芳,彭時(shí)名,呂佳. 計(jì)算機(jī)工程. 2006(19)
本文編號(hào):3133271
【文章來(lái)源】:大連理工大學(xué)遼寧省 211工程院校 985工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:65 頁(yè)
【學(xué)位級(jí)別】:碩士
【文章目錄】:
摘要
Abstract
1 緒論
1.1 研究背景與意義
1.2 國(guó)內(nèi)外研究現(xiàn)狀
1.2.1 基于論壇文本特征的慕課論壇主題分類(lèi)
1.2.2 基于用戶行為特征的慕課論壇主題分類(lèi)
1.3 主要內(nèi)容及章節(jié)安排
1.3.1 主要內(nèi)容
1.3.2 章節(jié)安排
2 相關(guān)理論及定義
2.1 引言
2.2 欠采樣學(xué)習(xí)算法
2.2.1 隨機(jī)欠采樣
2.2.2 原型生成欠采樣
2.2.3 原型選擇欠采樣
2.3 過(guò)采樣學(xué)習(xí)算法
2.3.1 隨機(jī)過(guò)采樣
2.3.2 樣本合成過(guò)采樣
2.4 代價(jià)敏感學(xué)習(xí)
2.4.1 代價(jià)敏感支持向量機(jī)
2.4.2 自適應(yīng)提升代價(jià)敏感算法
3 基于用戶行為特征的慕課論壇主題分類(lèi)
3.1 引言
3.2 主題文本特征
3.3 用戶行為特征
3.3.1 用戶行為特征分析
3.3.2 用戶行為特征選取
3.3.3 用戶行為特征可視化
3.4 主題分類(lèi)實(shí)驗(yàn)結(jié)果與分析
3.4.1 實(shí)驗(yàn)設(shè)置
3.4.2 評(píng)估準(zhǔn)則
3.4.3 實(shí)驗(yàn)結(jié)果分析
3.5 本章小結(jié)
4 基于特征融合的慕課論壇主題分類(lèi)
4.1 引言
4.2 梯度提升樹(shù)特征融合算法
4.2.1 梯度提升樹(shù)
4.2.2 單棵決策樹(shù)特征融合
4.2.3 梯度提升樹(shù)特征融合
4.3 主題分類(lèi)實(shí)驗(yàn)結(jié)果與分析
4.3.1 實(shí)驗(yàn)設(shè)置
4.3.2 實(shí)驗(yàn)結(jié)果與分析
4.4 本章小結(jié)
結(jié)論
參考文獻(xiàn)
攻讀碩士學(xué)位期間發(fā)表學(xué)術(shù)論文情況
致謝
【參考文獻(xiàn)】:
期刊論文
[1]基于MOOC數(shù)據(jù)的學(xué)習(xí)行為分析與預(yù)測(cè)[J]. 蔣卓軒,張巖,李曉明. 計(jì)算機(jī)研究與發(fā)展. 2015(03)
[2]文本分類(lèi)中詞語(yǔ)權(quán)重計(jì)算方法的改進(jìn)與應(yīng)用[J]. 熊忠陽(yáng),黎剛,陳小莉,陳偉. 計(jì)算機(jī)工程與應(yīng)用. 2008(05)
[3]基于信息增益的特征詞權(quán)重調(diào)整算法研究[J]. 張玉芳,陳小莉,熊忠陽(yáng). 計(jì)算機(jī)工程與應(yīng)用. 2007(35)
[4]基于文本分類(lèi)TFIDF方法的改進(jìn)與應(yīng)用[J]. 張玉芳,彭時(shí)名,呂佳. 計(jì)算機(jī)工程. 2006(19)
本文編號(hào):3133271
本文鏈接:http://www.sikaile.net/kejilunwen/zidonghuakongzhilunwen/3133271.html
最近更新
教材專(zhuān)著