基于話(huà)題挖掘與情感分析的學(xué)習(xí)資源推薦研究
發(fā)布時(shí)間:2021-06-19 12:32
隨著大規(guī)模在線(xiàn)開(kāi)放課程(MOOC,Massive online open course)的飛速發(fā)展,越來(lái)越多的學(xué)習(xí)者開(kāi)始接受并利用在線(xiàn)學(xué)習(xí)方式獲取知識(shí),在線(xiàn)學(xué)習(xí)平臺(tái)也隨之發(fā)展壯大。在各種學(xué)習(xí)平臺(tái)上,海量的學(xué)習(xí)資源和交互數(shù)據(jù)伴隨著學(xué)習(xí)者數(shù)量的增加不斷產(chǎn)生。面對(duì)這些數(shù)據(jù)時(shí),學(xué)習(xí)者如何選擇合適的學(xué)習(xí)資源成為影響其參與在線(xiàn)課程學(xué)習(xí)效果的因素之一。由于學(xué)習(xí)者要花費(fèi)大量的時(shí)間才能找到與自己學(xué)習(xí)風(fēng)格和學(xué)習(xí)需求相符合的學(xué)習(xí)資源,增加了學(xué)習(xí)者的學(xué)習(xí)負(fù)擔(dān)、降低了其學(xué)習(xí)效率。課程討論文本是學(xué)習(xí)者對(duì)于課程知識(shí)內(nèi)容、課程設(shè)置以及教學(xué)實(shí)施等方面的直接表述,是學(xué)習(xí)者真實(shí)學(xué)習(xí)狀態(tài)和學(xué)習(xí)需求的體現(xiàn)。通過(guò)對(duì)課程討論文本進(jìn)行挖掘和分析為學(xué)習(xí)者推薦資源,有利于提高學(xué)習(xí)效率、快速而精確的匹配學(xué)習(xí)者學(xué)習(xí)需求、更好的實(shí)現(xiàn)個(gè)性化教育。本文的研究過(guò)程主要包括:第一,通過(guò)網(wǎng)絡(luò)爬蟲(chóng),獲取學(xué)習(xí)者參與在線(xiàn)互動(dòng)過(guò)程中產(chǎn)生的課程討論文本數(shù)據(jù),并對(duì)獲取到的數(shù)據(jù)進(jìn)行去重、降噪以及去停用詞、分詞等預(yù)處理,構(gòu)成本文實(shí)驗(yàn)進(jìn)行所需的語(yǔ)料庫(kù);第二,通過(guò)收集整理構(gòu)建基于基于課程討論的情感詞典;第三,利用LDA話(huà)題模型和基于詞典的情感分析方法實(shí)現(xiàn)針對(duì)學(xué)習(xí)者討論文本...
【文章來(lái)源】:江南大學(xué)江蘇省 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:69 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
研究思路
輩鬩約啊按駛恪輩闋槌傻娜?惚匆端鼓P停?文檔的生成過(guò)程是其核心。該模型認(rèn)為文檔(document)是由許多個(gè)話(huà)題(topic)構(gòu)成,而每個(gè)話(huà)題又是由許多的詞語(yǔ)(word)組成。其中,文檔的主題服從參數(shù)為的Dirichlet分布,主題中的單詞服從參數(shù)為的Dirichlet分布。因此,一個(gè)話(huà)題可以表示成以高頻率出現(xiàn)在文本中的詞匯的集合。所有文本對(duì)應(yīng)的潛在話(huà)題集合具有一致性,文本可以通過(guò)觀(guān)測(cè)得到,但是話(huà)題無(wú)法直接獲取,借助LDA模型可以獲取文本的關(guān)鍵詞,用觀(guān)測(cè)到的文本來(lái)推測(cè)文本中蘊(yùn)含的話(huà)題。LDA模型的生成過(guò)程圖如下圖2-1所示:圖2-1LDA模型的生成過(guò)程LDA話(huà)題模型作為本文進(jìn)行話(huà)題挖掘的基礎(chǔ),其數(shù)學(xué)推導(dǎo)過(guò)程主要有文本建模以及訓(xùn)練過(guò)程(吉布斯采樣,GibbsSampling)[46]。其相關(guān)參數(shù)和變量意義如下表2-1所示。
分類(lèi)的常用方法有支持向量機(jī)(SupportVectorMachines,SVM)、神經(jīng)網(wǎng)絡(luò)(NeuralNetwork)、最大熵(MaximumEntropy,ME)、貝葉斯網(wǎng)絡(luò)(BayesianNetwork)等;在研究過(guò)程中還有一些其他技術(shù)不能被歸類(lèi)于機(jī)器學(xué)習(xí)方法和基于詞典的方法,一般稱(chēng)之為混合方法,比如形式概念分析(FormalConceptAnalysis,F(xiàn)CA)[50]以及模糊形式概念分析(FuzzyFormalConceptAnalysis,F(xiàn)FCA)[51],通過(guò)概念結(jié)構(gòu)揭示目標(biāo)及其屬性之間的關(guān)系,能夠有效識(shí)別不清晰、不完整的信息,被廣泛應(yīng)用在不同的領(lǐng)域?傮w來(lái)看,基于文本的情感分析過(guò)程主要如下圖2-2所示。圖2-2文本情感分析基本過(guò)程從上圖可知,基于文本的情感分析過(guò)程主要分為4個(gè)部分:(1)數(shù)據(jù)來(lái)源選擇真實(shí)有效的數(shù)據(jù)對(duì)于實(shí)驗(yàn)進(jìn)行至關(guān)重要,因此,要根據(jù)實(shí)際需要和科學(xué)的分析對(duì)數(shù)據(jù)來(lái)源的平臺(tái)進(jìn)行考查,從數(shù)據(jù)平臺(tái)中選擇高質(zhì)量的、具有實(shí)際分析價(jià)值的數(shù)據(jù)。(2)數(shù)據(jù)處理為了使獲取的數(shù)據(jù)在后續(xù)的實(shí)驗(yàn)中繼續(xù)保持著高質(zhì)量,需要對(duì)從平臺(tái)中獲取的原始數(shù)據(jù)進(jìn)行處理,剔除其中的無(wú)用數(shù)據(jù)、重復(fù)數(shù)據(jù)等信息。(3)情感極性識(shí)別在特征詞、情感詞抽取之后,情感極性識(shí)別是整個(gè)情感分析過(guò)程中最為重要的一部分,如果情感極性判斷有誤,其結(jié)果會(huì)直接影響整個(gè)實(shí)驗(yàn)結(jié)果的準(zhǔn)確性及有效性。(4)情感分析結(jié)果可視化在獲取到情感分析結(jié)果之后,要將分析結(jié)果通過(guò)圖表等直觀(guān)的可視化手段展示出來(lái),以便為用戶(hù)或企業(yè)提供決策支持服務(wù)。考慮到在線(xiàn)課程文本數(shù)據(jù)數(shù)量以及實(shí)驗(yàn)的準(zhǔn)確性,利用情感詞典的方法進(jìn)行情感分析,該方法主要依賴(lài)句子中積極情感詞和消極情感詞的出現(xiàn)次數(shù)來(lái)計(jì)算其整體的情感傾向。考慮到句子中程度副詞、否定詞的影響,其基本計(jì)算公式如下公式所示:Es=i=1nQwaiQwbiWi(2.7)
【參考文獻(xiàn)】:
期刊論文
[1]智慧教育視野中的學(xué)習(xí)分析與個(gè)性化資源推薦[J]. 劉敏,鄭明月. 中國(guó)電化教育. 2019(09)
[2]基于動(dòng)態(tài)主題—情感演化模型的網(wǎng)絡(luò)輿情信息分析[J]. 朱曉霞,宋嘉欣,孟建芳. 情報(bào)科學(xué). 2019(07)
[3]教育資源個(gè)性化推薦方法研究與實(shí)現(xiàn)[J]. 李文欣,文勇軍,唐立軍. 計(jì)算機(jī)技術(shù)與發(fā)展. 2019(06)
[4]智能化學(xué)習(xí)環(huán)境下資源推薦的影響因素及權(quán)重的探索[J]. 馬秀麟,梁靜,李小文,蘇幼園. 中國(guó)電化教育. 2019(03)
[5]國(guó)際教育大數(shù)據(jù)研究的熱點(diǎn)、前沿和趨勢(shì)——基于WOS數(shù)據(jù)庫(kù)的量化分析[J]. 蔣鑫,洪明. 中國(guó)遠(yuǎn)程教育. 2019(02)
[6]基于表情符號(hào)的情感詞典的構(gòu)建研究[J]. 林江豪,顧也力,周詠梅,陽(yáng)愛(ài)民,陳錦. 計(jì)算機(jī)技術(shù)與發(fā)展. 2019(06)
[7]基于主題相似性的在線(xiàn)評(píng)論情感分析[J]. 崔雪蓮,那日薩,劉曉君. 系統(tǒng)管理學(xué)報(bào). 2018(05)
[8]教師工作坊中學(xué)員話(huà)題挖掘方法及應(yīng)用[J]. 何皓怡,劉清堂,吳林靜,鄧偉,郝怡雪. 中國(guó)電化教育. 2018(10)
[9]學(xué)習(xí)云空間中基于情感分析的學(xué)習(xí)推薦研究[J]. 黃昌勤,俞建慧,王希哲. 中國(guó)電化教育. 2018(10)
[10]基于論壇文本的互動(dòng)話(huà)語(yǔ)分析模式構(gòu)建與實(shí)踐[J]. 左明章,趙蓉,王志鋒,李香勇,徐燕麗. 電化教育研究. 2018(09)
碩士論文
[1]基于個(gè)性化推薦的在線(xiàn)學(xué)習(xí)系統(tǒng)研究與實(shí)現(xiàn)[D]. 鞏曉悅.北京郵電大學(xué) 2019
[2]基于LDA主題模型的在線(xiàn)評(píng)論聚類(lèi)分析與推薦[D]. 楊凡.大連理工大學(xué) 2018
[3]基于行為日志數(shù)據(jù)的MOOC學(xué)習(xí)者學(xué)習(xí)行為分析研究[D]. 王敏.華東師范大學(xué) 2016
[4]基于Web文本的圖書(shū)評(píng)論傾向性分析方法的研究[D]. 郭書(shū)彤.東北師范大學(xué) 2015
[5]基于情感分類(lèi)的產(chǎn)品評(píng)論垂直搜索引擎的研究[D]. 徐葉強(qiáng).湖南工業(yè)大學(xué) 2012
[6]面向中文Web評(píng)論的情感分析技術(shù)研究[D]. 周城.國(guó)防科學(xué)技術(shù)大學(xué) 2011
本文編號(hào):3237819
【文章來(lái)源】:江南大學(xué)江蘇省 211工程院校 教育部直屬院校
【文章頁(yè)數(shù)】:69 頁(yè)
【學(xué)位級(jí)別】:碩士
【部分圖文】:
研究思路
輩鬩約啊按駛恪輩闋槌傻娜?惚匆端鼓P停?文檔的生成過(guò)程是其核心。該模型認(rèn)為文檔(document)是由許多個(gè)話(huà)題(topic)構(gòu)成,而每個(gè)話(huà)題又是由許多的詞語(yǔ)(word)組成。其中,文檔的主題服從參數(shù)為的Dirichlet分布,主題中的單詞服從參數(shù)為的Dirichlet分布。因此,一個(gè)話(huà)題可以表示成以高頻率出現(xiàn)在文本中的詞匯的集合。所有文本對(duì)應(yīng)的潛在話(huà)題集合具有一致性,文本可以通過(guò)觀(guān)測(cè)得到,但是話(huà)題無(wú)法直接獲取,借助LDA模型可以獲取文本的關(guān)鍵詞,用觀(guān)測(cè)到的文本來(lái)推測(cè)文本中蘊(yùn)含的話(huà)題。LDA模型的生成過(guò)程圖如下圖2-1所示:圖2-1LDA模型的生成過(guò)程LDA話(huà)題模型作為本文進(jìn)行話(huà)題挖掘的基礎(chǔ),其數(shù)學(xué)推導(dǎo)過(guò)程主要有文本建模以及訓(xùn)練過(guò)程(吉布斯采樣,GibbsSampling)[46]。其相關(guān)參數(shù)和變量意義如下表2-1所示。
分類(lèi)的常用方法有支持向量機(jī)(SupportVectorMachines,SVM)、神經(jīng)網(wǎng)絡(luò)(NeuralNetwork)、最大熵(MaximumEntropy,ME)、貝葉斯網(wǎng)絡(luò)(BayesianNetwork)等;在研究過(guò)程中還有一些其他技術(shù)不能被歸類(lèi)于機(jī)器學(xué)習(xí)方法和基于詞典的方法,一般稱(chēng)之為混合方法,比如形式概念分析(FormalConceptAnalysis,F(xiàn)CA)[50]以及模糊形式概念分析(FuzzyFormalConceptAnalysis,F(xiàn)FCA)[51],通過(guò)概念結(jié)構(gòu)揭示目標(biāo)及其屬性之間的關(guān)系,能夠有效識(shí)別不清晰、不完整的信息,被廣泛應(yīng)用在不同的領(lǐng)域?傮w來(lái)看,基于文本的情感分析過(guò)程主要如下圖2-2所示。圖2-2文本情感分析基本過(guò)程從上圖可知,基于文本的情感分析過(guò)程主要分為4個(gè)部分:(1)數(shù)據(jù)來(lái)源選擇真實(shí)有效的數(shù)據(jù)對(duì)于實(shí)驗(yàn)進(jìn)行至關(guān)重要,因此,要根據(jù)實(shí)際需要和科學(xué)的分析對(duì)數(shù)據(jù)來(lái)源的平臺(tái)進(jìn)行考查,從數(shù)據(jù)平臺(tái)中選擇高質(zhì)量的、具有實(shí)際分析價(jià)值的數(shù)據(jù)。(2)數(shù)據(jù)處理為了使獲取的數(shù)據(jù)在后續(xù)的實(shí)驗(yàn)中繼續(xù)保持著高質(zhì)量,需要對(duì)從平臺(tái)中獲取的原始數(shù)據(jù)進(jìn)行處理,剔除其中的無(wú)用數(shù)據(jù)、重復(fù)數(shù)據(jù)等信息。(3)情感極性識(shí)別在特征詞、情感詞抽取之后,情感極性識(shí)別是整個(gè)情感分析過(guò)程中最為重要的一部分,如果情感極性判斷有誤,其結(jié)果會(huì)直接影響整個(gè)實(shí)驗(yàn)結(jié)果的準(zhǔn)確性及有效性。(4)情感分析結(jié)果可視化在獲取到情感分析結(jié)果之后,要將分析結(jié)果通過(guò)圖表等直觀(guān)的可視化手段展示出來(lái),以便為用戶(hù)或企業(yè)提供決策支持服務(wù)。考慮到在線(xiàn)課程文本數(shù)據(jù)數(shù)量以及實(shí)驗(yàn)的準(zhǔn)確性,利用情感詞典的方法進(jìn)行情感分析,該方法主要依賴(lài)句子中積極情感詞和消極情感詞的出現(xiàn)次數(shù)來(lái)計(jì)算其整體的情感傾向。考慮到句子中程度副詞、否定詞的影響,其基本計(jì)算公式如下公式所示:Es=i=1nQwaiQwbiWi(2.7)
【參考文獻(xiàn)】:
期刊論文
[1]智慧教育視野中的學(xué)習(xí)分析與個(gè)性化資源推薦[J]. 劉敏,鄭明月. 中國(guó)電化教育. 2019(09)
[2]基于動(dòng)態(tài)主題—情感演化模型的網(wǎng)絡(luò)輿情信息分析[J]. 朱曉霞,宋嘉欣,孟建芳. 情報(bào)科學(xué). 2019(07)
[3]教育資源個(gè)性化推薦方法研究與實(shí)現(xiàn)[J]. 李文欣,文勇軍,唐立軍. 計(jì)算機(jī)技術(shù)與發(fā)展. 2019(06)
[4]智能化學(xué)習(xí)環(huán)境下資源推薦的影響因素及權(quán)重的探索[J]. 馬秀麟,梁靜,李小文,蘇幼園. 中國(guó)電化教育. 2019(03)
[5]國(guó)際教育大數(shù)據(jù)研究的熱點(diǎn)、前沿和趨勢(shì)——基于WOS數(shù)據(jù)庫(kù)的量化分析[J]. 蔣鑫,洪明. 中國(guó)遠(yuǎn)程教育. 2019(02)
[6]基于表情符號(hào)的情感詞典的構(gòu)建研究[J]. 林江豪,顧也力,周詠梅,陽(yáng)愛(ài)民,陳錦. 計(jì)算機(jī)技術(shù)與發(fā)展. 2019(06)
[7]基于主題相似性的在線(xiàn)評(píng)論情感分析[J]. 崔雪蓮,那日薩,劉曉君. 系統(tǒng)管理學(xué)報(bào). 2018(05)
[8]教師工作坊中學(xué)員話(huà)題挖掘方法及應(yīng)用[J]. 何皓怡,劉清堂,吳林靜,鄧偉,郝怡雪. 中國(guó)電化教育. 2018(10)
[9]學(xué)習(xí)云空間中基于情感分析的學(xué)習(xí)推薦研究[J]. 黃昌勤,俞建慧,王希哲. 中國(guó)電化教育. 2018(10)
[10]基于論壇文本的互動(dòng)話(huà)語(yǔ)分析模式構(gòu)建與實(shí)踐[J]. 左明章,趙蓉,王志鋒,李香勇,徐燕麗. 電化教育研究. 2018(09)
碩士論文
[1]基于個(gè)性化推薦的在線(xiàn)學(xué)習(xí)系統(tǒng)研究與實(shí)現(xiàn)[D]. 鞏曉悅.北京郵電大學(xué) 2019
[2]基于LDA主題模型的在線(xiàn)評(píng)論聚類(lèi)分析與推薦[D]. 楊凡.大連理工大學(xué) 2018
[3]基于行為日志數(shù)據(jù)的MOOC學(xué)習(xí)者學(xué)習(xí)行為分析研究[D]. 王敏.華東師范大學(xué) 2016
[4]基于Web文本的圖書(shū)評(píng)論傾向性分析方法的研究[D]. 郭書(shū)彤.東北師范大學(xué) 2015
[5]基于情感分類(lèi)的產(chǎn)品評(píng)論垂直搜索引擎的研究[D]. 徐葉強(qiáng).湖南工業(yè)大學(xué) 2012
[6]面向中文Web評(píng)論的情感分析技術(shù)研究[D]. 周城.國(guó)防科學(xué)技術(shù)大學(xué) 2011
本文編號(hào):3237819
本文鏈接:http://www.sikaile.net/jiaoyulunwen/ktjx/3237819.html
最近更新
教材專(zhuān)著