基于話題挖掘與情感分析的學習資源推薦研究
發(fā)布時間:2021-06-19 12:32
隨著大規(guī)模在線開放課程(MOOC,Massive online open course)的飛速發(fā)展,越來越多的學習者開始接受并利用在線學習方式獲取知識,在線學習平臺也隨之發(fā)展壯大。在各種學習平臺上,海量的學習資源和交互數據伴隨著學習者數量的增加不斷產生。面對這些數據時,學習者如何選擇合適的學習資源成為影響其參與在線課程學習效果的因素之一。由于學習者要花費大量的時間才能找到與自己學習風格和學習需求相符合的學習資源,增加了學習者的學習負擔、降低了其學習效率。課程討論文本是學習者對于課程知識內容、課程設置以及教學實施等方面的直接表述,是學習者真實學習狀態(tài)和學習需求的體現(xiàn)。通過對課程討論文本進行挖掘和分析為學習者推薦資源,有利于提高學習效率、快速而精確的匹配學習者學習需求、更好的實現(xiàn)個性化教育。本文的研究過程主要包括:第一,通過網絡爬蟲,獲取學習者參與在線互動過程中產生的課程討論文本數據,并對獲取到的數據進行去重、降噪以及去停用詞、分詞等預處理,構成本文實驗進行所需的語料庫;第二,通過收集整理構建基于基于課程討論的情感詞典;第三,利用LDA話題模型和基于詞典的情感分析方法實現(xiàn)針對學習者討論文本...
【文章來源】:江南大學江蘇省 211工程院校 教育部直屬院校
【文章頁數】:69 頁
【學位級別】:碩士
【部分圖文】:
研究思路
輩鬩約啊按駛恪輩闋槌傻娜?惚匆端鼓P停?文檔的生成過程是其核心。該模型認為文檔(document)是由許多個話題(topic)構成,而每個話題又是由許多的詞語(word)組成。其中,文檔的主題服從參數為的Dirichlet分布,主題中的單詞服從參數為的Dirichlet分布。因此,一個話題可以表示成以高頻率出現(xiàn)在文本中的詞匯的集合。所有文本對應的潛在話題集合具有一致性,文本可以通過觀測得到,但是話題無法直接獲取,借助LDA模型可以獲取文本的關鍵詞,用觀測到的文本來推測文本中蘊含的話題。LDA模型的生成過程圖如下圖2-1所示:圖2-1LDA模型的生成過程LDA話題模型作為本文進行話題挖掘的基礎,其數學推導過程主要有文本建模以及訓練過程(吉布斯采樣,GibbsSampling)[46]。其相關參數和變量意義如下表2-1所示。
分類的常用方法有支持向量機(SupportVectorMachines,SVM)、神經網絡(NeuralNetwork)、最大熵(MaximumEntropy,ME)、貝葉斯網絡(BayesianNetwork)等;在研究過程中還有一些其他技術不能被歸類于機器學習方法和基于詞典的方法,一般稱之為混合方法,比如形式概念分析(FormalConceptAnalysis,F(xiàn)CA)[50]以及模糊形式概念分析(FuzzyFormalConceptAnalysis,F(xiàn)FCA)[51],通過概念結構揭示目標及其屬性之間的關系,能夠有效識別不清晰、不完整的信息,被廣泛應用在不同的領域?傮w來看,基于文本的情感分析過程主要如下圖2-2所示。圖2-2文本情感分析基本過程從上圖可知,基于文本的情感分析過程主要分為4個部分:(1)數據來源選擇真實有效的數據對于實驗進行至關重要,因此,要根據實際需要和科學的分析對數據來源的平臺進行考查,從數據平臺中選擇高質量的、具有實際分析價值的數據。(2)數據處理為了使獲取的數據在后續(xù)的實驗中繼續(xù)保持著高質量,需要對從平臺中獲取的原始數據進行處理,剔除其中的無用數據、重復數據等信息。(3)情感極性識別在特征詞、情感詞抽取之后,情感極性識別是整個情感分析過程中最為重要的一部分,如果情感極性判斷有誤,其結果會直接影響整個實驗結果的準確性及有效性。(4)情感分析結果可視化在獲取到情感分析結果之后,要將分析結果通過圖表等直觀的可視化手段展示出來,以便為用戶或企業(yè)提供決策支持服務?紤]到在線課程文本數據數量以及實驗的準確性,利用情感詞典的方法進行情感分析,該方法主要依賴句子中積極情感詞和消極情感詞的出現(xiàn)次數來計算其整體的情感傾向?紤]到句子中程度副詞、否定詞的影響,其基本計算公式如下公式所示:Es=i=1nQwaiQwbiWi(2.7)
【參考文獻】:
期刊論文
[1]智慧教育視野中的學習分析與個性化資源推薦[J]. 劉敏,鄭明月. 中國電化教育. 2019(09)
[2]基于動態(tài)主題—情感演化模型的網絡輿情信息分析[J]. 朱曉霞,宋嘉欣,孟建芳. 情報科學. 2019(07)
[3]教育資源個性化推薦方法研究與實現(xiàn)[J]. 李文欣,文勇軍,唐立軍. 計算機技術與發(fā)展. 2019(06)
[4]智能化學習環(huán)境下資源推薦的影響因素及權重的探索[J]. 馬秀麟,梁靜,李小文,蘇幼園. 中國電化教育. 2019(03)
[5]國際教育大數據研究的熱點、前沿和趨勢——基于WOS數據庫的量化分析[J]. 蔣鑫,洪明. 中國遠程教育. 2019(02)
[6]基于表情符號的情感詞典的構建研究[J]. 林江豪,顧也力,周詠梅,陽愛民,陳錦. 計算機技術與發(fā)展. 2019(06)
[7]基于主題相似性的在線評論情感分析[J]. 崔雪蓮,那日薩,劉曉君. 系統(tǒng)管理學報. 2018(05)
[8]教師工作坊中學員話題挖掘方法及應用[J]. 何皓怡,劉清堂,吳林靜,鄧偉,郝怡雪. 中國電化教育. 2018(10)
[9]學習云空間中基于情感分析的學習推薦研究[J]. 黃昌勤,俞建慧,王希哲. 中國電化教育. 2018(10)
[10]基于論壇文本的互動話語分析模式構建與實踐[J]. 左明章,趙蓉,王志鋒,李香勇,徐燕麗. 電化教育研究. 2018(09)
碩士論文
[1]基于個性化推薦的在線學習系統(tǒng)研究與實現(xiàn)[D]. 鞏曉悅.北京郵電大學 2019
[2]基于LDA主題模型的在線評論聚類分析與推薦[D]. 楊凡.大連理工大學 2018
[3]基于行為日志數據的MOOC學習者學習行為分析研究[D]. 王敏.華東師范大學 2016
[4]基于Web文本的圖書評論傾向性分析方法的研究[D]. 郭書彤.東北師范大學 2015
[5]基于情感分類的產品評論垂直搜索引擎的研究[D]. 徐葉強.湖南工業(yè)大學 2012
[6]面向中文Web評論的情感分析技術研究[D]. 周城.國防科學技術大學 2011
本文編號:3237819
【文章來源】:江南大學江蘇省 211工程院校 教育部直屬院校
【文章頁數】:69 頁
【學位級別】:碩士
【部分圖文】:
研究思路
輩鬩約啊按駛恪輩闋槌傻娜?惚匆端鼓P停?文檔的生成過程是其核心。該模型認為文檔(document)是由許多個話題(topic)構成,而每個話題又是由許多的詞語(word)組成。其中,文檔的主題服從參數為的Dirichlet分布,主題中的單詞服從參數為的Dirichlet分布。因此,一個話題可以表示成以高頻率出現(xiàn)在文本中的詞匯的集合。所有文本對應的潛在話題集合具有一致性,文本可以通過觀測得到,但是話題無法直接獲取,借助LDA模型可以獲取文本的關鍵詞,用觀測到的文本來推測文本中蘊含的話題。LDA模型的生成過程圖如下圖2-1所示:圖2-1LDA模型的生成過程LDA話題模型作為本文進行話題挖掘的基礎,其數學推導過程主要有文本建模以及訓練過程(吉布斯采樣,GibbsSampling)[46]。其相關參數和變量意義如下表2-1所示。
分類的常用方法有支持向量機(SupportVectorMachines,SVM)、神經網絡(NeuralNetwork)、最大熵(MaximumEntropy,ME)、貝葉斯網絡(BayesianNetwork)等;在研究過程中還有一些其他技術不能被歸類于機器學習方法和基于詞典的方法,一般稱之為混合方法,比如形式概念分析(FormalConceptAnalysis,F(xiàn)CA)[50]以及模糊形式概念分析(FuzzyFormalConceptAnalysis,F(xiàn)FCA)[51],通過概念結構揭示目標及其屬性之間的關系,能夠有效識別不清晰、不完整的信息,被廣泛應用在不同的領域?傮w來看,基于文本的情感分析過程主要如下圖2-2所示。圖2-2文本情感分析基本過程從上圖可知,基于文本的情感分析過程主要分為4個部分:(1)數據來源選擇真實有效的數據對于實驗進行至關重要,因此,要根據實際需要和科學的分析對數據來源的平臺進行考查,從數據平臺中選擇高質量的、具有實際分析價值的數據。(2)數據處理為了使獲取的數據在后續(xù)的實驗中繼續(xù)保持著高質量,需要對從平臺中獲取的原始數據進行處理,剔除其中的無用數據、重復數據等信息。(3)情感極性識別在特征詞、情感詞抽取之后,情感極性識別是整個情感分析過程中最為重要的一部分,如果情感極性判斷有誤,其結果會直接影響整個實驗結果的準確性及有效性。(4)情感分析結果可視化在獲取到情感分析結果之后,要將分析結果通過圖表等直觀的可視化手段展示出來,以便為用戶或企業(yè)提供決策支持服務?紤]到在線課程文本數據數量以及實驗的準確性,利用情感詞典的方法進行情感分析,該方法主要依賴句子中積極情感詞和消極情感詞的出現(xiàn)次數來計算其整體的情感傾向?紤]到句子中程度副詞、否定詞的影響,其基本計算公式如下公式所示:Es=i=1nQwaiQwbiWi(2.7)
【參考文獻】:
期刊論文
[1]智慧教育視野中的學習分析與個性化資源推薦[J]. 劉敏,鄭明月. 中國電化教育. 2019(09)
[2]基于動態(tài)主題—情感演化模型的網絡輿情信息分析[J]. 朱曉霞,宋嘉欣,孟建芳. 情報科學. 2019(07)
[3]教育資源個性化推薦方法研究與實現(xiàn)[J]. 李文欣,文勇軍,唐立軍. 計算機技術與發(fā)展. 2019(06)
[4]智能化學習環(huán)境下資源推薦的影響因素及權重的探索[J]. 馬秀麟,梁靜,李小文,蘇幼園. 中國電化教育. 2019(03)
[5]國際教育大數據研究的熱點、前沿和趨勢——基于WOS數據庫的量化分析[J]. 蔣鑫,洪明. 中國遠程教育. 2019(02)
[6]基于表情符號的情感詞典的構建研究[J]. 林江豪,顧也力,周詠梅,陽愛民,陳錦. 計算機技術與發(fā)展. 2019(06)
[7]基于主題相似性的在線評論情感分析[J]. 崔雪蓮,那日薩,劉曉君. 系統(tǒng)管理學報. 2018(05)
[8]教師工作坊中學員話題挖掘方法及應用[J]. 何皓怡,劉清堂,吳林靜,鄧偉,郝怡雪. 中國電化教育. 2018(10)
[9]學習云空間中基于情感分析的學習推薦研究[J]. 黃昌勤,俞建慧,王希哲. 中國電化教育. 2018(10)
[10]基于論壇文本的互動話語分析模式構建與實踐[J]. 左明章,趙蓉,王志鋒,李香勇,徐燕麗. 電化教育研究. 2018(09)
碩士論文
[1]基于個性化推薦的在線學習系統(tǒng)研究與實現(xiàn)[D]. 鞏曉悅.北京郵電大學 2019
[2]基于LDA主題模型的在線評論聚類分析與推薦[D]. 楊凡.大連理工大學 2018
[3]基于行為日志數據的MOOC學習者學習行為分析研究[D]. 王敏.華東師范大學 2016
[4]基于Web文本的圖書評論傾向性分析方法的研究[D]. 郭書彤.東北師范大學 2015
[5]基于情感分類的產品評論垂直搜索引擎的研究[D]. 徐葉強.湖南工業(yè)大學 2012
[6]面向中文Web評論的情感分析技術研究[D]. 周城.國防科學技術大學 2011
本文編號:3237819
本文鏈接:http://www.sikaile.net/jiaoyulunwen/ktjx/3237819.html