大型開(kāi)放式在線教育中大數(shù)據(jù)的文本分類研究
本文關(guān)鍵詞:大型開(kāi)放式在線教育中大數(shù)據(jù)的文本分類研究,由筆耕文化傳播整理發(fā)布。
【摘要】:“互聯(lián)網(wǎng)+”是當(dāng)前應(yīng)對(duì)經(jīng)濟(jì)結(jié)構(gòu)轉(zhuǎn)型,創(chuàng)建經(jīng)濟(jì)新增長(zhǎng)點(diǎn)的一個(gè)重要突破。電信業(yè)、制造業(yè)、金融業(yè)等傳統(tǒng)產(chǎn)業(yè)都在進(jìn)一步地與互聯(lián)網(wǎng)相融合!盎ヂ(lián)網(wǎng)+傳統(tǒng)產(chǎn)業(yè)”的模式正成為國(guó)家發(fā)展的重要戰(zhàn)略!盎ヂ(lián)網(wǎng)+傳統(tǒng)教育”即大型開(kāi)放式網(wǎng)絡(luò)課程(Massively Open Online Courses,MOOC)作為現(xiàn)代教育的一種新趨勢(shì),越來(lái)越受到各個(gè)方面的關(guān)注。然而,跟蹤MOOC網(wǎng)站上用戶的行為并從他們反饋的大數(shù)據(jù)中挖掘出有效信息為決策者提供支持是當(dāng)前面臨的主要問(wèn)題。為此,本課題將針對(duì)大型開(kāi)放式網(wǎng)絡(luò)課程的特點(diǎn)使用大數(shù)據(jù)在文本分類分析過(guò)程中的一些關(guān)鍵性技術(shù)對(duì)MOOC網(wǎng)站上抓取到的大量用戶評(píng)論數(shù)據(jù)進(jìn)行情感傾向預(yù)測(cè)分類。本文的主要思路是:首先通過(guò)介紹大數(shù)據(jù)分析和數(shù)據(jù)挖掘的相關(guān)理論與技術(shù)明確本課題的研究?jī)?nèi)容是分布式分類計(jì)算;其次闡述與本課題相關(guān)的幾種分類算法以及它們的Map Reduce并行化方式;然后給出對(duì)MOOC網(wǎng)站上的用戶評(píng)論內(nèi)容通過(guò)文本向量化和特征選擇法相結(jié)合進(jìn)行情感傾向分類的流程;最后參照前文的流程和方法進(jìn)行算法實(shí)驗(yàn),對(duì)比得出最優(yōu)實(shí)驗(yàn)組合,并使用最優(yōu)實(shí)驗(yàn)組合對(duì)網(wǎng)易公開(kāi)課中抓取到的大量用戶評(píng)論數(shù)據(jù)進(jìn)行文本的情感傾向預(yù)測(cè)分類。
【關(guān)鍵詞】:大數(shù)據(jù) 數(shù)據(jù)挖掘 分布式計(jì)算 文本情感分類 Massively Open Online Courses
【學(xué)位授予單位】:西華師范大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2016
【分類號(hào)】:TP391.1;G434
【目錄】:
- 摘要5-6
- Abstract6-7
- 第1章 前言7-12
- 1.1 課題背景7-8
- 1.2 研究意義8-9
- 1.3 國(guó)內(nèi)外研究現(xiàn)狀9-10
- 1.4 課題主要研究?jī)?nèi)容10-12
- 第2章 大數(shù)據(jù)相關(guān)理論與技術(shù)12-22
- 2.1 大數(shù)據(jù)及其相關(guān)技術(shù)12-13
- 2.1.1 大數(shù)據(jù)的定義12-13
- 2.2 大數(shù)據(jù)相關(guān)技術(shù)13-19
- 2.3 大數(shù)據(jù)分析19-22
- 2.3.1 數(shù)據(jù)探索和數(shù)據(jù)挖掘20
- 2.3.2 數(shù)據(jù)挖掘20-22
- 第3章 分布式分類計(jì)算22-32
- 3.1 分類預(yù)測(cè)22-27
- 3.1.1 分布式分類計(jì)算22-23
- 3.1.2 分類原理23-24
- 3.1.3 文本情感分類的流程24-27
- 3.2 相似性度量27-28
- 3.3 最近鄰KNN分類28-30
- 3.3.1 KNN基本原理28-29
- 3.3.2 KNN MapReduce并行化29-30
- 3.4 質(zhì)心分類30
- 3.4.1 質(zhì)心分類的基本原理30
- 3.4.2 質(zhì)心分類并行化30
- 3.5 貪婪貝葉斯30-31
- 3.6 支持向量機(jī)31-32
- 第4章 MOOC網(wǎng)站中用戶評(píng)論的文本情感分類過(guò)程32-38
- 4.1 文本情感分類的方法32-33
- 4.2 文本情感分類33-36
- 4.2.1 數(shù)據(jù)收集33-34
- 4.2.2 文本向量化34-36
- 4.2.3 特征選擇36
- 4.3 用戶評(píng)論數(shù)據(jù)情感分類36-38
- 第5章 算法實(shí)驗(yàn)38-42
- 5.1 實(shí)驗(yàn)環(huán)境搭建38-40
- 5.1.1 集群規(guī)劃38
- 5.1.2 軟件準(zhǔn)備38-40
- 5.2 實(shí)驗(yàn)數(shù)據(jù)40
- 5.3 實(shí)驗(yàn)過(guò)程和結(jié)果40-42
- 第6章 總結(jié)與展望42-44
- 6.1 本課題的研究總結(jié)42
- 6.2 本課題的創(chuàng)新之處42-43
- 6.3 本課題的不足以及對(duì)未來(lái)工作的展望43-44
- 參考文獻(xiàn)44-46
- 致謝46-49
- 在學(xué)期間的科研情況49
【相似文獻(xiàn)】
中國(guó)期刊全文數(shù)據(jù)庫(kù) 前10條
1 葉真;讓笑聲給教學(xué)帶來(lái)生機(jī)[J];成都體院學(xué)報(bào);1987年04期
2 白冰;;虛構(gòu)·假說(shuō)·磨玉——情感傾向的生成[J];赤峰學(xué)院學(xué)報(bào)(漢文哲學(xué)社會(huì)科學(xué)版);2007年02期
3 劉洪高;;談《荷塘月色》的情感傾向[J];荊州師專學(xué)報(bào);1993年03期
4 少木森;;青年教師的職業(yè)情感傾向初探[J];思想政治課教學(xué);1987年06期
5 劉曉琦;;語(yǔ)文教學(xué)應(yīng)體現(xiàn)教師的情感傾向[J];現(xiàn)代語(yǔ)文(文學(xué)研究);2011年07期
6 姚璽;;支持資源作用下的工作-家庭促進(jìn):情感傾向的調(diào)節(jié)作用[J];經(jīng)營(yíng)管理者;2013年05期
7 張有志;;探尋文字風(fēng)格之美[J];同學(xué)少年;2008年12期
8 劉鳳英;;青春期學(xué)生情感傾向調(diào)查及引導(dǎo)[J];中小學(xué)心理健康教育;2008年14期
9 周來(lái)祥;;談共鳴問(wèn)題[J];山東大學(xué)學(xué)報(bào)(中國(guó)語(yǔ)言文學(xué)版);1961年S4期
10 劉曉紅;;動(dòng)物成語(yǔ)與漢民族的情感傾向[J];語(yǔ)文知識(shí);2000年04期
中國(guó)重要會(huì)議論文全文數(shù)據(jù)庫(kù) 前4條
1 楊江;侯敏;王寧;;基于主題情感句的漢語(yǔ)評(píng)論文傾向性分析[A];第五屆全國(guó)青年計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2010年
2 林慧恩;林世平;;中文情感傾向分析中主觀句子抽取方法的研究[A];全國(guó)第20屆計(jì)算機(jī)技術(shù)與應(yīng)用學(xué)術(shù)會(huì)議(CACIS·2009)暨全國(guó)第1屆安全關(guān)鍵技術(shù)與應(yīng)用學(xué)術(shù)會(huì)議論文集(上冊(cè))[C];2009年
3 王素格;楊安娜;;一種混合語(yǔ)言信息的詞語(yǔ)搭配傾向判別方法[A];第五屆全國(guó)信息檢索學(xué)術(shù)會(huì)議論文集[C];2009年
4 宋曉雷;王素格;李紅霞;;基于概率潛在語(yǔ)義分析的詞匯情感傾向判別[A];第五屆全國(guó)青年計(jì)算語(yǔ)言學(xué)研討會(huì)論文集[C];2010年
中國(guó)重要報(bào)紙全文數(shù)據(jù)庫(kù) 前3條
1 唐楠;新聞應(yīng)避免情感傾向[N];中國(guó)新聞出版報(bào);2005年
2 魯東;不盡鄉(xiāng)情入畫(huà)來(lái)[N];中國(guó)文化報(bào);2001年
3 楊勇濤;讓攝影喚起心靈的本真[N];中國(guó)攝影報(bào);2005年
中國(guó)博士學(xué)位論文全文數(shù)據(jù)庫(kù) 前6條
1 房磊;融合知識(shí)的情感分析研究[D];清華大學(xué);2015年
2 張奇;細(xì)顆粒度情感傾向分析若干關(guān)鍵問(wèn)題研究[D];復(fù)旦大學(xué);2008年
3 王素格;基于Web的評(píng)論文本情感分類問(wèn)題研究[D];上海大學(xué);2008年
4 楊卉;Web文本觀點(diǎn)挖掘及隱含情感傾向的研究[D];吉林大學(xué);2011年
5 李思;WEB觀點(diǎn)挖掘中關(guān)鍵問(wèn)題的研究[D];北京郵電大學(xué);2012年
6 李方濤;基于產(chǎn)品評(píng)論的情感分析研究[D];清華大學(xué);2011年
中國(guó)碩士學(xué)位論文全文數(shù)據(jù)庫(kù) 前10條
1 王帥;情感分析的特征提取算法與觀點(diǎn)的聚類算法研究[D];昆明理工大學(xué);2015年
2 馮金剛;網(wǎng)絡(luò)輿情中文信息情感傾向分析研究[D];華北電力大學(xué);2015年
3 魏從源;網(wǎng)絡(luò)信息的情感傾向分類技術(shù)研究[D];國(guó)防科學(xué)技術(shù)大學(xué);2013年
4 周冬衛(wèi);中文微博評(píng)論的情感傾向分析[D];華東交通大學(xué);2015年
5 吳斐;跨領(lǐng)域條件下詞匯情感傾向判別方法研究[D];合肥工業(yè)大學(xué);2015年
6 徐凱;基于產(chǎn)品特征的用戶評(píng)論情感傾向分析研究[D];合肥工業(yè)大學(xué);2015年
7 王格;網(wǎng)絡(luò)評(píng)論的情感傾向分析[D];武漢工程大學(xué);2015年
8 劉其;基于用戶評(píng)論的群體情緒識(shí)別與演化研究[D];東華大學(xué);2015年
9 張佳明;微博話題的公眾情感分析技術(shù)研究[D];解放軍信息工程大學(xué);2015年
10 唐浩浩;面向事件的微博情感傾向性分析技術(shù)研究[D];解放軍信息工程大學(xué);2014年
本文關(guān)鍵詞:大型開(kāi)放式在線教育中大數(shù)據(jù)的文本分類研究,由筆耕文化傳播整理發(fā)布。
,本文編號(hào):459688
本文鏈接:http://www.sikaile.net/jiaoyulunwen/jiaoyutizhilunwen/459688.html