面向高教人才培養(yǎng)質(zhì)量社會評價(jià)的文本分析方法研究
發(fā)布時(shí)間:2022-11-06 12:39
隨著國家教育事業(yè)的蓬勃發(fā)展,關(guān)于人才素質(zhì)的培養(yǎng)不斷受到重視,“數(shù)據(jù)驅(qū)動學(xué)校,分析變革教育”的大數(shù)據(jù)時(shí)代已經(jīng)到來。緊隨著移動互聯(lián)網(wǎng)的快速發(fā)展,使得網(wǎng)絡(luò)中產(chǎn)生大量關(guān)于高教在培養(yǎng)人才質(zhì)量方面的評價(jià)數(shù)據(jù),這些數(shù)據(jù)對研究如何提高人才培養(yǎng)質(zhì)量具有重要價(jià)值,所以迫切需要利用文本分析技術(shù)對這些數(shù)據(jù)進(jìn)行有效的抓取及合理的分析,實(shí)現(xiàn)對目標(biāo)數(shù)據(jù)的自動化采集與分析,從而為相關(guān)部門提供人才培養(yǎng)方面的決策支持。因此,本文提出構(gòu)建面向高教人才培養(yǎng)質(zhì)量社會評價(jià)數(shù)據(jù)文本分析方法,對此進(jìn)行了以下研究:(1)針對互聯(lián)網(wǎng)社交媒體網(wǎng)站的結(jié)構(gòu)不同,制定多源數(shù)據(jù)采集方案,設(shè)計(jì)網(wǎng)絡(luò)爬蟲爬取目標(biāo)數(shù)據(jù)。在此基礎(chǔ)上,進(jìn)一步完成對高教人才培養(yǎng)質(zhì)量指標(biāo)體系的構(gòu)建,最終制定出標(biāo)準(zhǔn)數(shù)據(jù)集。(2)針對高等教育人才培養(yǎng)質(zhì)量社會評價(jià)數(shù)據(jù)集進(jìn)行文本情感分析?紤]數(shù)據(jù)來源的網(wǎng)絡(luò)環(huán)境以及數(shù)據(jù)的領(lǐng)域性,在基礎(chǔ)的情感詞典中加入社交網(wǎng)絡(luò)詞典和領(lǐng)域詞典,從而制定一種基于改進(jìn)情感詞典的文本情感強(qiáng)度計(jì)算方法。(3)針對高等教育人才培養(yǎng)質(zhì)量社會評價(jià)數(shù)據(jù)集進(jìn)行文本分類。鑒于文本數(shù)據(jù)的語義特性和上下文關(guān)聯(lián)性,引入循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)來解決上下文語義關(guān)聯(lián)性問題,并融合注意力模...
【文章頁數(shù)】:76 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景與意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 教育數(shù)據(jù)挖掘研究現(xiàn)狀
1.2.2 文本分類研究現(xiàn)狀
1.2.3 文本情感分析研究現(xiàn)狀
1.3 本文研究內(nèi)容
1.4 本文組織結(jié)構(gòu)
第二章 相關(guān)理論與技術(shù)
2.1 教育數(shù)據(jù)挖掘概述
2.2 網(wǎng)絡(luò)爬蟲技術(shù)
2.2.1 技術(shù)概述
2.2.2 工作原理及基礎(chǔ)架構(gòu)
2.3 Word Embedding技術(shù)
2.3.1 詞向量簡介
2.3.2 word2vec模型
2.4 循環(huán)神經(jīng)網(wǎng)絡(luò)模型
2.4.1 神經(jīng)網(wǎng)絡(luò)綜述
2.4.2 循環(huán)神經(jīng)網(wǎng)絡(luò)基本原理
2.5 基于情感詞典的分析方法
2.6 本章小結(jié)
第三章 多源數(shù)據(jù)采集與數(shù)據(jù)處理
3.1 引言
3.2 高教社會評價(jià)數(shù)據(jù)多源采集
3.2.1 百度知道數(shù)據(jù)采集
3.2.2 網(wǎng)頁新聞數(shù)據(jù)采集
3.2.3 360 問答數(shù)據(jù)采集
3.2.4 新浪微博數(shù)據(jù)采集
3.3 高教社會評價(jià)數(shù)據(jù)預(yù)處理
3.4 高教人才培養(yǎng)質(zhì)量社會評價(jià)指標(biāo)體系構(gòu)建
3.4.1 構(gòu)建原則
3.4.2 高教人才培養(yǎng)質(zhì)量社會評價(jià)指標(biāo)詞典構(gòu)建
3.4.3 高教人才培養(yǎng)質(zhì)量社會評價(jià)數(shù)據(jù)集篩選
3.5 本章小結(jié)
第四章 基于改進(jìn)情感詞典的文本情感強(qiáng)度計(jì)算方法研究
4.1 引言
4.2 社交網(wǎng)絡(luò)詞典構(gòu)建
4.3 高教人才培養(yǎng)領(lǐng)域詞典構(gòu)建
4.4 情感強(qiáng)度值計(jì)算方法
4.5 實(shí)驗(yàn)結(jié)果與分析
4.5.1 實(shí)驗(yàn)數(shù)據(jù)與指標(biāo)
4.5.2 實(shí)驗(yàn)結(jié)果對比分析
4.6 本章小結(jié)
第五章 基于雙向循環(huán)注意力神經(jīng)網(wǎng)絡(luò)的文本分類方法研究
5.1 引言
5.2 詞向量模型
5.3 基于雙向循環(huán)注意力神經(jīng)網(wǎng)絡(luò)的文本分類模型
5.3.1 文本表示層
5.3.2 雙向循環(huán)層
5.3.3 注意力分配層
5.4 文本分類器
5.5 實(shí)驗(yàn)結(jié)果與分析
5.5.1 實(shí)驗(yàn)數(shù)據(jù)與指標(biāo)
5.5.2 實(shí)驗(yàn)結(jié)果對比分析
5.6 本章小結(jié)
第六章 原型系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
6.1 引言
6.2 系統(tǒng)分析與設(shè)計(jì)
6.2.1 需求分析
6.2.2 系統(tǒng)設(shè)計(jì)
6.2.3 數(shù)據(jù)庫設(shè)計(jì)
6.3 系統(tǒng)實(shí)現(xiàn)
6.3.1 系統(tǒng)運(yùn)行環(huán)境
6.3.2 數(shù)據(jù)可視化實(shí)現(xiàn)
6.4 本章總結(jié)
第七章 總結(jié)與展望
7.1 工作總結(jié)
7.2 未來展望
參考文獻(xiàn)
攻讀碩士學(xué)位期間研究成果
致謝
【參考文獻(xiàn)】:
期刊論文
[1]基于網(wǎng)絡(luò)爬蟲大數(shù)據(jù)的地方高校人才培養(yǎng)質(zhì)量社會關(guān)注度挖掘[J]. 周世軍,戴玉純,洪旭東. 黑龍江高教研究. 2019(03)
[2]基于神經(jīng)網(wǎng)絡(luò)的文本表示模型新方法[J]. 曾誰飛,張笑燕,杜曉峰,陸天波. 通信學(xué)報(bào). 2017(04)
[3]基于詞向量模型的情感分析[J]. 魏廣順,吳開超. 計(jì)算機(jī)系統(tǒng)應(yīng)用. 2017(03)
[4]改進(jìn)的關(guān)聯(lián)規(guī)則算法在學(xué)生成績預(yù)警中的應(yīng)用[J]. 王華,劉萍. 計(jì)算機(jī)工程與設(shè)計(jì). 2015(03)
[5]從大數(shù)據(jù)挖掘的視角分析學(xué)生評教的有效性[J]. 馬秀麟,衷克定,劉立超. 中國電化教育. 2014(10)
[6]基于統(tǒng)計(jì)的自動化Web新聞?wù)某槿J]. 林子熠,沈備軍. 計(jì)算機(jī)應(yīng)用與軟件. 2010(12)
[7]基于DOM的網(wǎng)頁主題信息的抽取[J]. 劉軍,張凈. 計(jì)算機(jī)應(yīng)用與軟件. 2010(05)
[8]國外高校人才培養(yǎng)質(zhì)量評估的初步研究[J]. 宋丁全,黃洋,王基林. 金陵科技學(xué)院學(xué)報(bào)(社會科學(xué)版). 2006(01)
[9]程度副詞的特點(diǎn)范圍與分類[J]. 藺璜,郭姝慧. 山西大學(xué)學(xué)報(bào)(哲學(xué)社會科學(xué)版). 2003(02)
博士論文
[1]課程評論的情感傾向識別與話題挖掘技術(shù)研究[D]. 劉智.華中師范大學(xué) 2014
[2]高校學(xué)生能力素質(zhì)模型構(gòu)建及其應(yīng)用研究[D]. 鄭媖.武漢大學(xué) 2013
碩士論文
[1]基于深度學(xué)習(xí)的情感詞向量及文本情感分析的研究[D]. 張志華.華東師范大學(xué) 2016
[2]基于語義技術(shù)的中文信息情感分析方法研究[D]. 林斌.哈爾濱工業(yè)大學(xué) 2006
本文編號:3703515
【文章頁數(shù)】:76 頁
【學(xué)位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 緒論
1.1 研究背景與意義
1.2 國內(nèi)外研究現(xiàn)狀
1.2.1 教育數(shù)據(jù)挖掘研究現(xiàn)狀
1.2.2 文本分類研究現(xiàn)狀
1.2.3 文本情感分析研究現(xiàn)狀
1.3 本文研究內(nèi)容
1.4 本文組織結(jié)構(gòu)
第二章 相關(guān)理論與技術(shù)
2.1 教育數(shù)據(jù)挖掘概述
2.2 網(wǎng)絡(luò)爬蟲技術(shù)
2.2.1 技術(shù)概述
2.2.2 工作原理及基礎(chǔ)架構(gòu)
2.3 Word Embedding技術(shù)
2.3.1 詞向量簡介
2.3.2 word2vec模型
2.4 循環(huán)神經(jīng)網(wǎng)絡(luò)模型
2.4.1 神經(jīng)網(wǎng)絡(luò)綜述
2.4.2 循環(huán)神經(jīng)網(wǎng)絡(luò)基本原理
2.5 基于情感詞典的分析方法
2.6 本章小結(jié)
第三章 多源數(shù)據(jù)采集與數(shù)據(jù)處理
3.1 引言
3.2 高教社會評價(jià)數(shù)據(jù)多源采集
3.2.1 百度知道數(shù)據(jù)采集
3.2.2 網(wǎng)頁新聞數(shù)據(jù)采集
3.2.3 360 問答數(shù)據(jù)采集
3.2.4 新浪微博數(shù)據(jù)采集
3.3 高教社會評價(jià)數(shù)據(jù)預(yù)處理
3.4 高教人才培養(yǎng)質(zhì)量社會評價(jià)指標(biāo)體系構(gòu)建
3.4.1 構(gòu)建原則
3.4.2 高教人才培養(yǎng)質(zhì)量社會評價(jià)指標(biāo)詞典構(gòu)建
3.4.3 高教人才培養(yǎng)質(zhì)量社會評價(jià)數(shù)據(jù)集篩選
3.5 本章小結(jié)
第四章 基于改進(jìn)情感詞典的文本情感強(qiáng)度計(jì)算方法研究
4.1 引言
4.2 社交網(wǎng)絡(luò)詞典構(gòu)建
4.3 高教人才培養(yǎng)領(lǐng)域詞典構(gòu)建
4.4 情感強(qiáng)度值計(jì)算方法
4.5 實(shí)驗(yàn)結(jié)果與分析
4.5.1 實(shí)驗(yàn)數(shù)據(jù)與指標(biāo)
4.5.2 實(shí)驗(yàn)結(jié)果對比分析
4.6 本章小結(jié)
第五章 基于雙向循環(huán)注意力神經(jīng)網(wǎng)絡(luò)的文本分類方法研究
5.1 引言
5.2 詞向量模型
5.3 基于雙向循環(huán)注意力神經(jīng)網(wǎng)絡(luò)的文本分類模型
5.3.1 文本表示層
5.3.2 雙向循環(huán)層
5.3.3 注意力分配層
5.4 文本分類器
5.5 實(shí)驗(yàn)結(jié)果與分析
5.5.1 實(shí)驗(yàn)數(shù)據(jù)與指標(biāo)
5.5.2 實(shí)驗(yàn)結(jié)果對比分析
5.6 本章小結(jié)
第六章 原型系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
6.1 引言
6.2 系統(tǒng)分析與設(shè)計(jì)
6.2.1 需求分析
6.2.2 系統(tǒng)設(shè)計(jì)
6.2.3 數(shù)據(jù)庫設(shè)計(jì)
6.3 系統(tǒng)實(shí)現(xiàn)
6.3.1 系統(tǒng)運(yùn)行環(huán)境
6.3.2 數(shù)據(jù)可視化實(shí)現(xiàn)
6.4 本章總結(jié)
第七章 總結(jié)與展望
7.1 工作總結(jié)
7.2 未來展望
參考文獻(xiàn)
攻讀碩士學(xué)位期間研究成果
致謝
【參考文獻(xiàn)】:
期刊論文
[1]基于網(wǎng)絡(luò)爬蟲大數(shù)據(jù)的地方高校人才培養(yǎng)質(zhì)量社會關(guān)注度挖掘[J]. 周世軍,戴玉純,洪旭東. 黑龍江高教研究. 2019(03)
[2]基于神經(jīng)網(wǎng)絡(luò)的文本表示模型新方法[J]. 曾誰飛,張笑燕,杜曉峰,陸天波. 通信學(xué)報(bào). 2017(04)
[3]基于詞向量模型的情感分析[J]. 魏廣順,吳開超. 計(jì)算機(jī)系統(tǒng)應(yīng)用. 2017(03)
[4]改進(jìn)的關(guān)聯(lián)規(guī)則算法在學(xué)生成績預(yù)警中的應(yīng)用[J]. 王華,劉萍. 計(jì)算機(jī)工程與設(shè)計(jì). 2015(03)
[5]從大數(shù)據(jù)挖掘的視角分析學(xué)生評教的有效性[J]. 馬秀麟,衷克定,劉立超. 中國電化教育. 2014(10)
[6]基于統(tǒng)計(jì)的自動化Web新聞?wù)某槿J]. 林子熠,沈備軍. 計(jì)算機(jī)應(yīng)用與軟件. 2010(12)
[7]基于DOM的網(wǎng)頁主題信息的抽取[J]. 劉軍,張凈. 計(jì)算機(jī)應(yīng)用與軟件. 2010(05)
[8]國外高校人才培養(yǎng)質(zhì)量評估的初步研究[J]. 宋丁全,黃洋,王基林. 金陵科技學(xué)院學(xué)報(bào)(社會科學(xué)版). 2006(01)
[9]程度副詞的特點(diǎn)范圍與分類[J]. 藺璜,郭姝慧. 山西大學(xué)學(xué)報(bào)(哲學(xué)社會科學(xué)版). 2003(02)
博士論文
[1]課程評論的情感傾向識別與話題挖掘技術(shù)研究[D]. 劉智.華中師范大學(xué) 2014
[2]高校學(xué)生能力素質(zhì)模型構(gòu)建及其應(yīng)用研究[D]. 鄭媖.武漢大學(xué) 2013
碩士論文
[1]基于深度學(xué)習(xí)的情感詞向量及文本情感分析的研究[D]. 張志華.華東師范大學(xué) 2016
[2]基于語義技術(shù)的中文信息情感分析方法研究[D]. 林斌.哈爾濱工業(yè)大學(xué) 2006
本文編號:3703515
本文鏈接:http://www.sikaile.net/kejilunwen/shengwushengchang/3703515.html
最近更新
教材專著