大學(xué)生學(xué)習(xí)行為分析研究與應(yīng)用
【學(xué)位授予單位】:蘇州大學(xué)
【學(xué)位級別】:碩士
【學(xué)位授予年份】:2018
【分類號】:G434;TP391.1
【圖文】:
圖 3-2 軟件工程專業(yè)詞庫截圖為了適應(yīng)時代的發(fā)展,培養(yǎng)計劃和課程體系結(jié)構(gòu)會不斷地更新,新的專業(yè)名詞也會不斷出現(xiàn),對于這些新名詞需要及時添加到專業(yè)詞庫中,從而不斷完善專業(yè)詞庫。3.2.2 基于語言模型算法的專業(yè)詞庫擴(kuò)展由于培養(yǎng)計劃里的課程名無法涵蓋該專業(yè)的全部內(nèi)容,所以需要對初步建立的專業(yè)詞庫進(jìn)行擴(kuò)展。文獻(xiàn)[60]在基于局部分析的詞擴(kuò)展方法基礎(chǔ)上,設(shè)計和實現(xiàn)了一種基于語言模型的擴(kuò)展詞提取算法,該算法準(zhǔn)確率較高,且操作簡單。所以本文使用語言模型算法來對專業(yè)詞庫進(jìn)行擴(kuò)展。該算法的基本思想為:首先,選取若干相關(guān)文檔,計算出每篇文檔的一元語言模型,即計算出每篇文檔所包含的各個詞項對應(yīng)的概率;然后,將各個文檔的詞項合并,將相同詞項的概率求和作為該詞項在整個文檔集的概率;最后,選取概率最大的前若干詞項作為擴(kuò)展詞。具體處理流程如下:
上網(wǎng)內(nèi)容獲取與處理據(jù)采集大學(xué)生的上網(wǎng)數(shù)據(jù)為研究對象,數(shù)據(jù)來源于常熟理工學(xué)院。從本校大學(xué)生的上網(wǎng)日志數(shù)據(jù)。提取的數(shù)據(jù)格式為 ONLINE_SER_IP,源端口號 SRC_PORT,目的 IP 地址 DST_IP,T,協(xié)議版本 IP_VERSION,操作類型 HTTP_TYPE…),總共數(shù)據(jù)中不包含大學(xué)生學(xué)號信息,本文利用校園信息門戶網(wǎng)站,并與上網(wǎng)日志中 IP 地址一一對應(yīng),將上網(wǎng)數(shù)據(jù)與上網(wǎng)學(xué)上網(wǎng)日志數(shù)據(jù)中抽取出關(guān)鍵字段,創(chuàng)建表 STU_SURF(學(xué)號 IP,訪問網(wǎng)址HTTP_URL,上網(wǎng)時長SECONDS,上線時間RELUX,網(wǎng)站類型 APP)。以學(xué)號為 092217101 的學(xué)生為例,查使用如圖 3-3 中的 SQL 語句。
圖 3-4 部分查詢結(jié)果截圖在獲得大學(xué)生的上網(wǎng)數(shù)據(jù)后,利用表 STU_SURF 中“HTTP_URL”字段便學(xué)生的訪問網(wǎng)址,利用爬蟲技術(shù)爬取網(wǎng)頁文本內(nèi)容,本文使用 Scrapy 爬蟲框.2 爬蟲本文使用 Scrapy 爬蟲框架爬取大學(xué)生訪問內(nèi)容。Scrapy 是利用 Python 語言絡(luò)爬蟲框架,作為爬蟲框架,它使得爬蟲的設(shè)計和工作變得快速簡單,同時的擴(kuò)展性和魯棒性[61]。所以 Scrapy 在爬蟲設(shè)計中使用廣泛,也符合本文所蟲特性,因此本文使用 Scrapy 來完成網(wǎng)頁爬取工作。下圖3-5概括了Scrapy的整體架構(gòu),一共由8個部分組成,主要包括了以下組
【參考文獻(xiàn)】
相關(guān)期刊論文 前10條
1 蔣卓軒;張巖;李曉明;;基于MOOC數(shù)據(jù)的學(xué)習(xí)行為分析與預(yù)測[J];計算機(jī)研究與發(fā)展;2015年03期
2 趙永超;姚曉霞;;高校機(jī)構(gòu)知識庫建設(shè)現(xiàn)狀與未來[J];中國教育網(wǎng)絡(luò);2014年07期
3 舒忠梅;屈瓊斐;;基于教育數(shù)據(jù)挖掘的大學(xué)生學(xué)習(xí)成果分析[J];東北大學(xué)學(xué)報(社會科學(xué)版);2014年03期
4 連陽陽;任淑霞;;一種基于離散粒子群優(yōu)化的貝葉斯分類算法[J];科技信息;2014年04期
5 陳益均;殷莉;;基于數(shù)據(jù)挖掘的學(xué)生成績影響模型的研究[J];現(xiàn)代教育技術(shù);2013年01期
6 孟小峰;慈祥;;大數(shù)據(jù)管理:概念、技術(shù)與挑戰(zhàn)[J];計算機(jī)研究與發(fā)展;2013年01期
7 周圍;;論積極取向道德教育視域中的品德形成機(jī)制[J];教育學(xué)術(shù)月刊;2012年09期
8 張步良;;基于分類概率加權(quán)的樸素貝葉斯分類方法[J];重慶理工大學(xué)學(xué)報(自然科學(xué));2012年07期
9 王家勝;牟肖光;;讀者借閱多維關(guān)聯(lián)規(guī)則挖掘模型的建立與分析[J];計算機(jī)應(yīng)用;2011年11期
10 奉國和;鄭偉;;國內(nèi)中文自動分詞技術(shù)研究綜述[J];圖書情報工作;2011年02期
相關(guān)博士學(xué)位論文 前1條
1 蔣良孝;樸素貝葉斯分類器及其改進(jìn)算法研究[D];中國地質(zhì)大學(xué);2009年
相關(guān)碩士學(xué)位論文 前6條
1 安子建;基于Scrapy框架的網(wǎng)絡(luò)爬蟲實現(xiàn)與數(shù)據(jù)抓取分析[D];吉林大學(xué);2017年
2 楊志忠;基于Hadoop的網(wǎng)絡(luò)用戶行為分析[D];蘭州理工大學(xué);2016年
3 劉敏;面向SPOC數(shù)據(jù)的學(xué)習(xí)行為分析[D];華中師范大學(xué);2015年
4 周念;面向用戶定制的文本過濾技術(shù)研究及其應(yīng)用[D];北京郵電大學(xué);2014年
5 張佳;數(shù)據(jù)挖掘技術(shù)在校園一卡通系統(tǒng)中的應(yīng)用研究[D];蘇州大學(xué);2013年
6 張保華;數(shù)據(jù)挖掘技術(shù)的研究及在圖書借閱系統(tǒng)中的應(yīng)用[D];南京理工大學(xué);2008年
本文編號:2779542
本文鏈接:http://www.sikaile.net/jiaoyulunwen/xueshengguanli/2779542.html