基于SVN日志的軟件過(guò)程活動(dòng)實(shí)時(shí)挖掘研究
發(fā)布時(shí)間:2020-06-23 18:15
【摘要】:大數(shù)據(jù)技術(shù)面臨的挑戰(zhàn)是如何將數(shù)據(jù)轉(zhuǎn)換為真正的價(jià)值。目前,大數(shù)據(jù)被過(guò)多的關(guān)注數(shù)據(jù)的存儲(chǔ)和處理問(wèn)題而忽視了過(guò)程。過(guò)程挖掘技術(shù)在傳統(tǒng)的基于模型的數(shù)據(jù)分析如仿真技術(shù)和業(yè)務(wù)流程管理技術(shù)等和基于數(shù)據(jù)的分析技術(shù)如機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘等之間搭建了橋梁,它既關(guān)注了過(guò)程,也使用了真實(shí)數(shù)據(jù),它可以用來(lái)主動(dòng)學(xué)習(xí)一些人類真實(shí)進(jìn)行的行為性模型。現(xiàn)有的過(guò)程挖掘技術(shù)不能直接應(yīng)用在軟件過(guò)程挖掘中。為解決軟件過(guò)程挖掘工作中過(guò)程日志缺少活動(dòng)屬性的問(wèn)題,提出了一種動(dòng)態(tài)實(shí)時(shí)的軟件過(guò)程活動(dòng)挖掘方法。該方法立足事件與活動(dòng)的關(guān)聯(lián)關(guān)系,從軟件過(guò)程SVN日志文件中抽取日志事件記錄,并對(duì)事件記錄進(jìn)行結(jié)構(gòu)化處理,再通過(guò)對(duì)向量化的事件信息進(jìn)行聚類來(lái)發(fā)現(xiàn)這些事件包含的語(yǔ)義信息,發(fā)現(xiàn)活動(dòng)標(biāo)簽,并依據(jù)該標(biāo)簽構(gòu)造分類器對(duì)新的數(shù)據(jù)進(jìn)行活動(dòng)映射,將無(wú)監(jiān)督學(xué)習(xí)變?yōu)橛斜O(jiān)督學(xué)習(xí),實(shí)現(xiàn)活動(dòng)屬性的挖掘與映射,最后利用準(zhǔn)確率、召回率以及調(diào)和平均值對(duì)映射結(jié)果進(jìn)行評(píng)價(jià)。實(shí)驗(yàn)使用真實(shí)的軟件過(guò)程日志數(shù)據(jù)集,并對(duì)比之前研究提出方法的結(jié)果,最后表明該方法可以進(jìn)行軟件過(guò)程日志活動(dòng)挖掘且映射類別的平均準(zhǔn)確率、召回率、調(diào)和平均值(參數(shù)分別取0.5、1、1.5)分別達(dá)到0.85、0.87、0.83、0.84、0.85,證明方法的有效性。本文研究中的創(chuàng)新點(diǎn)主要有如下幾點(diǎn):(1)在軟件過(guò)程挖掘中開(kāi)拓了從關(guān)聯(lián)關(guān)系研究過(guò)程挖掘的新思路;(2)解決了軟件過(guò)程日志事件缺乏活動(dòng)信息的問(wèn)題以及對(duì)其活動(dòng)進(jìn)行有效的歸類,同時(shí)保證了整個(gè)活動(dòng)挖掘的動(dòng)態(tài)實(shí)時(shí)性;(3)解決聚類數(shù)確定,增加分類器的評(píng)價(jià)維度使得評(píng)價(jià)結(jié)果更加客觀。
【學(xué)位授予單位】:云南大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2018
【分類號(hào)】:TP311.5;TP181
【圖文】:
傳統(tǒng)事件日志與SVN日志數(shù)據(jù)間結(jié)構(gòu)對(duì)比圖
向量化部分結(jié)果展示圖
本文編號(hào):2727713
【學(xué)位授予單位】:云南大學(xué)
【學(xué)位級(jí)別】:碩士
【學(xué)位授予年份】:2018
【分類號(hào)】:TP311.5;TP181
【圖文】:
傳統(tǒng)事件日志與SVN日志數(shù)據(jù)間結(jié)構(gòu)對(duì)比圖
向量化部分結(jié)果展示圖
【參考文獻(xiàn)】
相關(guān)期刊論文 前5條
1 楊麗琴;康國(guó)勝;郭立鵬;田朝陽(yáng);張亮;張笑楠;高翔;;一種適用于多樣性環(huán)境的業(yè)務(wù)流程挖掘方法[J];軟件學(xué)報(bào);2015年03期
2 王千;王成;馮振元;葉金鳳;;K-means聚類算法研究綜述[J];電子設(shè)計(jì)工程;2012年07期
3 曾慶田;;過(guò)程挖掘的研究現(xiàn)狀與問(wèn)題綜述[J];系統(tǒng)仿真學(xué)報(bào);2007年S1期
4 姜園,張朝陽(yáng),仇佩亮,周東方;用于數(shù)據(jù)挖掘的聚類算法[J];電子與信息學(xué)報(bào);2005年04期
5 楊芙清;軟件工程技術(shù)發(fā)展思索[J];軟件學(xué)報(bào);2005年01期
相關(guān)博士學(xué)位論文 前1條
1 朱銳;數(shù)據(jù)驅(qū)動(dòng)的軟件開(kāi)發(fā)過(guò)程挖掘與分析研究[D];云南大學(xué);2016年
相關(guān)碩士學(xué)位論文 前1條
1 袁艷紅;基于Word2Vec語(yǔ)言模型與圖核設(shè)計(jì)的文本分類研究[D];西南大學(xué);2016年
本文編號(hào):2727713
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/2727713.html
最近更新
教材專著