數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用研究
本文關(guān)鍵詞:數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用研究,由筆耕文化傳播整理發(fā)布。
數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用研究 作者:陳建樺
來(lái)源:《硅谷》2014年第01期
摘 要 隨著信息技術(shù)的不斷發(fā)展,日常生活中人們所接觸的信息量越來(lái)越多,如何在眾多信息量中找到自己有用的信息,成為影響人們工作效率和工作質(zhì)量的關(guān)鍵因素,而數(shù)據(jù)挖掘技術(shù)的應(yīng)用則能很好的解決這個(gè)問(wèn)題。本文將通過(guò)介紹數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用,詳細(xì)分析數(shù)據(jù)挖掘技術(shù)的作用和影響。
關(guān)鍵詞 數(shù)據(jù)挖掘;軟件工程;開(kāi)源軟件
中圖分類(lèi)號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1671-7597(2014)01-0073-01
所謂數(shù)據(jù)挖掘是指在大量、無(wú)序、模糊的數(shù)據(jù)中挖掘出其中有用的信息的過(guò)程,它能實(shí)現(xiàn)信息的分類(lèi)、聚類(lèi)并進(jìn)行偏差分析。在這個(gè)信息爆炸的時(shí)代里,人們獲取的信息量是非常驚人的。在軟件工程中,軟件的開(kāi)發(fā)及管理過(guò)程中都會(huì)出現(xiàn)大量信息和數(shù)據(jù),如何更好地在眾多信息中快速找出有用信息成為困擾軟件工程的一大問(wèn)題,因此,對(duì)信息數(shù)據(jù)的挖掘在軟件工程中顯得更為重要。
1 數(shù)據(jù)挖掘的過(guò)程及技術(shù)
一般的數(shù)據(jù)挖掘過(guò)程包括4個(gè)步驟,即對(duì)軟件庫(kù)里的數(shù)據(jù)進(jìn)行選擇、對(duì)被選擇的數(shù)據(jù)進(jìn)行預(yù)處理形成格式化數(shù)據(jù)、再對(duì)格式化的信息進(jìn)行挖掘,最終吸收其中有用的知識(shí)。
在軟件工程中數(shù)據(jù)挖掘的工作一般可以分為3個(gè)層次,即交互式可視數(shù)據(jù)探查、自動(dòng)模式提取及模型建構(gòu),這3個(gè)層面相互關(guān)聯(lián),其中可視數(shù)據(jù)探查為提取模式及模型的建構(gòu)提供基礎(chǔ),,模型的建構(gòu)又為數(shù)據(jù)探查和模式提取提供了指導(dǎo)。
軟件工程中常用的數(shù)據(jù)挖掘技術(shù)主要是通過(guò)分析、聚類(lèi)、預(yù)測(cè)及統(tǒng)計(jì)分析等技術(shù)從眾多資源中找出潛在的、對(duì)人們有用的信息并反饋給軟件系統(tǒng)。
2 數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用
數(shù)據(jù)挖掘技術(shù)被應(yīng)用到軟件工程中已經(jīng)有20多年的歷史,隨著科學(xué)技術(shù)的不斷進(jìn)步,數(shù)據(jù)挖掘技術(shù)的應(yīng)用也越來(lái)越廣泛,如,在銀行、保險(xiǎn)、交通及零售等行業(yè)都在應(yīng)用數(shù)據(jù)挖掘技術(shù)。而在軟件工程中使用數(shù)據(jù)挖掘則可以提高軟件系統(tǒng)的維護(hù)效率并增加系統(tǒng)的穩(wěn)定性和安全性。軟件工程中的程序代碼分析、軟件項(xiàng)目管理、軟件故障檢測(cè)及開(kāi)源軟件開(kāi)發(fā)等方面都應(yīng)用了數(shù)據(jù)挖掘技術(shù)。
2.1 開(kāi)源軟件開(kāi)發(fā)中的數(shù)據(jù)挖掘
本文關(guān)鍵詞:數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用研究,由筆耕文化傳播整理發(fā)布。
本文編號(hào):71357
本文鏈接:http://www.sikaile.net/kejilunwen/ruanjiangongchenglunwen/71357.html